📣

生物統計家が参考にしている情報たち

2022/10/21に公開約1,900字

データハンドリング

tidyverse package

いわずもがな。これがないと始まらない。
https://www.tidyverse.org/packages/

tidylog package

tidyverse関数群でデータセットの形を変形したり、くっつけたりするときに行数を確認することは重要です。dim()やstr()で小まめに確認する癖もつけたいですが、自動で行数等の出力するこのpackageはtidyverseと一緒に使いたいです。
https://github.com/elbersb/tidylog

labelled package

データを変形するたびに、str()で構造を確認するのは非常に重要。
変形するたびにstr()を使う。
しかし、str()では情報が見づらい場合がある。
このパッケージのlook_for()を使うと、もっとわかりやすく構造を確認できる。
http://larmarange.github.io/labelled/index.html

arrow package

メモリにのらないようなデータを扱うときに。
癖があるので、arrowの思想を知るのが大事。
https://arrow.apache.org/docs/r/index.html

作図

patchwork package

ggplot2で作った図をくっつける。
https://patchwork.data-imaginist.com/index.html

統計解析

回帰分析

performance package

回帰モデルのチェックに使う。
https://easystats.github.io/performance/

生存時間解析

チュートリアル

Rコード含めて、端的にまとまっている。実務的には十分。
https://www.emilyzabor.com/tutorials/survival_analysis_in_r_tutorial.html

欠測データ解析

書籍のweb版

書籍にもなっている。
https://stefvanbuuren.name/fimd/

visdat package

vis_dat()かvis_miss()で欠測の確認は忘れずに。
https://docs.ropensci.org/visdat/index.html

サンプルサイズ計算

Shinyでポチポチ

中間解析も含めたサンプルサイズ計算できる。
ポチポチ操作もできるし、コードも残せる。
https://www.rpact.com/products

疫学で使う解析方法のまとめ

疫学のためのRハンドブック

https://epirhandbook.com/jp/

結果のまとめ

gtsummary package

表を作る。

その他

私たちのR ベストプラクティスの探求

Rの全体的な使い方を学べるサイト。
SONG Jaehyun 先生と矢内勇生先生が作ってる。
もっとみんなに知って欲しいサイトNo.1。
https://www.jaysong.net/RBook/

causaldata package

解析方法確認したり、教育にちょうどよいデータが欲しい。
因果推論に関する書籍のデータを集めたパッケージ。
https://github.com/NickCH-K/causaldata/tree/main/R

査読対応

査読コメントには、統計手法や考え方を間違っているものがあります。その返答に使える文献集です。
例えば、

  • P値や信頼区間
  • RCTの患者背景で検定しろ
  • 変数選択
  • 事後的に検出力計算しろ

https://discourse.datamethods.org/t/reference-collection-to-push-back-against-common-statistical-myths/1787

SASのプロシジャ

Rではないけど、解析方法やその適用例が同じ粒度でまとまっているため、情報検索に使いやすい。

https://documentation.sas.com/doc/ja/pgmsascdc/9.4_3.4/statug/titlepage.htm

Discussion

ログインするとコメントできます