
TCGAデータを用いた生存時間解析
📰 概要 TCGAデータで本格的な生存時間解析を始めてみませんか? 本書では、がんゲノムの世界的プロジェクト「TCGA(The Cancer Genome Atlas)」に登録されたRNA-Seqデータと臨床情報を活用し、R言語による生存時間解析の手法をステップバイステップで解説しています。 自分のPCとRさえあれば、費用をかけずに本格的なサバイバル解析を体験できます。 💊 生存時間解析の基礎から、実データ応用まで Kaplan-Meier法、ログランク検定、Cox比例ハザードモデルなど、生存時間解析に必要な統計手法の基本を、少数のサンプルでのデモ解析から丁寧に解説。 そのうえで、TCGA乳がん(BRCA)データを使った実践的な解析に進みます。 大量のサンプル・変数に対応したデータ構造の扱い方や、Cox回帰による予後予測モデルの構築、リスクスコアの可視化なども体験できます。 💻 再現可能で柔軟なRベースの解析環境 本書では、curatedTCGADataやsurvival、survminerといったBioconductorパッケージを中心に紹介しており、GUIツールでは得られない柔軟性や再現性を重視しています。 Rコードを使えば、自動処理や複雑な前処理、再解析も簡単に行えるようになります。 🤖 発展的な機械学習モデルにも対応 後半では、Lasso-Cox、ランダム生存フォレスト(RSF)、DeepSurvといった、生存時間解析と機械学習の融合モデルも取り上げ、C-indexなどの指標を使って予測性能の評価と比較も行います。高度な解析にも対応できる内容となっており、これからバイオインフォマティクス分野で機械学習を取り入れたい方にも最適です。 👫 対象とする読者 ・生存時間解析に興味があるが、何から始めればよいかわからない方 ・すでにデータを持っているが、解析は外注している研究者 ・臨床・バイオ系だが、統計やRを本格的に学ぶ時間がない方 ・インフォ系で、予測した遺伝子セットが疾患の予後と関係があるか知りたい方 ・TCGAやGDCなどのデータポータルにアクセスしてみたが、使い方がわからなかった方 ・がんの研究者で、自分のデータとTCGAデータとで解析結果を見比べたい方 ・学術論文の再現・再解析を自分の研究に取り入れたい方 💰 販売価格 期間限定で ¥3000→¥1500 (約50% OFF!!)で販売しております! 本技術書は随時アップデートされていきます。 一度購入された方はアップデートされたとしても追加料金は発生しませんのでご安心ください。 📰 アップデート情報 2025/08/24: リリースしました! 2025/08/27: ソースコードのデバッグと、文章の追記をしました!
まえがき
構成(目次)
📘 第 1 章:生存時間解析を始める準備
📘 第 2 章:GUI ツールを使った生存時間解析
📰 生存時間解析(Survival Analysis)とは?
📰 TCGA
📰 生存時間解析(概要)
📰 GUIツール
📘 第3章:Rを使った生存時間解析
📰 Cox回帰とは
📰 なぜRを使うのか
📰 KM曲線とログランク検定
📰 Cox回帰によるリスクスコアと生存曲線
📘 第4章:Rを使ったTCGAデータ解析
📰 TCGA-BRCA概要
📰 TCGAデータの取得
📰 データの整形と前処理
📘 第5章:TCGAデータを用いた生存時間解析(Cox回帰)
📰 層別化した生存時間解析
📰 単変量Cox回帰
📰 多変量Cox回帰
📰 リスクスコアによる層別化
📰 その他
📘 第6章:TCGAデータを用いた生存時間解析(機械学習 Lasso-Cox)
📰 機械学習とは?
📰 L1正則化付きCoxモデル(Lasso-Cox)
📰 glmnetパッケージによるLasso回帰の実行
📰 選択された遺伝子とベン図の比較(単変量Cox回帰 vs Lasso-Cox)
📰 C-indexによる予測性能評価
📘 第7章:TCGAデータを用いた生存時間解析(機械学習 RSF)
📰 ランダム生存フォレスト(RSF)
📰 比例ハザード性の検定
📰 randomForestSRCパッケージによるRSFの実行
📘 第8章:TCGAデータを用いた生存時間解析(機械学習 DeepSurv)
📰 ディープラーニングを利用したCox回帰
📰 survivalmodelsパッケージによるDeepSurvの実行
📰 比較まとめ:各手法の特徴と適用指針
📘 おわりに
あとがき

研究で使えるプログラミングの情報をブログで発信しています。 プログラミングで研究の質をあげませんか? 初心者でも学べます! Youtube動画でも学べます! youtube.com/@LabCodeTube