
WindowsでRNAseq解析 -fastqファイルから発現量算出まで-
Windows PCで構築したWSL (windows system for linux)の環境でfastqファイルから遺伝子発現量算出までを行う過程を紹介する。 RNAseqのパイプラインは様々あるが、昨今よく使用されているパイプラインである `STARでのmapping -> RSEMでの発現量算出` を使用する。この方法はPCメモリの消費量が多いので、そこら辺のノートパソコンレベルだと完遂しないかもしれない。 具体的な流れとして、以下を解説する。 1. fastqファイルのクオリティチェック 2. fastqファイルのクオリティコントロル 3. 参照ゲノム配列へのマッピング 4. 遺伝子発現量の算出 さらに上記を複数サンプルに対して処理するコマンドや、shellスクリプトとして実行する例を紹介する。 なおこの手の解析は営利目的での利用もされているため実運用に大事な箇所は有料公開とさせていただきますが、アカデミアの方は個別に相談頂ければと思います。
Chapters
はじめに
Toolのインストール
fastqc ~ fastqファイルのクオリティ確認 ~
fastp ~ fastqファイルのquality control ~
STAR ~ 参照ゲノム配列へのマッピング ~
RSEM ~ 発現量算出 ~
ゲノムブラウザでマッピング結果の可視化
複数サンプルの繰り返し処理1
複数サンプルの繰り返し処理2
発現量算出ファイルの集計
Rで遺伝子のアノテーション情報を付与
シェルスクリプト化
Author
Topics
- 公開
- NEW
- 本文更新
- NEW
- 文章量
- 約63,256字
- 価格
- 500円