💡

circlizeを使って、レパトアのV-J gene pairingのchord diagram(コードダイアグラム)を書く方法

2024/04/30に公開

chord diagram(コードダイアグラム)とは?

円周上にデータを放射状に配置し、データポイント同士を弧で接続して関係性を示すグラフィカルな方法です。

レパトアの分析では、TCR/BCRのV geneとJ geneのペアの割合を表示するのに使用されます。

今回はRのcirclizeというライブラリを使って、V geneとJ geneのペアのコードダイアグラムを作っていこうと思います。

circlizeのインストール

install.packages('circlize')
library(circlize)

サンプルデータのダウンロード

今回は10x GenomicsのこちらのTCRのデータを使っていこうと思います。

csv <- read.csv('https://cf.10xgenomics.com/samples/cell-vdj/7.1.0/5k_BEAM-T_Human_A0201_B0702_PBMC_5pv2_Multiplex/5k_BEAM-T_Human_A0201_B0702_PBMC_5pv2_Multiplex_vdj_t_all_contig_annotations.csv')

データの加工

circlizeは、以下のようなfrom, to, valueのカラムを持つデータフレームを使用できます。

上記のTCRのデータフレームを加工していきます。

table <- table(csv$v_gene, csv$j_gene)
table<- as.data.frame(table(vdj$v_gene, vdj$j_gene))
names(table) <- c('from', 'to', 'value')

すると、以下のようなデータフレームを作ることができました。

Plot

実際にプロットしていきます。

chordDiagram(table)

Discussion