BRIGで環状ゲノムの比較結果を可視化(display circular genome comparisons using BRIG)
はじめに
環状ゲノムの比較結果を可視化してみます。
BRIG(BLAST Ring Image Generator)を使用する例です。
動作確認 (Hardware)
-MacBook Pro
-チップ Apple M1 (Rosetta2 インストール済み)
-macOS Sonoma 14.7.5
-メモリ 16GB
動作確認 (Software)
-BRIG 0.95
-blast 2.16.0
-Java(OpenJDK) 17.0.15
手順
1.データの用意
Nature Scientific Reportsに掲載の、こちらの文献を例にとります。
Comparative genomic analysis of Colistin resistant Escherichia coli isolated from pigs, a human and wastewater on colistin withdrawn pig farm | Scientific Reports
こちらの文献のFigure 2 (b)に相当する図を描いてみます。
1-1. Fastaファイルの入手
NCBIより4つのプラスミドのfastaファイルをダウンロードしました。
1-2. Genbank形式ファイルの入手
元の文献の図では、pCPA1200-IncI2のアノテーション結果を使用しているので、pCPA1200については baktaをローカル環境で動かしてアノテーションを付与しました。
baktaを使用すると拡張子が「.gbff」のGenbank形式のファイルが得られました。
描図に使うファイル(今回はfastaファイル4つおよびGenbank形式ファイル1つ)をひとつのフォルダにまとめて置いておきます。
フォルダの名前を「BRIG_test」としました。
2.プログラムの準備
2-1. BRIGのダウンロード
BRIGのサイトからzipファイルをダウンロードして解凍します。
GitHub
解凍してできたフォルダ内の「BRIG.jar」をダブルクリックすると起動します。
CLIからコマンドで起動することもできます。
cd path_to/BRIG-0.95-dist
java -Xmx1500M -jar BRIG.jar #使用できる最大ヒープメモリサイズを1500Mに指定して起動
2-2. blastのインストール
blastが入っていない場合はインストールしておきます。
conda
(mamba
)を使用する場合の例↓
mamba install bioconda::blast
または、NCBIのサイトからダウンロードして binaryファイルのあるフォルダを指定して使う方法もあります。
BLAST+ executables — BLASTHelp documentation
BRIGのフォルダに同梱されているマニュアルにはこちらの方法が載っています。
2-3. Javaのバージョン確認
java -version
記事作成時点での自分の動作環境では↓
Javaのバージョン(と、OSのバージョンとの組み合わせ)によってはエラーメッセージが出たり、うまく描図できないこともあるようです。
3.Select input data画面での設定
3-1.BRIG optionsの設定変更
BRIGを起動するとSelect input data画面が開きます。
メニューの「Preferences」から「BRIG options」を選択するとオプションのウインドウが開きます。
設定を追加します。
- 「Genbank file extensions」に「gbff」を追加
- BLASTのbinary folderを選択
「BLAST binary folder」の横の「Browse」をクリックして、インストールしているblastの実行ファイルの含まれているフォルダ(binフォルダ)を選択します。
設定後、画面右上の「Save & close」をクリックしてBRIG optionsの画面を閉じます。
3-2.Reference配列の設定
元の文献の図では、pCPA1200(ゲノムサイズ 60,727bp)を参照配列に使用しているようですので(図で「xxxxx bp」と表示されている配列長を持つ株が参照配列に指定されていると考えて)この株のfastaファイルを選択します(配列情報のあるGenbank形式のファイルを選択することもできます)。
3-3.Query配列の設定・登録
「Query sequences folder」に、描図に使うファイル(今回はfastaファイル4つおよびGenbank形式ファイル1つ)をまとめて置いているフォルダを指定します。
フォルダを指定したら「Add to data pool」をクリックします。
「BRIG options」で「Genbank file extensions」「Fasta file extensions」および「EMBL file extensions」に登録されている拡張子を持つファイルが、data poolの欄に追加されます。
3-4.Output folderの設定
出力先のフォルダを指定します。
描図に使うファイルを置いているフォルダと同じ場所に設定しました。
「BLAST options」は今回は空欄のままで「Next >」をクリックします。
4.Customize rings画面での設定
4-1.必要な数のリングを追加
「Insert new ring」をクリックして、描図に必要な数のリングを用意します。
クリック1回ごとにリングが1つ追加されます。
今回の例では配列を比較する4株と、アノテーションのデータの表示に使うリングの、計5つを用意します。
番号が小さい順に内側→外側のリングになります。
4-2.各リングの設定
Ringの番号 〜 凡例の表示(Legend text)〜 比較する配列データ の設定・紐付けを行なっていきます。
「Insert new ring」の下の枠内の「Ring 1」をクリックします。
「Legend text」の欄が、クリックしたRingの番号の表示「1: null」に変わります。
「Legend text」の内容を、「null」から図の凡例に表示するテキストに変更します。
Ring 1で描図する株(プラスミド)の名前の「pCPA1200」に変更しました。
Data poolの枠内で、Ring 1で描図する配列データのファイルをクリックして選択します(青地に反転)。
「Data shown on this ring」の横の「Add data」をクリックして、下の枠内に選択したファイルを追加します。
Ring colourを任意のものに変更します。
画面の赤色の部分をクリックすると色の選択画面が開くので
色を選択して
「OK」をクリックして、Customize rings画面に戻ります。
相同性のthresholdの設定は、デフォルトのまま進めます。
- 「Upper identity threshold(%)」は「70」
- 「Lower identity threshold(%)」は「50」
同様の手順で、Ring 2〜Ring 4に、配列を比較する株をそれぞれ設定しました。
- Ring 2:pCPWW7
- Ring 3:pHNSHP45
- Ring 4:pmcr-1
5.Add Custom Features画面での設定
アノテーション情報の表示の設定をするため、「Add Custom Features」 をクリックしてAdd Custom Features 画面を開きます。
「List of exiting rings」の欄から、アノテーションの表示に使うリングをダブルクリックして選択します(今回の例では、いちばん外側のRing 5)。
「Editing custom features for」の欄が、選択したリングに変わったのを確認します。
「Input Data」のメニューで、アノテーションの情報を持つファイルの種類を選択します。
今回はGenbank形式のファイルを使用するので「Genbank」を選択しました。
画面の「File location」が「Genbank file location」に変わります。
「Browse」をクリックして、アノテーション情報の記載されているGenbank形式のファイルを指定します。
「Feature name」の欄に、図で表示させるfeatureを入力します。
今回はCDS featureの情報を表示します。
画面下の「Add」をクリックして、指定したGenbank形式のファイルからCDS featureの情報を取り込みます。
同時に「Colour」が「Red」、「Draw feature as」が「clockwise-arrow」に変更されました。
今回はこの設定のままで進めます。
画面右下の「Close」をクリックしてAdd Custom Features 画面を閉じて、Customize rings 画面に戻ったら「Next >」をクリックしてComfirmation 画面に移動します。
6.Confirmation画面での設定 〜 画像の出力
Confirmation 画面で、以下の3つを設定します。
-
Image Title
出力される画像の中央に表示されるタイトルを設定します。
今回の例では「IncI2」としました。 -
Output format
jpg、png、svg、svgzから選択します。
今回の例では png を選択しました。 -
Output file
デフォルトではReferenceに指定したファイル名が入力されています。
このまま設定を変更しない場合は「Referenceに指定したファイル名.画像ファイルの拡張子」のファイルが出力されます。
今回は「test」に変更しました(よって、「test.png」が出力されます)。
画面下の「Submit」をクリックすると描図を開始します。
Consoleにログが表示されて、エラーがなければ「Output file」で指定したフォルダに画像ファイルが作成されます。
test.png
7.設定を変更して描きなおす
Comfirmation 画面の「< Prev」をクリックして「Customize rings」画面に戻って設定を変更します。
相同性のthresholdの設定を変更してみます。
- 「Upper identity threshold」を「70 → 90」
- 「Lower identity threshold」を「50 → 70」
各リングで設定の変更を終えたら「Next >」をクリックしてComfirmation 画面に移動して、Image Title、Output format、Output fileを設定して、再度画像ファイルを作成します。
凡例の「identity」の値が変更された図が出力されました。
画像の「Height」「Width」のデフォルト値は各2000(ピクセル)ですが、
リングと凡例がかぶるようなときは、「Customize rings」画面で「Preference」メニュー →「Image Options」で開いたウインドウから「Height」「Width」の値を変更します。
- 「2000 → 1800」に変更してみました。
- 「2000 → 2400」に変更してみました。
描図するリングの数・アノテーション情報のテキストの領域に応じて適宜変更する必要がありそうです。
今回の例では、2200ピクセルくらいがちょうどいいかもしれません。
おわりに
元の文献の図と比較すると、使用したアノテーションのプログラムやデータベースの違いなどによる部分はありますが、概ね近い図を描くことができたのではないかと思います。
他にもオプションがたくさんあるのでほんの一例ですが、BRIGの使い方の参考になりましたら幸いです。
Discussion