🪴

Clustal Omega初心者ログ【#2 実際にアライメントしてみた】

に公開

🚧本記事は学習中の備忘録を兼ねた内容です。
内容に誤りがあれば、ご指摘いただけると幸いです。

"Clustal Omega初心者ログ【#1 インストール】"の続きとなります。

背景・目的

前回インストールしたClustal Omegaを実際に使ってみたいと思います。
今回は、複数種の生物の配列を全長で比較するところまでできたら成功です。

環境・ツール

  • macos big sur 11.7.10
  • Clustal Omega version 1.2.4(Homebrewでインストール)
  • ターミナルで実行
    ※エラーが発生した場合は、主にChatGPTを使って調べながら対応。

手順

1. アライメント用の配列を準備する。

今回は、例題とポジコンを兼ねて、種間保存性の高いとされているCOX1を使用し、シロイヌナズナ(A.thaliana)とクラミドモナス(C.reinhardtii)で配列を比較。

COX1(cytochrome c oxidase subunit 1):細胞のミトコンドリアにある酵素の一部(サブユニット)をコードする遺伝子。(🔗:NCBI)

NCBIでFASTA配列を取得し、テキストエディットに保存。
以下のように同じファイル内に並べて保存:

>NC_037304.1:c116345-114762 Arabidopsis thaliana ecotype Col-0 mitochondrion, complete genome
ATGAAAAATCTGGTTCGA...

>NC_001638.1:5042-6559 Chlamydomonas reinhardtii mitochondrion, complete genome
ATGCGTTGGTTGTATTCT...

🔗A.thaliana:NC_037304.1
🔗C.reihardtii:NC_001638.1

2. アライメントを実行

複数アライメントを実行:

# 入力ファイル:COX1遺伝子の複数配列(Arabidopsis & Chlamydomonas)
# 出力ファイル:Clustal形式で保存
clustalo -i AtCr_COX1.txt -o results.aln --outfmt=clu

-i:入力ファイル指定オプション
-o:出力ファイル指定オプション
--outfmt=clu:出力フォーマットを Clustal形式 に指定(BLASTっぽくて見やすい整列表示)

3. 出力ファイルを確認

results.alnを開く

cat results.aln

cat:concatenate(連結する)の略で、もともとは「複数のファイルをつなげて表示する」コマンドなんだけど、「ファイルの中身をそのままターミナルに表示する」という用途で、今ではよく使われてる! by ChatGPT

results.alnはテキストエディタでも開くことができる。

実際の結果(一部)

CLUSTAL O(1.2.4) multiple sequence alignment


NC_037304.1:c116345-114762      ATGAAAAATCTGGTTCGATGGCTGTTCTCCACAAACCACAAGGATATAGGGACTCTCTAT
NC_001638.1:5042-6559           ------------ATGCGTTGGTTGTATTCTACTTCTCATAAAGATATTGGTTTGTTGTAC


NC_037304.1:c116345-114762      TTCATTTTCGGTGCCATTGCTGGAGTGATGGGCACATGCTTCTCAGTACTGATTCG...
NC_001638.1:5042-6559           TTGGTATTCGCCTTCTTTGGCGGTTTGCTAGGTACTTCTCTAAGTATGTTGATTCG...

アライメント成功!

雑記

  • やりたい比較方法ができてよかった。(嬉しい)
  • いつかはこういった作業をスクリプトで半自動化?させたい。
  • 次は実際に研究対象の配列でアライメントするぞ!ただ、公開できない内容なので記事には載せられない...
  • 系統樹なんかも作ってホモロジー解析に役立てたい。

💬 内容に誤りがあれば、お気軽にコメントでご指摘いただけると嬉しいです。

Discussion