MEGA5 と Perl を用いた 分子進化解析の基礎 野澤昌文 2012 年 1 月 16 日基礎生物学研究所 ハンズオンセミナー 1
分子進化研究における一般的手法 相同な配列の比較 塩基配列 配列名塩基配列 A A T G G T A C A C B A T G A T A C A C C A T G G T A C A T アミノ酸配列 配列名 アミノ酸配列 A Met Val His B Met Ile His C Met Val His 塩基 / アミノ酸置換に関する膨大な研究データ 分子時計 分子系統樹 中立説 正の自然選択 2
今日の内容 MEGA5 1. 配列の取得 2. 配列のアラインメント 3. 系統樹の作成 4. 分岐年代の推定 5. 進化速度 選択圧の推定 6. 祖先配列の推定 Perl( 時間があれば たぶん無理 ) 1. 配列の一括アラインメント 2. 進化速度 選択圧の一括推定 3
第一部 MEGA5 の基本的な使い方 今日のスライド http://www.geocities.jp/nozabey/nozawa_handson120116.pdf デスクトップにハンズオンというフォルダを作成して そこに保存 4
配列の取得 1 1 2 3 5
配列の取得 1 4 5 alcohol dehydrogenase adh drosophila でサーチ 6
配列の取得 1 6 7 8 CDS をクリックし GenBank を選択 7
配列の取得 1 9 10 11 配列が Alignment Explorer に貼り付けられたはず MEGA explorer を閉じる dmel adh で OK 8
配列の取得 2:BLAST 検索 12 13 Nucleotide collection (nr/nt) を選択 14 9
配列の取得 2:BLAST 検索 15 Drosophila sechellia alcohol dehydrogenase (Dsec Adh), mrna を別窓で開く 10
配列の取得 2:BLAST 検索 16 先ほどと同様にして Alignment Explorer に配列を追加 17 更に Drosophila simulans alcohol dehydrogenase (dsim adh) Drosophila yakuba alcohol dehydrogenase (dyak adh) Drosophila erecta alcohol dehydrogenase (dere adh) Drosophila ananassae alcohol dehydrogenase (dana adh) Drosophila persimilis alcohol dehydrogenase (dper adh) Drosophila pseudoobscura alcohol dehydrogenase (dpse adh) の配列を追加してみましょう 11
配列の取得 2:BLAST 検索 18 8 本の配列が Alignment Explorer に入ったはず 注 :Mac をご使用の方は MEGA browser が上手く作動しない可能性があります その場合は https://box.yahoo.co.jp/guest/viewer?sid=box-l- x2uhocp3b67rak3cmz4evd5xbe-1001&uniqid=56a32e11-7c9b- 4bfb-a428-b9de9bb90cde&viewtype=detail にアクセスし Adh.fas をダウンロードしてください そのファイルを Alignment Explorer で開けば 8 本の Adh 配列が入ったファイルが表示されるはずです 12
配列のアラインメント 19 20 22 21 13
配列のアラインメント 23 24 開始コドンの位置を手動で変更する 14
配列のアラインメント 25 26 Adh.mas で保存する ( 保存先はデスクトップ ハンズオン ) 27 Adh.meg で保存する ( 保存先は先ほどと同じに ) タイトルは Adh で OK 15
配列のアラインメント 28 29 Adh.fas で保存する 30 16
系統樹の作成 31 先ほど保存した Adh.meg を開く 32 近隣結合系統樹を書いてみる 17
系統樹の作成 33 34 18
系統樹の作成 35 近隣結合系統樹ができた! 36 Adh.mts で保存 19
系統樹の編集 : コンデンス系統樹 37 38 39 70% にセットして OK 70% コンデンス系統樹ができた! 20
系統樹の編集 :Legend の自動生成 40 41 Legend が自動的に作成された! 21
分岐年代の推定 44 コンデンス系統樹を解除してオリジナル系統樹を表示 45 Compute linearized tree をクリック 22
分岐年代の推定 46 47 Linearized 系統樹ができた dmel adh と dsim adh の分岐点を右クリックし Divergence Time を選択 dmel-dsim の分岐年代が既知であるとする 23
分岐年代の推定 48 Divergence Time: 5.4 Time Label: mya と入力 * 基準となる分岐年代が必要 49 分岐年代が表示された! 24
進化速度 選択圧の推定 d S : アミノ酸置換を伴わない塩基置換率 d N 自然選択の対象にならない ( 中立進化 ) : アミノ酸置換を伴う塩基置換率 自然選択の対象となる可能性がある d N /d S < 1 d N /d S = 1 d N /d S > 1 負の自然選択 中立進化 正の自然選択 機能遺伝子 偽遺伝子 機能遺伝子 ( 適応 ) 25
進化速度 選択圧の推定 配列 1 配列 2 配列 3 26
進化速度 選択圧の推定 50 51 好きな形式で保存 27
進化速度 選択圧の推定 52 53 非同義置換率を推定する 28
進化速度 選択圧の推定 54 好きな形式で保存 55 例えば XL を押すとエクセルファイルで結果が表示される 29
進化速度 選択圧の推定 56 同様にして同義置換率も推定してみましょう 57 好きな形式で保存 先ほどの非同義置換率と比較する 30
進化速度 選択圧の推定 58 正の自然選択が働いているか統計的にテストする 59 Positive selection, Nei-Gojobori (Jukes-Cantor) を選択し Compute 31
進化速度 選択圧の推定 60 統計量 P-value この遺伝子に正の自然選択は働いていないようである 32
進化速度 選択圧の推定 祖先 d N /d S < 1 d N /d S = < 1 配列 1 配列 2 d N /d S < 1 系統樹ベースで解析すると良い 33
進化速度の推定 : 系統樹ベース 61 62 非同義置換で速度を推定 63 34
進化速度の推定 : 系統樹ベース 64 ドラッグ & ドロップで枝を移動させる 35
進化速度の推定 : 系統樹ベース 65 dana adh dsim adh dsec adh dmel adh dyak adh dere adh dpse adh dper adh 最終的にこの樹形にする 36
66 進化速度の推定 : 系統樹ベース 67 Adh.nwk で保存 37
進化速度の推定 : 系統樹ベース 68 69 70 指定した樹形で系統樹が作成された 38
71 進化速度の推定 : 系統樹ベース 72 39
進化速度の推定 : 系統樹ベース 73 各枝に非同義置換率が表示された 74 75 樹形だけが表示され 見やすくなった 40
進化速度の推定 : 系統樹ベース 76 同様にして同義置換率も推定してみましょう 77 先ほどの d N と比較して比を求め 選択圧を調べる 41
祖先配列の推定 97 69 99 88 dsec adh dsim adh dmel adh dyak adh dere adh dana adh dper adh 100 dpse adh 0.02 祖先配列を推定できれば 配列の進化的変遷や 機能的変遷を知ることができる 42
祖先配列の推定 78 最尤法で祖先配列を推定する 79 Use tree from file を選択し 先ほど保存した Adh.nwk を選択 43
祖先配列の推定 80 1 番目の塩基の祖先塩基が表示された 81 祖先配列の出力 矢印の数字を変えるとその塩基の祖先塩基が表示される 44
祖先配列の推定 82 エクセルファイルで表示してみる 83 祖先配列がエクセルで表示された 45
第二部 Perl を用いた一括分子進化解析の基礎 46
多数の遺伝子 ( ファイル ) を解析したい 例えば 1000 個の遺伝子座 MEGA5 で ちまちまと 解析していたのでは 時間がいくらあっても足りない Perl 等でスクリプトを自作する必要あり 47
Muscle を用いた一括アラインメント 84 http://www.geocities/ 86 nozabey/nuc.zip にアクセスし ファイルをダウンロード 解凍 http://www.geocities/nozabe y/scripts.zip にアクセスし ファイルをダウンロード 解凍 85 nuc フォルダを C ドライブの直下に移動する amino フォルダ amino_aln フォルダ nuc_aln フォルダ nuc_dis フォルダ bat フォルダを C ドライブの直下に作成する 87 解凍した Perl スクリプトを C ドライブの直下に移動する 48
Muscle を用いた一括アラインメント 88 塩基配列をアミノ酸配列に翻訳 translation.plをテキストエディタ ( メモ帳等 ) で開いて確認 89 コマンドプロンプトを起動 90 cd C:/scripts とタイプする 91 perl translation.pl とタイプ 92 必要に応じて変更 amino フォルダ内に 10 個のファイルができる 49
Muscle を用いた一括アラインメント 93 Muscleを用いたアミノ酸配列のアラインメント make_batch_muscle.plをテキストエディタで開いて確認 必要に応じて変更 94 perl make_batch_muscle.pl とタイプ 50
Muscle を用いた一括アラインメント 95 bat フォルダ内に muscle.bat ファイルができる 96 Muscle のフォルダに移動例 )cd C:/Program Files (x86)/muscle 97 muscle.bat とタイプする ( 数分待つ ) 98 amino_aln フォルダに 10 個のアラインメントファイルができる 51
Muscle を用いた一括アラインメント 99 アミノ酸配列のアラインメントを塩基配列に反映させる make_batch_aln_dna_aa.plをテキストエディタで開いて確認 必要に応じて変更 100 101 102 cd C:/scripts とタイプする perl make_batch_aln_dna_aa.pl とタイプ bat フォルダ内に aln_dna_aa.bat ファイルができる 52
Muscle を用いた一括アラインメント 103 aln_dna_aa.bat を C:/scripts に移動 104 aln_dna_aa.bat とタイプする 105 nuc_aln フォルダに 10 個のアラインメントファイルができる 53
Perl を用いた一括進化速度推定 106 make_batch_ds_dn.pl をテキストエディタで開いて確認 必要に応じて変更 107 108 perl make_batch_ds_dn.pl とタイプ bat フォルダ内に ds_dn.bat ファイルができる 54
Perl を用いた一括進化速度推定 109 ds_dn.bat を C:/scripts に移動 110 ds_dn.bat とタイプする ( 数分待つ ) 111 nuc_dis フォルダに 10 個のファイルができるはず 112 1.out をテキストエディタで開いてみる 55
Perl を用いた一括進化速度推定 113 start: 各ウィンドウの最初のコドンの番号 end: 各ウィンドウの最後のコドンの番号 S: 同義座位の数 N: 非同義座位の数 s: 同義置換の数 n: 非同義置換の数 ps: 同義置換率 (s/s) pn: 非同義置換率 (n/n) ds:jc 法による補正後の同義置換率 dn:jc 法による補正後の非同義置換率 pn/ps もしくは dn/ds を計算することで各遺伝子ペアにかかる選択圧を推定できる 56
詳細は 今日のスライド http://www.geocities.jp/nozabey/nozawa_handson120116.pdf 私のウェブサイト http://www.geocities.jp/nozabey/programs.html MEGA チュートリアル ( 開発者田村博士作成 ) http://evolgen.biol.se.tmu.ac.jp/mega/ 57