分子系統樹推定法 理論と応用 2009年11月6日 筑波大 院 生命環境 田辺晶史
配付資料 自習用テキスト 解析サンプル配布ページ http://www.fifthdimension.jp/documents/molphytextbook/ 2
参考書籍 分子系統学 3
参考書籍 統計的モデル選択とベイジアンMCMC 4
祖先的な形質 問題 OTU左の の色は表現型形質の状態を表している 赤と青 祖先的な 形質はどちらか? OTU1 OTU8 OTU9 OTU3 OTU2 OTU4 OTU5 OTU6 OTU7 5
祖先的な形質 解答 答えは 不明 確定するにはこれらの外側の分類群が必要 OTU1 OTU8 OTU9 OTU3 OTU2 OTU4 OTU5 OTU6 OTU7 6
化石記録からの分岐年代制約の導出 問題 OTU3,4の共通祖先だがOTU2,3,4の共通祖先ではないと思われ る化石が50万年前の地層から見つかっている OTU2,3,4の共通祖先だがOTU1,2,3,4の共通祖先ではないと思 われる化石が100万年前の地層から見つかっている OTU2とOTU3,4の分岐(a)の年代の範囲は? OTU1 OTU2 a OTU3 OTU4 7
化石記録からの分岐年代制約の導出 解答 答えは 50万年以上 50万年前の地層から見つかった化石は枝5,6,7上の生物の可能性 があるが いずれにしろaより根から遠い枝なのでaがそれ以前であ ると考えられる 100万年前の地層から見つかった化石は枝3,4,5上の生物の可能 性があるが いずれなのか確定できなければaの年代範囲推定には 使えない 2 1 4 3 OTU1 a 5 6 7 OTU2 OTU3 OTU4 8
化石記録からの分岐年代制約の導出 問題2 では aの上限を決定するにはどんな情報が必要か? 2 1 4 3 OTU1 a 5 6 7 OTU2 OTU3 OTU4 9
化石記録からの分岐年代制約の導出 解答 答えは 枝3と特定できる化石の年代 それが得られない場合 それより古いとOTU2,3,4の共通祖先の化 石が出ない年代 や それより古いとOTU1の祖先の化石が出ない 年代 から類推 ただし 当時いたが化石として残っていないか見つけられていないだけ の可能性が常に残るため信頼性が低い 祖先が大量に生息していて化石としても残りやすいことが必要 2 1 4 3 OTU1 a 5 6 7 OTU2 OTU3 OTU4 10
遺伝子浸透 共種分化 不調和の検定 問題 ミトコンドリア 核の両方の配列があるとき 双方のML樹形が異なっ ていた このとき 遺伝子浸透があったかどうかの検定を考える 共種分化関係にある2群間で乗り換えがあったかどうかの検定でも よい (ただし完全に1対1とする) 複数領域が異なる樹形を支持する(不調和)かどうかの検定でもよい つまり2つのデータが支持する系統樹が異なるかどうかの検定 この 検定の帰無仮説と対立仮説は? mitochondrial OTU1 OTU1 OTU2 OTU3 OTU3 OTU2 OTU4 OTU4 nuclear 11
遺伝子浸透 共種分化 不調和の検定 よくある間違い 帰無仮説は それぞれの配列でその配列のML樹形と別の配列の ML樹形の尤度に差が無い 対立仮説は 上記に差がある mitochondrial OTU1 OTU1 OTU2 OTU3 OTU3 OTU2 OTU4 OTU4 nuclear 12
遺伝子浸透 共種分化 不調和の検定 よくある間違い このような状況では先の問題設定でも間違わないが A-ML B-ML A領 域 配 列 に お け る 尤 度 p>0.05の領域 尤度 る け お 列に 配 域 B領 13
遺伝子浸透 共種分化 不調和の検定 よくある間違い もしこうだったら 第1種の過誤が大きくなる A-ML B-ML A領 域 配 列 に お け る 尤 度 p>0.05の領域 配 域 B領 尤度 る け お 列に 連結配列のMLは青と赤の 重複領域にある可能性が 高い どちらの配列でも棄却 できない この状況で不調和となるのは 誤検出だが 先の問題設定 では 帰無仮説が棄却されて しまう 14
遺伝子浸透 共種分化 不調和の検定 解答 帰無仮説は 連結配列で双方に共通の樹形を当てはめたML 対立仮説は 連結配列で双方に異なる樹形を当てはめたML 双方に共通の樹形を当てはめたML は結合配列に最適モデルを 適用して最尤推定すれば得られる 双方に異なる樹形を当てはめたML はそれぞれで最尤推定して得 られた尤度の積(対数尤度の和)である ブートストラップリサンプリングに基づく方法で検定できる mitochondrial OTU1 OTU1 OTU2 OTU3 OTU3 OTU2 OTU4 OTU4 nuclear 15
遺伝子浸透 共種分化 不調和の検定 手順 1. 双方の配列をKakusan3に与 えてモデル選択 1. それぞれの配列をKakusan3 に与えてモデル選択 2. 結合配列に最適モデルを当て はめて最尤系統推定 2. それぞれの配列で最適モデル を当てはめて最尤系統推定 3. Treefinderで座位ごとの尤度 or情報量規準を出力 3. Treefinderで座位ごとの尤度 or情報量規準を出力 4. テキストエディタで結合 5. pgconvswlでconsel形式へ変換 6. CONSELで検定 16
遺伝子浸透 共種分化 不調和の検定 やってみる SampleData内にLikelihood Ratchetによる系統推定までやって あるフォルダ(TestingIncongruence)が用意してあります 公式サイトでは配布されていないCONSELのWindows版も置いて あります Treefinderで座位ごとの尤度or情報量規準を出力するところから やってみます 17
遺伝子浸透 共種分化 不調和の検定 座位ごと尤度出力 ①Treefinderを起動 ②Utilitiesメニューを開く ③Compute Sitewise Likelihoodsを選択 18
遺伝子浸透 共種分化 不調和の検定 座位ごと尤度出力 ①配列ファイルを指定 ②最尤推定結果の Reportファイルを指定 ③出力先を指定 ④出力するものを指定 ⑤ OK で出力 19
遺伝子浸透 共種分化 不調和の検定 異樹形尤度の連結 ①後ろに加える方(COX2)のファイルを開く ②この範囲をコピー 20
遺伝子浸透 共種分化 不調和の検定 異樹形尤度の連結 ①前にする方(COX1)のファイルを開く ③名前を付けて保存 ②カンマで区切ってから貼り付け 21
遺伝子浸透 共種分化 不調和の検定 変換元作成 ①連結したファイルを開く ②この範囲をコピー 22
遺伝子浸透 共種分化 不調和の検定 変換元作成 ①同樹形を当てはめた方のファイルを開く ③名前を付けて保存 ②カンマで区切ってから貼り付け 23
遺伝子浸透 共種分化 不調和の検定 変換元作成 最終的にできるファイルの内容 { { 全領域に同一樹形を当てはめたモデルの座位ごとの尤度 { }, 各領域で異なる樹形を当てはめたモデルの座位ごとの尤度 } 座 位 が 対 応 す る よ う に 注 意 す る } 24
遺伝子浸透 共種分化 不調和の検定 ファイルの変換 ①以下のコマンドを打ってEnter pgconvswl --output=consel 入力ファイル 出力ファイル 25
遺伝子浸透 共種分化 不調和の検定 リサンプリング ①以下のコマンドを打ってEnter makermt CONSEL形式ファイル 拡張子が.rmtのファイルなどが作成される 26
遺伝子浸透 共種分化 不調和の検定 検定の実行 ①以下のコマンドを打ってEnter consel.rmtファイル 拡張子が.pvのファイルなどが作成される 27
遺伝子浸透 共種分化 不調和の検定 結果を見る ①以下のコマンドを打ってEnter catpv.pvファイル 28
遺伝子浸透 共種分化 不調和の検定 結果を見る p値が大きいので帰無仮説(2領域で同一樹形)は棄却できない 29
不調和データと連結解析 不調和なデータを連結して共通の系統樹を仮定して解析していいの か? 不調和はノイズによる ノイズは領域ごとにバラバラのはずだ 連結す ればシグナルが浮かび上がってくるだろう と考えるならOK 現状では そう考えて解析するしかない ためこれが主流 解けないよりは良いが 非現実的な仮定 いわゆるSuper Matrix Method 不調和はパラログによるから パラログは除去すべき という考え方も ある 不調和は それぞれの領域が本当に異なる系統に由来する から そ れぞれの領域の系統樹群から 種の系統樹 を推定すべき という考え 方もある いわゆるSpecies Tree Method 30