トピック 2014 年 5 月井上潤 I. 実データを用いた研究従来の分岐年代推定ベイズ分岐年代推定 II. MCMCTREE の理論的背景と実習理論的背景実習 23
ベイズ年代推定プログラム MCMCTREE の特徴 コマンドラインで操作. (Windows: コマンドプロンプト ; Mac: ターミナル ). 樹形は固定. 化石記録は事前に調査. 二段階の解析からなる. (1: 樹長の分散共分散行列推定, 2: ベイズ解析 ). 塩基, アミノ酸配列の両方で解析が可能 ( 塩基で開発 ). ゲノムレベルの巨大データにも対応. 配列データにある程度の変異が必要. 24
統計的データ解析における二つの考え方 古典的あるいは頻度主義者 (classical or frequentist) 確率 : 真のあるいは仮想的な母集団から繰り返し抽出する中で, その事象が生起する期待頻度. パラメータ : 未知の定数であり分布をもたない. ベイズ主義者 (Bayesian) 確率 : 母集団からのランダムな抽出における頻度とは解釈されず, パラメータの不確実性を表す. パラメータ : 確率分布する.-> 事前分布, 事後分布 25 Yang (2006) P 138.
事前分布と事後分布とは ( 例 : MCMCTREE の年代制約 ) パラメータがどのような値をとるか という 見込みの大きさ を確率分布として表したもの.http://tombo.sub.jp/doc/esj55/bayes_intro.pdf 事前分布 (Prior) 解析前に設定した一様分布 ヒト 配列を用いない解析で得られた分布 ゼブライトヨ フグ 事後分布 (Posterior) 配列を用いた解析で得られた分布 26 5.0 4.0 3.0 2.0 1.0 0.0 (Ma) ベイズ推定では 事後分布の形を推定するのが目的.
MCMC アルゴリズムによるベイズ法の変革 事後確率の計算に高次元の積分が要求されるため, 近年までベイズ法は用いられなかった 1990 年代に入り,Markov chain Monte Carlo (MCMC) アルゴリズムの導入とコンピュータの発達により解決. これによって, 最尤法では取り扱うことの出来ない複雑でパラメータの多いモデルを扱うことが可能になった. パタメータの多い年代推定の解析に適している. 27 Yang (2006)
分岐年代の事後分布を推定する式 f (t, r, θ X) パラメータの事後分布 = 尤度 X: 配列データ. t: 分岐年代の集合. r: 速度の集合. 事前分布 f (X t, r, θ) f (r t, θ) f (t θ) f (θ) f (X) データの周辺確率 : 事後分布の全積分が 1 になるための 定数. t, r, θ についての高次元積分から得られる. 直接計算は困難. θ : 置換モデル中のパラメータや, t や r に関する事前分布のパラメータの集合. 分母の計算は困難 => 何百万回の MCMC サンプリングを行い, 同時事後分布 ( 左辺 ) から標本を生成 ( 次のページ ). 28 Yang (2006) P235
MCMC アルゴリズムによる計算の高速化 f (t, r, θ X) パラメータの事後確率 = 尤度 f (X t, r, θ) f (r t, θ) f (t θ) f (θ) f (X) データの周辺確率 事前分布 29 MCMC アルゴリズム R = 採択比 : 新しい状態を採択するか否か決める min 1, 新しい状態 f (X t*, r*) f (r* t*, θ*) f (t* θ*) f (θ*) f (X t, r) f (r t, θ) f (t θ) f (θ) 現在の状態 分母の計算は行わず, 繰り返し計算ごとに得られた分子の値だけを比較して事後確率の増減を見る. 分子だけを比較 q (θ, t, r θ*, t*, r*) q (θ*, t*, r* θ, t, r) 提案比 : 新しい状態の提案に偏りがあってもこれで修正. Yang (2006) P155
MCMCTREE の近似尤度計算 (Approximate Likelihood Calculation) f (t, r, θ X) パラメータの事後確率 = 尤度 => 近似尤度計算事前分布 f (X t, r, θ) f (r t, θ) f (t θ) f (θ) f (X) データの周辺確率 MCMCTREE は多変量正規分布を用いた近似尤度計算によって尤度推定をスピード化. 30 このため MCMCTREE の解析は, 1. 最尤推定値における尤度関数の勾配ベクトルと分散共分散行列の推定 2. 多変量正規分布を用いた MCMC アルゴリズムの実行という 2 段階からなる. Thorne et al. (1998) Yang (2006) PAML マニュアル
化石制約の選び方 条件 : 化石の系統的位置がわかっている. 地層 1 地層 2 地層 3 地層 4 現在 分岐 A の上限 : 化石なし A 分岐 B の上限 : 姉妹群最古の化石 Clade c Clade b 年代推定に使える化石 その他の化石 B C 分岐 C の上限 : ステム最古の化石 Clade a Modified from Benton and Donoghue (2007) 分岐 A の下限 分岐 B の下限 分岐 C の下限 31 - 下限制約の設定は難しくない. - 上限制約の設定には, より詳細な取り決めが必要.
33.7 分子年代推定用の化石記録 Sponge Anemone Hydra Nematode Daphnia Louse Aphid Rhodnius Benton et al. (2009) Beetle 199.0 283.7 520.5 Mosquito 307.2 510 520.5 Benton, M. J., P. C. J. Donoghue, and R. J. Asher. 2009. Calibrating and constraining molecular clocks. Pages 35-86 in Timetree of Life (S. B. Hedges, and S. Kumar, eds.). Oxford University Press. Fruit Fly 238.5 634.97 307.2 Wasp 152 238.5 531.5 Honey bee 470.2 Limpet 518.5 Sea Hare 168.6 305.5 Biomphalaria Capitella Leech Sea Urchin Amphioxus Tunicates Vertebrates 脊椎動物根幹の制約は化石記録が整備されつつある. 他は依然 Fossil Records II (Benton 1993) に頼らざるを得ない. Lizard Zebra Fish Zebrafinch Chicken Crocodile Toad Emu Medaka Stickleback Tetraodon Opossum Platypus Takifugo Elephant Shark Lamprey Kangaroo 66 32.25 66 96.9 149.85 96.9 Tenrec 61.5 Elephant 239 Armadillo 48.4 Invertebrates 225.9 Cow 55.6 162.9 312.3 330.4 Sheep 18 421.75 124 Dolphin 52.4 416.0 52.4 460.6 Pig 62.5 Horse 62.5 62.5 62.5 Cat Dog 39.68 62.5 Bat 61.5 Shrew 61.5 Hedgehog 33.7 61.5 Rabbit 55.6 0.2 61.5 Pika 52.5 61.5 55.6 33.7 23.5 11.2 11.2 6.5 Human Squirrel Guinea Pig 10.4 Rat Mouse Tree Shrew Bushbaby Macaque Orangutan Chimp Neanderthal Lemur Marmoset Gibbon 32 http://www.fossilrecord.net/fossilrecord/index.html
トピック I. 実データを用いた研究従来の分岐年代推定ベイズ分岐年代推定 II. MCMCTREE の理論的背景と実習理論的背景実習 33
関連ファイルのダウンロード mcmctree 簡単な例題 で Google 検索 34 デスクトップに例題とスライドをダウンロード
解析プログラムの準備 エディタ Win:? Mac: TextWrangler etc. 系統樹の図示 FigTree 分岐年代推定 MCMCTREE (PAML で検索 : paml4.x.tgz) Mac: terminal に入る. cd into paml4.x/src 以下をタイプ. make -f Makefile プログラムをコピー. baseml mcmctree Win: 次のスライド (2 枚 ) を参照. => make がない場合は, Xcode をインストール. => mcmctreeexamplevert6/examples ディレクトリにコピー. 35
ディレクトリ設定 -1 (Windows).tar 解凍プログラムのインストール 1. 解凍プログラム Lhaplus ( フリー ) を Google 検索して, ダウンロード & インストール. 2. ダウンロードした mcmctreeexamplevert6.tar を,Lhaplus エイリアス ( デスクトップ ) にドラッグ & ドロップ. 得られたファイルにまだ.tar が着いていたら, この.tar ファイルを再度 Lhaplus にドラッグ & ドロップ. 拡張子の表示以下のチェックを外す整理 > フォルダと検索のオプション > 表示 > 登録されている拡張子は表示しない ファイルのアクセス権を変更 mcmctreeexamplevert6/examples ディレクトリを右クリックし以下のチェックを外す. プロパティ > 読み取り専用 36
ディレクトリ設定 -2 (Windows) 試しに変更エディタで開く試しにエディタで開く.baseml.ctl を右クリックして以下を選択. SAKURA ( など ) で開く コマンドプロント : ディレクトリの移動 mcmctreeexamplevert6/examples ディレクトリに入る. コマンドプロンプト ( プログラム > アクセサリ > コマンドプロンプト ) に以下のコマンドを入力. cd Desktop cd mcmctreeexamplevert6/examples dir 37 baseml を走らせる 1. pamlx.x/bin/ にある以下のプログラムを mcmctreeexamplevert6/examples にコピー baseml.exe, mcmctree.exe 2. コマンドプロンプトに以下のコマンドを入力. baseml
MCMCTREE 解析の全体像 1. 勾配ベクトルと分散共分散行列の推定 Vertebrate6.phy 塩基配列データ MCMCTREE mcmctree.ctl Vertebrate6.tre 種の系統樹 BASEML out.bv 樹長の勾配と分散共分散行列 2. MCMC アルゴリズムの実行 MCMCTREE Vertebrate6.phy 塩基配列データ ( 実際は使われない ) mcmctree.ctl Vertebrate6.tre 種の系統樹 in.bv (out.bv) 勾配ベクトル分散共分散行列 38 out_usedata2 分岐ごとの進化速度と分岐年代
MCMCTREE を用いた分岐年代推定 ( 近似尤度計算 ) 0. 準備 => 進化速度の事前確率を推定 1. 勾配ベクトルと分散共分散行列の推定 (usedata=3) 2. MCMC アルゴリズムの実行 (usedata=2) 39
0: mcmctree.ctl ファイル 進化速度 ( 遺伝子 [partition] 全体 ) の事前確率 seed = -1 seqfile = Vertebrate6.phy treefile = Vertebrate6.tre outfile = out_usedata3 ndata = 1 usedata = 3 * 0: no data; 1:seq like; 2:normal a clock = 2 * 1: global clock; 2: independent ra RootAge = '<10' * constraint on root age, used if no model = 7 * 0:JC69, 1:K80, 2:F81, 3:F84, 4:HKY85 alpha = 0.5 * alpha for gamma rates at sites ncatg = 5 * No. categories in discrete gamma cleandata = 0 * remove sites with ambiguity data (1: BDparas = 1 1 0 kappa_gamma = 6 2 alpha_gamma = 1 1 * birth, death, sampling * gamma prior for kappa * gamma prior for alpha rgene_gamma = 1 12.5 * gamma prior for rate for genes sigma2_gamma = 1 4.5 * gamma prior for sigma^2 (for finetune = 0: 0.06 0.5 0.008 0.12 0.4 * times, rat * finetune = 0.06 0.5 0.006 0.12 0.4 * times, rates print = 1 burnin = 50000 sampfreq = 50 nsample = 10000 *** Note: Make your window wider (100 columns) when running 40
0: 進化速度 ( 全体 ) の事前分布 (rgene_gamma) を計算 Vertebrate6.phy 塩基配列データ Vertebrate6PE.tre 1 較正点付き系統樹 baseml.ctl BASEML パラメータ推定 mlb 進化速度 BASEML を用いて, 全体の進化速度を概算. 41
0: baseml.ctl ファイル 配列ファイル アウトファイル tree ファイル 進化モデル ( ここでは GTR) seqfile = Vertebrate6.phy * sequence data file name outfile = mlb * main result file treefile = Vertebrate6PE.tre * tree structure file n noisy = 3 * 0,1,2,3: how much rubbish on the scr verbose = 1 * 1: detailed output, 0: concise outpu runmode = 0 * 0: user tree; 1: semi-automatic; 2 * 3: StepwiseAddition; (4,5):Perturbat model = 7 Mgene = 0 fix_kappa = 0 kappa = 2 * 0:JC69, 1:K80, 2:F81, 3:F84, 4:HKY85 * 0:rates, 1:separate; 2:diff pi, 3:di * initial or given kappa fix_alpha = 0 alpha = 0.5 * initial or given alpha, 0:infinity Malpha = 0 * 1: different alpha's for genes, 0: o ncatg = 5 * # of categories in the dg, AdG, or n 42 分子時計の一定性を仮定したモデルを選択 fix_rho = 1 rho = 0. * initial or given rho, 0:no correla npark = 0 * rate-class models. 1:rK, 2:rK&fK, 3: * clock = 1 * 0: no clock, unrooted tree, 1: clock nhomo = 1 * 0 & 1: homogeneous, 2: kappa's, 3: N getse = 1 * 0: don't want them, 1: want S.E.s of RateAncestor = 0 cleandata = 0 * (1/0): rates (alpha>0) or ancestral remove sites with ambiguity data (1:y
0: シーケンスファイル Vertebrate6.phy 配列データ 6 1146 Carp ---ATGGCA---AGCCTACGAAAAACACACCCTCTCATTAAAATCGCTAACGACGCACTAGTTGA Fugu ---ATGGCC---AGCCTACGCAAAACCCACCCCCTACTAAAAATCGTAAACGACATAGTAATTGA Frog ---ATGGCACCCAACATCCGTAAATCTCATCCATTAATTAAAATTATTAATAATTCTTTCATTGA Human ------ATGACCCCAATACGCAAAACTAACCCCCTAATAAAATTAATTAACCACTCATTCATCGA Shark ---ATGGCCACAAACATCCGAAAAACTCACCCTCTACTAAAAATTGTAAATCATGCCCTAATTGA Stingray ATGACTACTACAAACACCCGCAAAACCCATCCCCTATTCAAAATTATCAATAACTCCGTAATTGA Phylip 形式 43
0: tree ファイル Vertebrate6PE.tre 1 較正点付き系統樹 6 1 (((Carp,Fugu),(Frog,Human)),(Shark,Stingray))'@4.5'; Newick format FigTree で開く Carp Fugu Frog @4.5 Human @4.5 Shark Stingray @4.5 : おおよその分岐年代.Benton et al. (2009) など化石論文を参照. 注意 :4.5 は 450 Mya を意味する.MCMCTREE は 1-10 の値を用いた計算に適している. 44 全体の進化速度をラフに推定. =>MCMC アルゴリズムの事前確率に用いる.
0: baseml を走らせる コマンドプロンプト ( あるいはターミナルから ) baseml と入力してリターンを押す. [JunInoue:12tr]$ baseml BASEML in paml version 4.4d, March 2011 ns = 6 ls = 1146 Reading sequences, sequential format.. Reading seq # 1: Carp... 29 h-m-p 1.6000 8.0000 0.0000 C 5551.140599 0 1.4859 734 0/14 30 h-m-p 1.6000 8.0000 0.0000 --------------C 5551.140599 0 0.0000 779 Out... lnl = -5551.140599 Calculating SE's Time used: 0:00 [JunInoue:12tr]$ 45 アウトファイル (mlb という名前になっている ). Substitution rate is per time unit 0.084825 +- 0.008316
1: MCMCTREE を用いた分岐年代推定 ( 近似尤度計算 ) 0. 準備 1. 勾配ベクトルと分散共分散行列の推定 (usedata=3) 2. MCMC アルゴリズムの実行 (usedata=2) 46
1. 勾配ベクトルと分散共分散行列の推定 Vertebrate6.phy 塩基配列データ Vertebrate6.tre 制約付き系統樹 MCMCTREE mcmctree.ctl BASEML out_usedata2 out.bv 枝長の勾配と分散共分散行列 枝長の最尤推定値 (maximum likelihood estimates; MLEs) を計算し, 枝長の勾配と分散共分散行列を求める. 47
1: mcmctree.ctl ファイル - usedata3 配列ファイル tree ファイル アウトファイル 勾配, 分散共分散推定モードを指定 進化モデル ( ここでは GTR) seed = -1 seqfile = Vertebrate6.phy treefile = Vertebrate6.tre outfile = out_usedata3 ndata = 1 usedata = 3 * 0: no data; 1:seq like; 2:normal a clock = 2 * 1: global clock; 2: independent ra RootAge = '<10' * constraint on root age, used if no model = 7 * 0:JC69, 1:K80, 2:F81, 3:F84, 4:HKY85 alpha = 0.5 * alpha for gamma rates at sites ncatg = 5 * No. categories in discrete gamma cleandata = 0 * remove sites with ambiguity data (1: BDparas = 1 1 0 kappa_gamma = 6 2 alpha_gamma = 1 1 * birth, death, sampling * gamma prior for kappa * gamma prior for alpha rgene_gamma = 1 12.5 * gamma prior for rate for genes sigma2_gamma = 1 4.5 * gamma prior for sigma^2 (for finetune = 0: 0.06 0.5 0.008 0.12 0.4 * times, rat * finetune = 0.06 0.5 0.006 0.12 0.4 * times, rates print = 1 burnin = 50000 sampfreq = 50 nsample = 10000 *** Note: Make your window wider (100 columns) when running 48
1: tree ファイル Vertebrate6.tre 制約付き系統樹 6 1 Newick 形式 (((Carp,Fugu)'L(1.5,0.1,1.0,1e-300)',(Frog,Human)'B(3.3, 3.5)')'B(4.16, 4.22)',(Shark,Stingray)'L(1.9,0.1,1.0,1e-300)')'B(4.22, 4.63)'; B(4.22, 4.63) FigTree で開く Carp L(1.5,0.1,1.0,1e-300) Fugu B(4.16, 4.22) Frog B(3.3, 3.5) Human Shark L(1.9,0.1,1.0,1e-300) Stingray : 化石制約 ( 他の論文から調べる ) Carp Fugu Frog Human Shark Stingray B(4.22, 4.63) 5.0 4.0 3.0 2.0 1.0 0.0 ペア制約 ( 上限 4.63, 下限 4.22) L(1.5,0.1,1.0,1e-300) 49 下限制約 (1.5, p=0.1, c=1.0, hard bound)
1: MCMCTREE (usedata=3) を走らせる コマンドプロンプトから mcmctree と入力してリターンを押す. [JunInoue:12tr]$ mcmctree MCMCTREE in paml version 4.4c, August 2010 Reading options from mcmctree.ctl.. Reading master tree. (((Carp, Fugu), (Frog, Human)), (Shark, Stingray));... 25 h-m-p 1.6000 8.0000 0.0000 C 5540.322816 0 1.5426 623 0/15 26 h-m-p 1.6000 8.0000 0.0000 C 5540.322816 0 1.6000 656 0/15 27 h-m-p 1.6000 8.0000 0.0000 C 5540.322816 0 2.4792 689 Out... lnl = -5540.322816 Calculating SE's Time used: 0:00 [JunInoue:12tr]$ 50 枝長, 勾配ベクトル, 分散共分散行列の書かれた out.bv ファイルが得られる ( 後述 ).
MCMCTREE を用いた分岐年代推定 ( 近似尤度計算 ) 0. 準備 1. 勾配ベクトルと分散共分散行列の推定 (usedata=3) 2. MCMC アルゴリズムの実行 (usedata=2) 51
2. MCMC アルゴリズム Vertebrate6.phy 塩基配列データ ( 実際は使われない ) Vertebrate6.tre 制約付き系統樹 MCMCTREE mcmctree.ctl out_usedata2 mcmc.out FigTree.tre in.bv (out.bv) 勾配ベクトルと分散共分散行列 ベイズ法によって枝ごとの進化速度と年代を推定 52
2: in.bv ファイル (out.bv ファイルの名前を変更 ) 種数 枝長付き最尤樹枝長ベクトル対数尤度の勾配ベクトル 1 階微分 in.bv ファイル (out.bv:usedata = 3 解析より得られる ) 対数尤度の 2 階微分 ヘッセ行列 ( 枝長の分散共分散行列 ) 枝長の MLE を平均とし, 枝長の分散共分散行列を用いた多変量正規分布が得られる. 尤度を繰り返し計算ごとに近似注意 : 配列データは使われない. 53 Thorne, 1998, p1650 左下 Yang 2006 p22, MCT manual.
2: mcmctree.ctl ファイル - usedata2 54 MCMC アルゴリズムモードを指定 進化速度 ( 遺伝子 [partition] 全体 ) の事前分布 枝間の進化速度変動を調節する事前分布 finetune (1 は自動調節 ) 繰り返し計算で用いられる, 各パラメータの step length MCMC 繰り返し計算 2 回以上別々に計算して同じぐらいの推定値が出れば良い. seed = -1 seqfile = Vertebrate6.phy treefile = Vertebrate6.tre outfile = out_usedata2 ndata = 1 usedata = 2 * 0: no data; 1:seq like; 2:normal a clock = 2 * 1: global clock; 2: independent ra RootAge = '<10' * constraint on root age, used if no model = 7 * 0:JC69, 1:K80, 2:F81, 3:F84, 4:HKY85 alpha = 0.5 * alpha for gamma rates at sites ncatg = 5 * No. categories in discrete gamma cleandata = 0 * remove sites with ambiguity data (1: BDparas = 1 1 0 kappa_gamma = 6 2 alpha_gamma = 1 1 * birth, death, sampling * gamma prior for kappa * gamma prior for alpha rgene_gamma = 1 12.5 * gamma prior for rate for genes sigma2_gamma = 1 4.5 * gamma prior for sigma^2 (for finetune = 1: 0.06 0.5 0.008 0.12 0.4 * times, rat * finetune = 0.06 0.5 0.006 0.12 0.4 * times, rates print = 1 burnin = 50000 sampfreq = 50 nsample = 10000 *** Note: Make your window wider (100 columns) when running
rgene_gamma = 1 12.5 遺伝子 (partition) 全体の進化速度 μ( ミュー ) の事前分布を設定するパタメータ. μ はガンマ分布すると仮定. 平均 (m), 標準偏差 (s), 形状パラメータ (α), 尺度パラメータ (β) の関係 : α = (m/s) 2 β = m/s 2. 55 Substitution rate is per time unit 0.084825 +- 0.008316 (0: 準備で得た mlb ファイル ) から m = 0.08, s=0.08 とすると, α = (0.08/0.08) 2 = 1 β = 0.08/0.08 2 =12.5 MCMCTREE マニュアル
sigma2_gamma = 1 4.5 枝間における進化速度の変動を特定 σ 2 はガンマ分布すると仮定. 大きければ変動が激しい. パラメータ設定の根拠はあまり明確になっていない. =>MULTIDIVTIME のマニュアル. rttm*brownmean = 1 rttm: 根幹の分岐年代. brownmean: σ 2 の平均 (m). rttm = 4.5 とすると, m = 1/4.5 m = s= 1/4.5 とすると, α = (m/s) 2 = 1 β = m/s 2 =4.5 t2 t1 56
2: MCMCTREE (usedata=2) を走らせる [JunInoue:12tr]$ mcmctree MCMCTREE in paml version 4.4c, August 2010 Reading options from mcmctree.ctl.. Reading master tree. (((Carp, Fugu), (Frog, Human)), (Shark, Stingray));... r_n11 0.0757 0.0802 (0.0392, 0.1469) lnl -4.3260-4.6698 (-9.7050, -1.3740) time prior: Birth-Death-Sampling rate prior: Log-Normal Time used: 0:14 [JunInoue:12tr]$ out_usedata2 mcmc.out FigTree.tre が得られる. 57
2: finetune を調節する (finetune = 0, 手動調節の場合 ) 採択率 (acceptance proportion ) は 0.2 0.4 の間になるように finetune を調節 [JunInoue:12tr]$ mcmctree MCMCTREE in paml version 4.4c, August 2010... Starting MCMC (np = 17)... finetune steps (time rate mixing para RatePara?): 0.0600 0.5000 0 paras: 5 times, 1 mu, 1 sigma2 (& rates, kappa, alpha) -10% 0.46 0.28 0.46 0.00 0.33 4.589 4.254 2.346 3.359 2.866 0.094 - -5% 0.40 0.22 0.54 0.00 0.40 4.444 4.189 2.898 3.410 3.287 0.085-0% 0.42 0.19 0.60 0.00 0.40 4.410 4.183 3.127 3.414 3.053 0.089-5% 0.40 0.22 0.54 0.00 0.41 4.439 4.189 2.909 3.411 3.242 0.085-10% 0.40 0.22 0.54 0.00 0.41 4.437 4.189 2.911 3.411 3.232 0.086-15% 0.40 0.22 0.54 0.00 0.41 4.438 4.189 2.920 3.411 3.235 0.086-20% 0.40 0.22 0.54 0.00 0.40 4.439 4.189 2.931 3.411 3.243 0.086-25% 0.40 0.22 0.54 0.00 0.40 4.439 4.189 2.939 3.411 3.239 0.085 - ^C [JunInoue:12tr]$ 大きいので, これを 0.01 にしてみる. finetune = 0.06 0.5 0.006 0.12 0.4 * times, rates, mixing, para 58
2: mcmc.out ファイル (MCMC サンプリングが記載 ) t mcmc.out ファイル σ2 対数尤度 繰り返し 全体の進化速度 μ 枝ごとの進化速度 r 分岐年代 t, 置換速度 r, パラメータ θ のランダムな集合から開始. 個々の繰り返しで,t, r, θの変更を提案. 繰り返し計算の k 回ごとに標本抽出 : t, r,θを mcmc.out に保存 R = 計算終了時に平均と信頼区間を要約. 59 min ここでは 50 回ごとに標本抽出. 1, mcmctree.ctl ファイル f (X t*, r*) f (r* t*, θ*) f (t* θ*) f (θ*) f (X t, r) f (r t, θ) f (t θ) f (θ) q (θ, t, r θ*, t*, r*) q (θ*, t*, r* θ, t, r) Yang (2006)
2: アウトファイル (out_usedata2 ファイル ) Species tree for TreeView. Branch lengths = posterior mean (((1_Carp, 2_Fugu) 9, (3_Frog, 4_Human) 10 ) 8, (5_Shark, (((Carp: 2.947415, Fugu: 2.947415): 1.241267, (Frog: 3.41042 0.252082, (Shark: 3.247640, Stingray: 3.247640): 1.193124); (((Carp: 2.947415, Fugu: 2.947415) '1.906-3.811': 1.241267, '3.302-3.501': 0.778256) '4.160-4.220': 0.252082, (Shark: 3. '2.263-4.135': 1.193124) '4.226-4.632'; rategram locus 1: (((Carp: 0.062332, Fugu: 0.076731): 0.062943, (Frog: 0.08101 0.084457, (Shark: 0.099224, Stingray: 0.082360): 0.080458); Posterior median mean & 95% credibility interval 推定年代と 95% 信頼区間 t_n7 4.4500 4.4419 (4.2264, 4.6320) (age of jeffnode t_n8 4.1877 4.1885 (4.1598, 4.2198) (age of jeffnode t_n9 2.9756 2.9477 (1.9057, 3.8108) (age of jeffnode t_n10 3.4162 3.4107 (3.3021, 3.5008) (age of jeffnode t_n11 3.2640 3.2474 (2.2630, 4.1346) (age of jeffnode mu 0.0828 0.0843 (0.0631, 0.1141) sigma2 0.1145 0.1434 (0.0269, 0.4243) r_n1 0.0606 0.0623 (0.0416, 0.0940) r_n2 0.0743 0.0767 (0.0513, 0.1179) 60
2: FigTree.tre ファイル FigTree で作図. http://tree.bio.ed.ac.uk/software/figtree/ 61
参考文献 岸野洋久,Jeffrey L. Thorne. 2002. 分子進化速度のベイズ型階層モデル. 統計数理.50: 17-31. http://www.ism.ac.jp/editsec/toukei/pdf/50-1-017.pdf Thorne, J. L., H. Kishino, and I. S. Painter. 1998. Estimating the rate of evolution of the rate of molecular evolution. Molecular Biology and Evolution 15:1647 1657. Yang, Z. http://abacus.gene.ucl.ac.uk/software/paml.html Yang, Z. 2009. 分子系統学への統計的アプローチ 計算分子進化学. 藤博幸, 加藤和貴, 大安裕美, 訳. 東京, 共立出版. 62