分子系統樹作成方法 - PDF Free Download

実習 1: MEGA7 のダウンロードとインストール MEGA の Web サイトは http://www.megasoftware.net/( 下図 ) 正式には黄緑色の [DOWNLOAD] ボタンをクリックし次の画面でもう一度 [DOWNLOAD] をクリックするとダウンロードできる実習 2: 配列データのダウンロードとアライメント例題データ (data): Actin gene coding region 1. 配列データのダウンロード (1) MEGA のメインメニュー [Alignment] [Query Databanks] を選択する

(2) Accession number を入力し [Search] ボタンをクリックする (3) 遺伝子全長 (1374bp) の配列データが表示される CDS のリンクをクリックすると(1) CDS の部分だけマークされる (2) 右下の GenBank をクリックすればタンパク質コード領域(1134bp) の配列だけが表示される (3) スクロールして配列データを確認する 1 2 3 CDS (coding sequence) をクリックしないとイントロンを含むものと含まないものが混在しアライメントに支障が出るので注意する

(4) [Add to Alignment] ボタンをクリックする (5) [Input Sequence Label] ダイアログボックス ( 右図 ) が表示されるので以下のように選択する 1. First word は種名である Homo sapiens を選択する 2. Second word は遺伝子名である ACTA1 を選択する 3. 今回は Use Initial for Genus Name のチェックを外す (6) 同じ要領で以下のデータを全て Alignment Explorer にダウンロードする ( スペースで区切って複数の番号をクエリにすれば一度に検索できる ) gi:5016087: Homo sapiens, actin, alpha 1, skeletal muscle gi:16359157: Homo sapiens, actin, beta gi:11038618: Homo sapiens, actin, gamma 1 gi:11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric gi:4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta gi:15928833: Mus musculus, actin, alpha 1, skeletal muscle gi:23271068: Mus musculus, actin, gamma, cytoplasmic gi:28277650: Danio rerio, actin, alpha 1, skeletal muscle gi:3044209: Danio rerio. beta-actin gi:1552221: Oryzias latipes, mrna for muscle actin gi:3336983: Oryzias latipes, mrna for cytoplasmic actin gi:156758: Drosophila melanogaster, actin gene, complete cds, locus 5C gi:170985: Yeast (Saccharomyces cerevisiae) actin gene gi:2588915: Pneumocystis carinii mrna for actin gi:1049306: Arabidopsis thaliana actin-2 gi:30409355: Oryza sativa 注意 : [CDS] をクリックして coding sequence のみをダウンロードする

2. 配列データのアライメント (1) Translated Protein Sequences タブをクリックしアミノ酸配列を表示する (2) Ctrl+A で全配列の全領域を選択し ClustalW(W) ボタンをクリックし表示される ClustalW Parameters ダイアログボックスの OK ボタンをクリックしアライメントを行うこの条件 ( デフォルト設定 ) で得られるアライメントの N 末端領域 ( 開始コドンのすぐ下流 ) のアライメント精度は通常よくないアライメントの精度は DNA 配列でも確認してみよう (3) アライメントの最上行 ( 灰色 ) をドラグし最初の 10 アミノ酸座だけ選択アライメントしてみる (4) 同じ領域について Gap Opening Penalty (Pairwise と Multiple の 2 箇所 ) を 1 にしてアライメントしてみる理想的には領域毎に適切な Gap penalty 値を用いてアライメントを行うのがよい (5) DNA Sequences タブをクリックし DNA 酸配列に戻した後 Save Session でデータファイルを保存する

実習 3: 分子系統樹の作成 1. 近隣結合法による系統樹の作成とブートストラップテスト (1) 作成したアライメントファイルを開き [Data] [Phylogenetic Analysis] をクリックする (2) メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする (3) Analysis Preferences で以下のように設定し DNA 塩基配列 ( 下図左 ) タンパク質アミノ酸配列 ( 下図右 ) のそれぞれ場合について系統樹を作成してみる配列間の距離は取りあえず p-distance (proportion of different sites) を用いる ( 一般的には多重置換を補正する他の方法の方がよい )

(4) [Compute] をクリックすれば系統樹が作成され Tree Explorer に表示される ( 下図 : アミノ酸配列の系統樹 ) (5) Tree Explorer を使って系統樹の形を整えるまず植物 (Arabidopsis Oryza) より菌類 (Saccharomyces Pneumocystis) の方が動物に近縁なので系統樹の根 (root) の位置を変え植物が外群 (outgroup) になるようにする root が付くべき植物に至る枝をクリックして選択する (Click on the branch leading to plants.) あボタンをクリックして root の位置を変更し同様にやを使ってクラスターの順番を整える系統樹全体の大きさ線の太さフォントなどはをクリックして [Options] ダイアログを表示させ設定する

(6) ブートストラップ法によって系統樹の安定性を検定してみる Analysis Preferences の [Test of Phylogeny] で Bootstrap method を選択する (7) 特定のクラスターを選択しをクリックすると選択されたクラスターの属性を設定することができる Caption に muscle を入力線の色を赤に変更線の太さを 2 pt に変更

下の例は脊椎動物の細胞骨格型のクラスターを青筋肉型を赤で着色し線の太さを 2pt にしている 2. 最尤法による系統樹の推定 (1) メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする (2) Analysis Preferences の [Substitution Type] で Amino acid を選択する

以下のような結果が出る ( アライメントによって多少異なる ) この場合 LG+G モデルが最適であると考えられる (3) メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする (4) Analysis Preferences で以下のように Best Model に設定し系統樹を作成してみる Amino acid を選択 LG model を選択 Gamma Distributed (G) を選択使用する CPU コアの数を選択できる CPU コア数 -1 がお勧め

(5) 得られた最尤系統樹この場合植物と菌類の位置が離れてしまい生物学的には上の NJ 系統樹の方が妥当このように系統樹の妥当性を生物学的に判断できるようなデータにしておくと系統解析の成否をチェックできる 3.Gene Duplication Wizard による遺伝子重複の推定 (1) ここでは Gene Duplication Wizard を使って遺伝子系統樹の中で遺伝子重複によって生じた分岐を同定する方法を試してみるまずはメインウィンドウの [User Tree]-[Find Gene Duplications] をクリックする Gene Duplication Wizard が表示されるのでそれに沿って進める

(2)Step 1: 最初に基準とする系統樹を入力する必要がある今回は先に作った系統樹を TreeExplorer から出力して使う Branch Lengths Bootstrap Values のチェックを外し [Export] をクリックするエディタに表示されるので [File]-[Save] からファイルに保存する保存したファイルを Gene Duplication Wizard で入力する (3)Step 2: 以下のように各遺伝子の Species Name を入力し [Save] ボタンをクリックする Human Human Human Mouse Zebra fish Medaka fish Fruit fly Human Mouse Zebra fish Human Medaka fish Yeast Carini fungus Thale cress Rice

(4)Step 3: Load species tree file は [Skip] をクリックする (5)Step 4: Root the gene tree は [Set Gene Tree Root] をクリックする以下のように植物がルートに来るようにする現在バグで 1 回別の場所をクリックしてからでないとルートに来ない以下のようになったら上部の [Finished] をクリックする (6)[Launch Analysis] をクリックすると遺伝子重複による分岐がで示される

4.RelTime による分岐時間推定 (1) ここでは細胞骨格型のアクチン遺伝子のみを用い種間の分岐年代推定を行ってみる脊椎動物には paralog が複数あるので以下のように Sequence Data Explorer を使って beta actin のみをチェックする (2) 次に最尤法で系統樹を推定するモデルは LG+G を用いる (3)Tree Explorer の RelTime のボタンをクリックする

(4)Timetree Wizard が表示されるので Step 3: Specify Outgroup で [Select Taxa] をクリックする真中の矢印ボタンを使って Arabidopsis と Oryza( 植物 ) を左の Taxa In Outgroup に入れ下の [Save] をクリックする (5)Step 4: Specify Calibrations で [Add Constraints..] をクリックする Calibration Editor が表示されたらで示す動物と菌類の分岐点を選択し上のをクリックする (6) 左側のフレームで Min および Max Divergence Time に 1216(Time Tree of Life より ) を入力し [Finished] をクリックする

(7)Step 6: Launch Analysis で [Execute] をクリックすると TreeExplorer に Timetree が表示される分岐点を選択し上部のをクリックすれば詳細な情報が得られる以下の例ではショウジョウバエとヒトの分岐年代は 678.5(287-1070)MYA と推定される (Timetree of life によれば平均 692 MYA)