実習 1: MEGA7 のダウンロードとインストール MEGA の Web サイトは http://www.megasoftware.net/( 下図 ) 正式には 黄緑色の [DOWNLOAD] ボタンをクリ ックし 次の画面でもう一度 [DOWNLOAD] をクリックすると ダウンロードできる 実習 2: 配列データのダウンロードとアライメント 例題データ (data): Actin gene coding region 1. 配列データのダウンロード (1) MEGA のメインメニュー [Alignment] [Query Databanks] を選択する
(2) Accession number を入力し [Search] ボタンをクリックする (3) 遺伝子全長 (1374bp) の配列データが表示される CDS のリンクをクリックすると(1) CDS の部分だけマークされる (2) 右下の GenBank をクリックすれば タンパク質コード領域(1134bp) の配列だけが表示される (3) スクロールして配列データを確認する 1 2 3 CDS (coding sequence) をクリックしないと イントロンを含むものと含まないものが混在し アライメントに支障が出る ので注意する
(4) [Add to Alignment] ボタンをクリックする (5) [Input Sequence Label] ダイアログボックス ( 右図 ) が表示されるので 以下のように選択する 1. First word は種名である Homo sapiens を選択する 2. Second word は遺伝子名である ACTA1 を選択する 3. 今回は Use Initial for Genus Name のチェックを外す (6) 同じ要領で以下のデータを全て Alignment Explorer にダウンロードする ( スペースで区切って 複数の番号をクエリにすれば 一度に検索できる ) gi:5016087: Homo sapiens, actin, alpha 1, skeletal muscle gi:16359157: Homo sapiens, actin, beta gi:11038618: Homo sapiens, actin, gamma 1 gi:11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric gi:4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta gi:15928833: Mus musculus, actin, alpha 1, skeletal muscle gi:23271068: Mus musculus, actin, gamma, cytoplasmic gi:28277650: Danio rerio, actin, alpha 1, skeletal muscle gi:3044209: Danio rerio. beta-actin gi:1552221: Oryzias latipes, mrna for muscle actin gi:3336983: Oryzias latipes, mrna for cytoplasmic actin gi:156758: Drosophila melanogaster, actin gene, complete cds, locus 5C gi:170985: Yeast (Saccharomyces cerevisiae) actin gene gi:2588915: Pneumocystis carinii mrna for actin gi:1049306: Arabidopsis thaliana actin-2 gi:30409355: Oryza sativa 注意 : [CDS] をクリックして coding sequence のみをダウンロードする
2. 配列データのアライメント (1) Translated Protein Sequences タブをクリックし アミノ酸配列を表示する (2) Ctrl+A で全配列の全領域を選択し ClustalW(W) ボタンをクリックし 表示される ClustalW Parameters ダイア ログボックスの OK ボタンをクリックし アライメントを行う この条件 ( デフォルト設定 ) で得られるアライメントの N 末端領域 ( 開始コドンのすぐ下流 ) のアライメント精度は通 常よくない アライメントの精度は DNA 配列でも確認してみよう (3) アライメントの最上行 ( 灰色 ) をドラグし 最初の 10 アミノ酸座だけ選択 アライメントしてみる (4) 同じ領域について Gap Opening Penalty (Pairwise と Multiple の 2 箇所 ) を 1 にしてアライメントしてみる 理想的には領域毎に適切な Gap penalty 値を用いてアライメン トを行うのがよい (5) DNA Sequences タブをクリックし DNA 酸配列に戻した後 Save Session でデータファイルを保存する
実習 3: 分子系統樹の作成 1. 近隣結合法による系統樹の作成とブートストラップ テスト (1) 作成したアライメントファイルを開き [Data] [Phylogenetic Analysis] をクリックする (2) メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする (3) Analysis Preferences で以下のように設定し DNA 塩基配列 ( 下図左 ) タンパク質アミノ酸配列 ( 下図右 ) のそ れぞれ場合について系統樹を作成してみる 配列間の距離は 取りあえず p-distance (proportion of different sites) を用いる ( 一般的には多重置換を補正する他の方法の方がよい )
(4) [Compute] をクリックすれば系統樹が作成され Tree Explorer に表示される ( 下図 : アミノ酸配列の系統樹 ) (5) Tree Explorer を使って系統樹の形を整える まず 植物 (Arabidopsis Oryza) より 菌類 (Saccharomyces Pneumocystis) の方が動物に近縁なので 系統樹の根 (root) の位置を変え 植物が外群 (outgroup) になるように する root が付くべき 植物に至る枝をクリックして選択する (Click on the branch leading to plants.) あ ボタンをクリックして root の位置を変更し 同様に やを使ってクラスターの順番を整える 系統樹全体の大きさ 線の太さ フォントなどは をクリックして [Options] ダイアログを表示させ 設定する
(6) ブートストラップ法によって 系統樹の安定性を検定してみる Analysis Preferences の [Test of Phylogeny] で Bootstrap method を選択する (7) 特定のクラスターを選択し をクリックすると 選択されたクラスターの属性を設定することができる Caption に muscle を入力 線の色を 赤 に変更 線の太さを 2 pt に変更
下の例は脊椎動物の細胞骨格型のクラスターを青 筋肉型を赤で着色し 線の太さを 2pt にしている 2. 最尤法による系統樹の推定 (1) メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする (2) Analysis Preferences の [Substitution Type] で Amino acid を選択する
以下のような結果が出る ( アライメントによって多少異なる ) この場合 LG+G モデルが最適であると考えられる (3) メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする (4) Analysis Preferences で以下のように Best Model に設定し 系統樹を作成してみる Amino acid を選択 LG model を選択 Gamma Distributed (G) を選択 使用する CPU コアの数を選択できる CPU コア数 -1 がお勧め
(5) 得られた最尤系統樹 この場合 植物と菌類の位置が離れてしまい 生物学的には上の NJ 系統樹の方が妥当 このように系統樹の 妥当性を生物学的に判断できるようなデータにしておくと 系統解析の成否をチェックできる 3.Gene Duplication Wizard による遺伝子重複の推定 (1) ここでは Gene Duplication Wizard を使って 遺伝子系統樹の中で遺伝子重複によって生じた分岐を同定する方 法を試してみる まずは メイン ウィンドウの [User Tree]-[Find Gene Duplications] をクリックする Gene Duplication Wizard が表示されるので それに沿って進める
(2)Step 1: 最初に 基準とする系統樹を入力する必要がある 今回は 先に作った系統樹を TreeExplorer から出力し て使う Branch Lengths Bootstrap Values のチェックを外し [Export] をクリックする エディタに表示されるので [File]-[Save] からファイルに保存する 保存したファイルを Gene Duplication Wizard で入力する (3)Step 2: 以下のように 各遺伝子の Species Name を入力し [Save] ボタンをクリックする Human Human Human Mouse Zebra fish Medaka fish Fruit fly Human Mouse Zebra fish Human Medaka fish Yeast Carini fungus Thale cress Rice
(4)Step 3: Load species tree file は [Skip] をクリックする (5)Step 4: Root the gene tree は [Set Gene Tree Root] をクリックする 以下のように植物がルートに来るようにする 現在 バグで 1 回別の場所をクリックしてからでないとルートに来ない 以下のようになったら上部の [Finished] をクリックする (6)[Launch Analysis] をクリックすると遺伝子重複による分岐が で示される
4.RelTime による分岐時間推定 (1) ここでは細胞骨格型のアクチン遺伝子のみを用い 種間の分岐年代推定を行ってみる 脊椎動物には paralog が 複数あるので 以下のように Sequence Data Explorer を使って beta actin のみをチェックする (2) 次に最尤法で系統樹を推定する モデルは LG+G を用いる (3)Tree Explorer の RelTime のボタン をクリックする
(4)Timetree Wizard が表示されるので Step 3: Specify Outgroup で [Select Taxa] をクリックする 真中の矢印ボタンを 使って Arabidopsis と Oryza( 植物 ) を左の Taxa In Outgroup に入れ 下の [Save] をクリックする (5)Step 4: Specify Calibrations で [Add Constraints..] をクリックする Calibration Editor が表示されたら で示す動物 と菌類の分岐点を選択し 上の をクリックする (6) 左側のフレームで Min および Max Divergence Time に 1216(Time Tree of Life より ) を入力し [Finished] をクリッ クする
(7)Step 6: Launch Analysis で [Execute] をクリックすると TreeExplorer に Timetree が表示される 分岐点を選択し 上部の をクリックすれば詳細な情報が得られる 以下の例では ショウジョウバエとヒトの 分岐年代は 678.5(287-1070)MYA と推定される (Timetree of life によれば平均 692 MYA)