実 習 1: MEGA6 のダウンロードとインストール MEGA の Web サイトは http://www.megasoftware.net/( 下 図 ) 正 式 には 左 側 の[Windows]ボタンをクリックし 名 前 とメールアドレスを 入 力 して[Submit Request]をクリックすると ダウンロード 用 のアドレスがメールで 送 られる 実 習 2: 配 列 データのダウンロードとアライメント 例 題 データ (data): Actin gene coding region 1. 配 列 データのダウンロード (1) MEGA のメインメニュー[Alignment] [Query Databanks] を 選 択 する
(2) Accession number を 入 力 し [Search] ボタンをクリックする (3) 遺 伝 子 全 長 (1374bp)の 配 列 データが 表 示 される CDS のリンクをクリックすると(1) CDS の 部 分 だけマークさ れる(2) 右 下 の GenBank をクリックすれば タンパク 質 コード 領 域 (1134bp)の 配 列 だけが 表 示 される(3) ス クロールして 配 列 データを 確 認 する 1 2 3 CDS (coding sequence)をクリックしないと イントロンを 含 むものと 含 まないものが 混 在 し アライメントに 支 障 が 出 る ので 注 意 する
(4) [Add to Alignment] ボタンをクリックする (5) [Input Sequence Label] ダイアログボックス( 右 図 )が 表 示 されるので 以 下 のように 選 択 する 1. First word は 種 名 である Homo sapiens を 選 択 する 2. Second word は 遺 伝 子 名 である ACTA1 を 選 択 する 3. 今 回 は Use Initial for Genus Name のチェックを 外 す (6) 同 じ 要 領 で 以 下 のデータを 全 て Alignment Explorer にダウンロードする (スペースで 区 切 って 複 数 の 番 号 をク エリにすれば 一 度 に 検 索 できる ) gi:5016087: Homo sapiens, actin, alpha 1, skeletal muscle gi:16359157: Homo sapiens, actin, beta gi:11038618: Homo sapiens, actin, gamma 1 gi:11038625: Homo sapiens, actin, gamma 2, smooth muscle, enteric gi:4501882: Homo sapiens, actin, alpha 2, smooth muscle, aorta gi:15928833: Mus musculus, actin, alpha 1, skeletal muscle gi:23271068: Mus musculus, actin, gamma, cytoplasmic gi:28277650: Danio rerio, actin, alpha 1, skeletal muscle gi:3044209: Danio rerio. beta-actin gi:1552221: Oryzias latipes, mrna for muscle actin gi:3336983: Oryzias latipes, mrna for cytoplasmic actin gi:156772: Drosophila melanogaster, actin gene, complete cds, locus 88F gi:156758: Drosophila melanogaster, actin gene, complete cds, locus 5C gi:170985: Yeast (Saccharomyces cerevisiae) actin gene gi:2588915: Pneumocystis carinii mrna for actin
gi:1049306: Arabidopsis thaliana actin-2 gi:30409355: Oryza sativa gi:6934187: Vigna radiata actin 2. 配 列 データのアライメント (1) Translated Protein Sequences タブをクリックし アミノ 酸 配 列 を 表 示 する (2) Ctrl+A で 全 配 列 の 全 領 域 を 選 択 し ClustalW(W)ボタンをクリックし 表 示 される ClustalW Parameters ダイア ログボックスの OK ボタンをクリックし アライメントを 行 う この 条 件 (デフォルト 設 定 )で 得 られるアライメントの N 末 端 領 域 ( 開 始 コドンのすぐ 下 流 )のアライメント 精 度 は 通 常 よくない アライメントの 精 度 は DNA 配 列 でも 確 認 してみよう (3) アライメントの 最 上 行 ( 灰 色 )をドラグし 最 初 の 10 アミノ 酸 座 だけ 選 択 アライメントしてみる (4) 同 じ 領 域 について Gap Opening Penalty (Pairwise と Multiple の 2 箇 所 )を 1 にしてアライメントしてみる 理 想 的 には 領 域 毎 に 適 切 な Gap penalty 値 を 用 いてアライメントを 行 うのがよい 構 造 機 能 ドメインのような 領 域 を 区 別 するための 情 報 がある 場 合 積 極 的 に 利 用 するとよい
(5) DNA Sequences タブをクリックし DNA 酸 配 列 に 戻 した 後 Save Session でデータフ ァイルを 保 存 する 実 習 3: 分 子 系 統 樹 の 作 成 1. 近 隣 結 合 法 による 系 統 樹 の 作 成 とブートストラップ テスト (1) 作 成 したアライメントファイルを 開 き [Data] [Phylogenetic Analysis] をクリックする (2) メインメニュから [Phylogeny]-[Construct/Test Neighbor-Joining Tree] をクリックする (3) Analysis Preferences で 以 下 のように 設 定 し DNA 塩 基 配 列 ( 下 図 左 ) タンパク 質 アミノ 酸 配 列 ( 下 図 右 )のそ れぞれ 場 合 について 系 統 樹 を 作 成 してみる 配 列 間 の 距 離 は 取 りあえず p-distance (proportion of different sites)を 用 いる( 一 般 的 には 多 重 置 換 を 補 正 する 他 の 方 法 の 方 がよい)
(4) [Compute] をクリックすれば 系 統 樹 が 作 成 され Tree Explorer に 表 示 される( 下 図 )
(5) Tree Explorer を 使 って 系 統 樹 の 形 を 整 える まず 植 物 (Arabidopsis Oryza Vigna)より 菌 類 (Saccharomyces Pneumocystis)の 方 が 動 物 に 近 縁 なので 系 統 樹 の 根 (root)の 位 置 を 変 え 植 物 が 外 群 (outgroup)になるように する root が 付 くべき 植 物 に 至 る 枝 をクリックして 選 択 する (Click on the branch leading to plants.) ボタンをクリックして root の 位 置 を 変 更 し 同 様 に や を 使 ってクラスターの 順 番 を 整 える 系 統 樹 全 体 の 大 きさ 線 の 太 さ フォントなどは をクリックして[Options] ダイアログを 表 示 させ 設 定 する (6) ブートストラップ 法 によって 系 統 樹 の 安 定 性 を 検 定 してみる Analysis Preferences の[Test of Phylogeny] で Bootstrap method を 選 択 する
(7) Tree Explorer では をクリックすると 系 統 樹 全 体 の 書 式 を 整 えることができる 枝 の 太 さを 2 pt にしてみよう さらに 特 定 のクラスターを 選 択 し をクリックすると 選 択 されたクラスターの 属 性 を 設 定 することができる 脊 椎 動 物 の 細 胞 骨 格 型 のクラスターを 青 筋 肉 型 を 赤 で 着 色 してみよう
2. 最 尤 法 による 系 統 樹 の 推 定 (1) メインメニュから [Models]-[Find Best DNA/Protein Models] をクリックする (2) Analysis Preferences の [Substitution Type] で Amino acid を 選 択 する 以 下 のような 結 果 が 出 るはず すなわち LG+G モデルが 最 適 であると 考 えられる (3) メインメニュから [Phylogeny]-[Construct/Test Maximum Likelihood Tree] をクリックする
(4) Analysis Preferences で 以 下 のように Best Model に 設 定 し 系 統 樹 を 作 成 してみる (5) 得 られた 最 尤 系 統 樹 この 場 合 生 物 学 的 には 上 の NJ 系 統 樹 の 方 が 妥 当 な 樹 形 となる
3.RelTime による 分 岐 時 間 推 定 (1)ここでは 細 胞 骨 格 型 のアクチン 遺 伝 子 のみを 用 い 種 間 の 分 岐 年 代 推 定 を 行 ってみる 脊 椎 動 物 には paralog が 複 数 あるので 以 下 のように Sequence Data Explorer を 使 って beta actin のみをチェックする (2) 次 に 最 尤 法 で 系 統 樹 を 推 定 する モデルは LG+G を 用 いる (3)Tree Explorer の RelTime のボタン をクリックする
(4) 今 回 のデータは 進 化 速 度 の 一 定 性 が 乏 しく サイト 数 も 小 さいので 誤 差 は 求 めない No を 選 択 する (5)ヒトと 酵 母 の 分 岐 年 代 を 入 植 するので Yes を 選 択 する (6) New をクリックする (7)Taxon A に Homo sapiens Taxon B に Saccharomyces cerevisiae を 選 択 し Min および Max Divergence Time に 1216(Time Tree of Life より)を 入 力 し [Save Change] [Compute]の 順 にクリックする([Compute]の 前 に[New] をクリックすれば 他 の Min Max Divergence Time を 追 加 入 力 することができる)
(8) 以 下 のような Time Tree に 変 換 される Human-Drosophila Saccharomyces- Pneumocystis の 分 岐 年 代 は Time Tree of Life (http://www.timetree.org/ )で 示 されるものに 非 常 に 近 い 値 であるが Human-Danio Oryza-Arabidopsis は 実 際 よりも 大 きな 値 となっている これは 進 化 速 度 の 系 統 間 差 が 大 きいことと 基 準 となる 分 岐 年 代 (Human-Yeast: 1216 MYA)が 古 い 年 代 であるためと 思 われる( 多 重 置 換 の 補 正 が 十 分 でないと 古 い 分 岐 年 代 を 起 点 とすると 新 しい 分 岐 年 代 は 古 め 新 しい 分 岐 年 代 を 起 点 とすると 古 い 分 岐 年 代 は 新 しめにバ イアスして 推 定 される)