トランスクリプトーム 解析手法の開発 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス人材養成ユニット門田幸二 2008/12/08
トランスクリプトーム (transcrptome) とは 細胞中に存在する転写物全体 (transcrpt + ome) トランスクリプトーム解析技術 DNA マイクロアレイ Affymetrx GeneChp, cdna アレイ, 電気泳動に基づく方法 Dfferental Dsplay, (cdna-)aflp, Sequence に基づく方法 SAGE, CAGE, MPSS, 2008/12/08
農学生命科学分野への貢献 トランスクリプトーム解析手法の開発 DNA マイクロアレイ 1. 組織特異的遺伝子検出法 :ROKU 2. 発現変動遺伝子検出法 :WAD 応用例 : ニュートリゲノミクス研究など 電気泳動に基づく方法 3. 波形補正およびピークアラインメント法 :GOGOT 応用例 : 農産物の品種識別など 2008/12/08
心臓 胃 大脳 心臓 胃 大脳 心臓 胃 大脳 1. 組織特異的遺伝子検出法 :ROKU 平成 18 年度修了生 ( 葉佳臻氏 ) の研究成果 x 1,1 x 1,2 x 1,3 x 1,4 大脳 特異的高発現遺伝子 x 2,1 x 2,2 x 2,3 x 2,4 x,1 x,2 x,3 x,4 x n,1 x n,2 x n,3 x n,4 心臓と大脳 特異的高発現遺伝子 入力 : 遺伝子発現行列 出力 : 任意の組織特異的遺伝子 アイデア : エントロピー H を組織特異性度合いの指標にしよう
1. 組織特異的遺伝子検出法 :ROKU エントロピー H の採用 遺伝子 x = (x 1, x 2,, x n ) のエントロピー H(x) : H x ) p log ( p ), where p x H(x) のとりうる範囲 : 0 H(x) log 2 (n) n ( x 1 2 H( x) 0 H( x) 1. 45 H ( x) 3. 32 H( x) 3.32 log 2( n) エントロピーが低い 組織特異性が高い エントロピーが高い 組織特異性が低い
1. 組織特異的遺伝子検出法 :ROKU エントロピー H(x) の短所 1. 組織特異的低発現パターンなどの検出が不可能 0 H(x) log 2 (n) 3.32 H( x) 3.29 H( x) 3. 23 H( x) 3. 22 2. 特異的組織の同定が不可能 上位にランキングされない H( x) 0 H( x) 0 H( x) 0 どの組織で特異的なのか分からない
1. 組織特異的遺伝子検出法 :ROKU 改良点 1. 遺伝子発現ベクトル x を変換 : x x by x = x T bw 0 H(x) log 2 (n) 3.32 H( x ) 1.48 H( x ) 1. 64 H( x ) 1. 74 2. AIC に基づく外れ値検出法の採用 上位にランキングされる どの組織で特異的なのか分かる
1. 組織特異的遺伝子検出法 :ROKU 組織特異的遺伝子検出法の比較 本人材養成プログラムで開発した手法 (ROKU) が最も優れている Kadota K, Ye J, Naka Y, Terada T, and Shmzu K, BMC Bonformatcs, 7: 294, 2006 Kadota K, Konsh T, and Shmzu K, Gene Regulaton Systems Bol., 1:9-15, 2007
2. 発現変動遺伝子検出法 :WAD 発現変動遺伝子検出の流れ (Affymetrx データの場合 ) ( 癌 ) ( 正常 ) A 群 B 群 ( 癌 ) ( 正常 ) A 群 B 群 高発現 A1.CEL MAS RMA DFW etc 様々な正規化法 倍率変化 t- 検定 SAM etc 様々なランキング法 低発現 入力 : 生データ 遺伝子発現行列 出力 : ランキング結果 問題 : 用いる手法によって結果がかなり異なる手法選択のガイドラインなし
2. 発現変動遺伝子検出法 :WAD 評価基準 1( 感度 特異度 ):AUC 値の高さ (0 AUC 1) 真の発現変動遺伝子をどれだけ上位にランキングできるか? AUC 値が高い 感度 特異度の高い方法 比較例 :10 遺伝子の発現データを t- 検定と倍率変化でランキングした結果を比較 66.7% 83.3% Area Under the ROC Curve (ROC 曲線の下部面積 :AUC)
2. 発現変動遺伝子検出法 :WAD 評価基準 1 ( 感度 特異度 ) :AUC 値の高さ (0 AUC 1) 24 データセットの平均 %AUC 値 FC 系 従来 : 正規化法だけの比較 DFW がいいらしい ランキング法だけの比較 bmt(t 検定系 ) がいいらしい 感度 特異度の高い手法は t 検定系 t 検定系 本人材養成プログラムの成果 : WAD 法の開発 正規化法とランキング法の相性 組み合わせのガイドライン策定 感度 特異度の高い手法は FC 系 Kadota K, Naka Y, and Shmzu K, Algorthm Mol. Bol., 3:8, 2008
2. 発現変動遺伝子検出法 :WAD 評価基準 2( 再現性 ): POG (Percentage of Overlappng Genes) 値の高さ McroArray Qualty Control (MAQC) プロジェクトで提唱 (0 POG 1) POG 値が高い ランキング結果の頑健性 ( 再現性 ) が高い方法 比較例 :MAQC のサンプル C 5 例 vs. サンプル D 5 例の同じ実験を 6 stes で行い Ste 間でランキング上位 x 個 ( 横軸 ) の共通遺伝子数 ( の割合 ; 縦軸 ) を比較 正規化法 :FARMS Ste1 Ste4 Ste2 上位 100 個の集合 x 17% Ste5 Ste5 Ste1 Ste3 Ste4 Ste3 Ste6 Ste2 Ste6 最も再現性の高い手法は AD 法である WAD 法である 感度 特異度 と 再現性 は両立しない 両立可能である Kadota K, Naka Y, and Shmzu K, Algorthm Mol. Bol., 4:7 2009
Weghted average dfference (WAD) 全体的にシグナル強度の高い遺伝子が上位にくるように重みをかけた統計量 unlogged data log 2 -transformed data Average Dfference (AD) 統計量 AD xを (0~1) の範囲に規格化 x mn( x) w max( x) mn( x) 平均シグナル強度 B A x / 2 B A WAD 統計量 WAD AD w 2008/12/08 AD AD gene6 B A より (6 7) / 2 (1 2 2) / 3 4.83 x x gene6 B A (6 7) / 2 (1 2 2) / 3 / 2 4.08 / 2より w w x mn( x) より max( x) mn( x) 4.08 3.00 10.00 3.00 gene6 0.15
3. 波形補正およびピークアラインメント法 :GOGOT 電気泳動波形解析の問題 比較する実験数が増えるほど 同一転写物 ( 遺伝子 ) の認識 ( アラインメント ) 精度が下がる 理想的なアラインメント 遺伝子発現行列 A B C D E F G H I J K L M N
3. 波形補正およびピークアラインメント法 :GOGOT 電気泳動波形解析の問題 比較する実験数が増えるほど 同一転写物 ( 遺伝子 ) の認識 ( アラインメント ) 精度が下がる 現実 遺伝子発現行列 A B C D E F G H I J K L M N H I
Kadota et al., BMC Bonformatcs, 6:43, 2005 3. 波形補正およびピークアラインメント法 :GOGOT 入力 : 電気泳動波形データ 1 波形補正
Kadota K, Arak R, Naka Y, and Abe M, Algorthm Mol. Bol., 2:5, 2007 3. 波形補正およびピークアラインメント法 :GOGOT 1 波形補正後の波形データ 出力 : 遺伝子発現行列 2 ピークアラインメント 正確な遺伝子発現行列の自動作成が可能になった A B C D E F G H I J K L M N 電気泳動波形データも各種マイクロアレイ解析手法の適用が可能
農学生命科学分野への適用例 1. 組織特異的遺伝子検出法 :ROKU 栄養条件特異的遺伝子の検出 ( 農学生命科学研究科の博士論文研究 ) 2. 発現変動遺伝子検出法 :WAD 絶食状態 vs. 摂食状態での発現変動遺伝子検出 ( 被養成者の修士論文研究 ) ゲノム情報を利用した分解プラスミド pcar1 の異種 Pseudomonas 属細菌内における挙動の理解 ( 新谷先生の研究 ) 3. 波形補正およびピークアラインメント法 :GOGOT 環境中から単離したバクテリアの rep-pcr DNA フィンガープリンティング ( 被養成者の研究 ) 微生物コミュニティを変性剤密度勾配電気泳動法 ( 被養成者の研究 ) ( 農学を含む ) 多くの生命科学研究で利用
共同研究者 東京大学大学院農学生命科学研究科清水謙多郎教授中井雄治特任准教授葉佳臻氏 ( アグリバイオ人材養成プログラム修了生 ) 放射線医学総合研究所先端遺伝子発現研究 G 安倍真澄グループリーダー荒木良子チームリーダー秋田県立大学生物資源科学部小西智一准教授 2008/12/08