Microarry Data Analysis Tool データ 解 析 の 進 め 方 まず はじめに マイクロアレイ( 下 図 参 照 )とは 数 千 から 数 万 といった 膨 大 な 遺 伝 子 情 報 をもつDNAプローブが 貼 り 付 けられた 基 板 のことをいいます 実 験 対 象 となる 細 胞 から 抽 出 されたmRNAを 蛍 光 標 識 をし 基 板 のDNAプローブに 対 して ハイブリダイゼーションを 行 います その 後 スキャナーで 蛍 光 強 度 を 読 み 取 り 数 値 化 を 行 います これにより 一 度 の 実 験 で 膨 大 な 遺 伝 子 の 発 現 情 報 を 得 ることが 出 来 ます これまでのような 個 々の 遺 伝 子 を 対 象 とした 解 析 から 網 羅 的 な 解 析 ネットワーク 的 な 解 析 が 行 えるようになりました マイクロアレイの 解 析 とは 実 験 後 スキャナーで 読 み 取 られた 画 像 データは 上 図 のように 丸 いスポットが 規 則 正 しく 配 置 されたイメージとなります この 丸 いスポットの1つ1つがDNAプローブに 対 応 し これらの 蛍 光 強 度 を 数 値 化 します 上 図 の 場 合 黄 色 のスポットが 多 く ところどころ 緑 と 赤 のスポット があります これは 異 なるサンプルを 異 なる 蛍 光 色 素 (Cy3,Cy5)でラベリングし 1 枚 のアレ イ 上 で 競 合 的 ハイブリダーゼーションを 行 う2 色 法 の 場 合 です 黄 色 は 赤 と 緑 が 混 ざった 状 態 となります つまり 赤 と 緑 の 比 率 が 発 現 差 の 比 率 となります 2 色 法 の 他 に 異 なるサンプ ルを 同 じ 蛍 光 色 素 でラベリングし 1アレイで1サンプルのハイブリダーゼーションを 行 い ア レイ 間 のデータを 比 較 する 単 色 法 があります 1
下 記 が2 色 法 と 単 色 法 の 概 要 となります 2 色 法 の 場 合 は 同 一 スポットに 対 して 異 なる 蛍 光 色 素 でラベリングしたmRNAがハイブリダイズ します そのため 赤 と 緑 という2つのシグナルデータを 一 つのデータとして 表 示 するため 緑 の シグナル/ 赤 のシグナルから 計 算 したRatio 値 ( 比 率 )を 用 います 一 方 単 色 法 では 別 々のアレ イに 対 して 同 じ 蛍 光 色 素 でラベリングしたmRNAを 使 用 するため Ratio 値 ( 比 率 )だけでなく シグナル 値 の 比 較 も 可 能 となります 2 色 法 の 場 合 単 色 法 の 場 合 正 常 細 胞 がん 細 胞 正 常 細 胞 がん 細 胞 ここまでの 話 で マイクロアレイの 解 析 は 異 なるサンプル 間 におけるスポットの 蛍 光 強 度 を 比 較 するということはお 分 かりになったと 思 います しかしながら 実 際 のアレイのデータは 数 千 から 数 万 という 膨 大 なデータ 量 であるため 個 々のデータを1つ1つみることは 非 常 に 大 変 な 作 業 と なります そこで 下 図 のようにスキャッタープロットと 呼 ばれ 散 布 図 がマイクロアレイの 解 析 においてよく 使 われています このグラフでは 正 常 細 胞 側 のスポットの 蛍 光 強 度 をY 軸 に がん 細 胞 側 の スポットの 蛍 光 強 度 をx 軸 に 分 布 します 各 サンプルの 発 現 レベルが 同 じあれば プロットは 中 心 45 度 のラインに 乗 ってきます 一 方 発 現 レベルの 差 があるほど 中 心 から 外 れてきます 例 えば 赤 いプロットはがん 細 胞 で 特 異 的 に 高 い 発 現 を 示 したDNAプローブとなります このよ うに スキャッタープロットはサンプル 間 の 発 現 状 態 の 全 体 像 をを 視 覚 的 に 捉 えることができま す 2
それでは どのくらいの 発 現 差 があれば 有 意 な 差 のあるデータといえるのでしょうか? 下 図 はおよそ3 万 のデータがプロットされたスキャッタープロットです 先 にも 述 べたように 通 常 比 較 サンプル 間 によるシグナルの 比 率 をみます スキャッタープロットにおける 中 心 45 度 のラ インがRatio1のラインになります そして そのラインを 真 ん 中 とし 両 方 に 平 行 移 動 した 赤 の2 本 のラインが2 倍 以 上 発 現 (Ratio2 Ratio0.5)のラインになります アレイの 品 質 にもよりますが 同 じサンプルを 用 いてデータを 比 較 した 場 合 理 論 上 は45 度 の ラインのRatio1のラインにプロットが 収 束 されます しかしながら マイクロアレイのデータに 中 にはアレイの 品 質 サンプル 調 整 蛍 光 標 識 ハイブリダイゼーション 洗 浄 など 様 々な 要 因 の ノイズが 含 まれ 実 際 には1.5 倍 前 後 のライン 付 近 にプロットが 収 束 されます そこで 2 倍 以 上 の 差 があれば 有 意 なデータであるとして データ 抽 出 における 閾 値 の 基 準 に 利 用 されています この 方 法 には 統 計 的 な 裏 付 けはありませんが マイクロアレイのようにスクリーニング 的 な 要 素 が 強 い 手 法 においては 非 常 によく 使 用 されています また この 方 法 で 抽 出 されデータは 後 でリアルタイムPCRなどの 定 量 解 析 法 で 確 認 試 験 を 行 うことを 推 奨 します 逆 に マイクロアレ イだけでデータをまとめようとする 場 合 は 統 計 的 な 解 析 を 求 められるケースがおおいので 再 現 性 実 験 が 必 要 となります 先 の 説 明 では 発 現 差 という 部 分 でのノイズの 影 響 を 説 明 したのですが シグナルの 大 きさでの ノイズの 影 響 はどうでしょうか? 上 図 のスキャッタープロットにおいてシグナルが 低 いほどバラツキの 幅 が 大 きくなっていること がわかります 例 えば シグナルが1と10でも10 倍 の 発 現 差 があります 同 じように1000と 10000でも10 倍 の 発 現 差 があります 前 者 は ノイズレベルのシグナルであり シグナルが 大 き い 後 者 の 方 がデータの 信 頼 度 が 高 くなります 大 量 のデータから 発 現 差 だけを 基 準 にデータを 抽 出 すると 上 記 のようなノイズ 的 なデータを 多 く 含 め 抽 出 してしまいますので 基 準 を 設 け ノイズデータを 除 去 する 必 要 があります 3
それでは 何 を 基 準 にしてノイズの 除 去 をすればいいのでしょうか? 使 用 するアレイやプラットフォームの 違 いによっても 異 なりますが Negative Controlのシグナル を 基 準 にする 方 法 やバックグランドを 基 準 にする 方 法 が 多 く 利 用 されています しかしながら 基 準 を 決 めたとしても すべてのノイズが 除 去 できるとは 限 りません 逆 に 除 去 した 中 に 正 しいデータが 含 まれている 可 能 性 もあります 先 にも 述 べましたがノイズであるかどうかも 再 現 性 実 験 を 行 うことが 一 番 よい 方 法 であることは 確 かです 逆 に 1 比 較 のデータしかない 場 合 では 基 準 を 高 めにし より 厳 しい 条 件 でデータを 抽 出 することを 推 奨 します 次 はサンプル 間 のデータの 比 較 (ノーマライゼーション)について 説 明 します 従 来 はbeta-actinやGAPDH 等 のHousekeeping 遺 伝 子 をコントロールとし それらがサンプル 間 で 一 定 レベルであるという 前 提 でサンプル 間 を 補 正 する 方 法 がよく 使 用 されてきました しかしなが ら 最 近 のように 全 遺 伝 子 を 網 羅 したアレイの 補 正 においては 比 較 サンプル 間 での 遺 伝 子 の 総 発 現 量 はほぼ 同 じであるというグローバルノーマライゼーションが 採 用 されています 刺 激 によっ て 一 部 の 遺 伝 子 の 変 動 があっても 全 体 としての 発 現 レベルは 変 わらないという 解 釈 になります 2 色 法 の 場 合 では 異 なる 蛍 光 色 素 の 影 響 を 補 正 するためにloess 法 が 利 用 されています 以 上 マイクロアレイの 概 要 解 析 を 進 める 上 でのポイントを 紹 介 してきました 次 はいよいよソフトウェアの 使 用 について 説 明 します 本 ソフトウェアは 弊 社 受 託 サービス 専 用 と なっているため データを 読 み 込 むだけですぐに 解 析 に 進 めることが 出 来 ます 操 作 も 非 常 に 簡 単 です ぜひ トライしてください 4
Microarry Data Analysis Tool 1 比 較 解 析 の 進 め 方 ここからは ソフトウェアの 使 用 方 法 と 実 際 の 解 析 例 を 合 わせて 説 明 します 解 析 テーマは 薬 物 投 与 マウスにおける 発 現 変 動 遺 伝 子 群 の 抽 出 と 機 能 解 析 です 薬 物 を 投 与 したマウスをテストサンプル 投 与 していないマウスをコントロールサンプルとして 両 サンプルの 遺 伝 子 発 現 プロファイルをマイクロアレイ 実 験 で 比 較 します その 後 比 較 データ の 中 から 薬 物 投 与 マウスのみで 高 発 現 または 低 発 現 している 遺 伝 子 を 絞 り 込 み これらの 遺 伝 子 がどのような 機 能 をもっているのか 調 べます この 結 果 この 薬 物 が 生 体 に 対 してどの ような 作 用 をするのか 考 察 することができます < 実 験 概 要 > 上 記 のテーマについて 解 析 を 行 うには 具 体 的 に 下 記 のようなステップで 解 析 を 進 める 必 要 が あります 1 薬 剤 投 与 によって 発 現 が 変 動 する(2 倍 Up Downなど) 遺 伝 子 群 の 抽 出 2 発 現 変 動 遺 伝 子 群 について Gene Ontologyによる 生 物 学 的 機 能 の 検 索 3 発 現 変 動 遺 伝 子 群 について GenMAPPによるパスウェイの 検 索 まず1の 工 程 では 2 倍 以 上 の 変 動 を 有 意 な 差 として 薬 物 投 与 マウスで 発 現 が 増 加 または 減 少 している 遺 伝 子 を 抽 出 します さらに ノイズ 的 なシグナルの 除 去 も 忘 れてはいけません 次 に2 3の 工 程 で 1で 抽 出 した 遺 伝 子 がどのような 機 能 またはパスウェイと 関 連 があるかを 調 べます ここで 用 いられるGene Ontology(GO)とは 生 物 学 的 機 能 を 簡 単 な 記 述 で 表 したもので 抽 象 度 によって 分 類 された 階 層 構 造 をもっています またGenMAPPは 細 胞 の 分 子 間 相 互 作 用 情 報 (パスウェイ)を 図 で 表 したものです 現 在 までの 研 究 で 機 能 が 明 らかになった 遺 伝 子 には このGOやパスウェイがアノテーション 情 報 として 付 けられるので 発 現 変 動 遺 伝 子 がどのような 機 能 やパスウェイと 関 連 付 けられているかを 調 べれば 薬 物 投 与 によってどのような 生 物 学 的 作 用 が 起 こっているのかを 推 測 することができます それでは ソフトウェアを 立 ち 上 げて 進 めていきましょう! 5
1. ソフトウェアの 起 動 と 実 験 データの 読 み 込 み 1-1. ソフトウェアの 準 備 CDに 入 っている Microarray Data Analysis Tool のフォルダを 自 分 のコンピュータ にコピーしてください 1-2. ソフトウェアの 起 動 コピーしたフォルダを 開 き MAtool.exe の アイコンをダブルクリックしてください 右 図 のタイトル 画 面 が 表 示 され ソフトウェア が 起 動 します ソフトウェアが 起 動 後 は 右 図 のメイン 画 面 が 表 示 されます 1-3. 実 験 データ 読 み 込 み 1 比 較 データ 解 析 アイコン をクリックし 実 験 データ フォルダを 選 択 し フォルダ 内 から 希 望 の 実 験 データファイル( vs.csv)を 読 み 込 ませてください 実 験 データファイルを 読 み 込 み 後 右 図 のよ うなデータが 表 示 された 画 面 が 現 れます 左 の 側 が 実 験 数 値 データで 各 プローブに 該 当 するアノテーション 情 報 が 右 側 に 表 示 さ れます 青 の 文 字 はダブルクリックすると 該 当 データベースへハイパーリンクします なお ここで 表 示 されているデータはエクセ ルで 作 成 された 解 析 データと 同 じデータとな ります 6
2. スキャッタープロットの 作 成 2-1. スキャッタープロットの 表 示 メイン 画 面 のScatterPlot 表 示 アイコン を クリックしてください あとは 自 動 でグラフが 表 示 されます スキャッタープロットの 上 の 個 別 のプロット をクリックするとプロットの 色 が 青 から 赤 に 変 わります また メイン 画 面 上 の 対 応 するプ ローブ( 行 )が 青 色 で 選 択 され 行 の 先 頭 に スクロール 表 示 されます さらに メイン 画 面 のPlotwindowアイコン をクリックすると スキャッタープロットの 各 プロットの 個 別 のデータを 表 示 する Plotwindow 画 面 が 現 れます 上 記 までのステップで スキャッタープロットを 表 示 させ 比 較 サンプル 間 における 遺 伝 子 発 現 の 全 体 像 を 見 ることができました スキャッタープロットが 中 心 ライン 付 近 に 収 束 して いれば 比 較 サンプル 間 の 発 現 差 は 小 さいと 解 釈 が 出 来 ます ばらつきの 幅 が 広 ければ サンプル 間 における 発 現 差 が 大 きいと 解 釈 できます 次 は 変 動 遺 伝 子 の 抽 出 となります 7
3. 発 現 変 動 遺 伝 子 の 抽 出 3-1. Filter Options 検 索 画 面 の 表 示 メイン 画 面 のFilter Optionsアイコン を クリックし Filter Options 検 索 画 面 を 開 き ます Filter Options 検 索 画 面 では 各 種 検 索 条 件 で データの 抽 出 を 行 うことが 出 来 ます keyword 機 能 カテゴリー 実 験 データ 染 色 体 番 号 遺 伝 子 セット 3-2. 検 索 条 件 を 設 定 ここでは 下 記 を 目 的 を 達 するための 条 件 設 定 を 行 います 1コントロール 遺 伝 子 などを 除 去 し 解 析 対 象 遺 伝 子 のみにする 2スポット 上 にごみ 等 があり シグナルに 影 響 するデータを 除 外 する 3 発 現 差 のあるデータを 抽 出 する 4ノイズレベルの 信 頼 性 の 低 いデータを 除 外 する 条 件 設 定 の 方 法 1コントロール 遺 伝 子 などを 除 去 し 解 析 対 象 遺 伝 子 のみにする ここでは keyword 検 索 を 使 用 します 事 前 にアレイに 搭 載 されているプローブは 0 2 3 という 数 字 で 識 別 をしています 0 は 解 析 対 象 遺 伝 子 2 は 解 析 対 象 外 遺 伝 子 (NegativeControl,Blank,QCコントロールなど) 3 はデータベースの 更 新 により 対 応 プローブの 情 報 が 削 除 された 遺 伝 子 *アレイの 種 類 により 解 析 対 象 の 条 件 設 定 が 必 要 ない 場 合 もあります まずは 左 のチェックボックスをクリックし 該 当 項 目 で 解 析 対 象 :0 と 0}を 選 択 してください これで 解 析 対 象 遺 伝 子 のみを 抽 出 する 条 件 設 定 が 出 来 ました 8
2スポット 上 にごみ 等 があり シグナルに 影 響 するデータを 除 外 する ここでは Ignore cellの 設 定 を 使 用 します 事 前 にアレイに 搭 載 されているデータの 中 でごみなど の 影 響 を 受 け 正 確 なシグナルを 算 出 できていない 可 能 性 があるデータはメイン 画 面 で 表 示 されているIgnored cellsの 項 目 が 1 になって います 上 図 チェックボックスをクリックすることで Ignored cellsを 除 外 することが 出 来 ます 3 発 現 差 のあるデータを 抽 出 する ここでは 実 験 データ 検 索 を 使 用 します 実 験 の 内 容 や 結 果 によっても 変 わってきますが ここで はシグナルの 差 が2 倍 以 上 あるデータを 差 のあるデータとして 抽 出 します コントロール 対 して2 倍 以 上 のUp 変 動 データを 抽 出 する 場 合 左 のチェックボックスをクリックし 項 目 Normalized intensity (mean) {ratio} で 2 以 上 を 設 定 を します スキャッタープロットは 下 図 のようになります コントロール 対 して2 倍 以 上 のDown 変 動 データを 抽 出 する 場 合 左 のチェックボックスをクリックし 項 目 Normalized intensity (mean) {ratio} で 0.5 以 下 を 設 定 をします スキャッタープロットは 下 図 のようになります コントロール 対 して2 倍 以 上 のUpとDown 変 動 データを 一 度 に 抽 出 する 場 合 左 のチェックボックスをクリックし 項 目 Normalized intensity (mean) {ratio} で 2 以 上 を 設 定 を します 同 様 に 項 目 Normalized intensity (mean) {ratio} で 0.5 以 下 を 設 定 をします この 時 AND ORの 選 択 でORを 選 択 します スキャッタープロットは 下 図 のようになります 9
4ノイズレベルの 信 頼 性 の 低 いデータを 除 外 する ここでは 3と 同 様 実 験 データ 検 索 を 使 用 します 実 験 の 内 容 や 結 果 によっても 変 わって きますが エクセルで 作 成 された 解 析 データのCutoffの 条 件 設 定 を 参 考 に 設 定 をします 例 1 Normalized intensity (mean) がnegative-controlのNet intensity(sum)の 平 均 値 (=300)で あれば 左 のチェックボックスをクリックし 項 目 Normalized intensity (mean) {sum} で 300 以 上 を 設 定 をします 例 2 Normalized intensity (mean) がBackground (mean) 2(=100) であれば 左 のチェックボッ クスをクリックし 項 目 Normalized intensity (mean) {test} で 100 以 上, 同 様 に Normalized intensity (mean) {control} で 100 以 上 と 設 定 をします 下 図 では 例 1の 条 件 設 定 における ノイズ 除 去 の 設 定 例 です コントロール 対 して2 倍 以 上 のUp 変 動 データを 抽 出 する 場 合 スキャッタープロットは 下 図 のようになります コントロール 対 して2 倍 以 上 のDown 変 動 データを 抽 出 する 場 合 スキャッタープロットは 下 図 のようになります コントロール 対 して2 倍 以 上 のUpとDown 変 動 データを 一 度 に 抽 出 する 場 合 スキャッタープロットは 下 図 のようになります 10
以 上 で 条 件 設 定 は 終 わりです 最 後 にFilter Options 検 索 画 面 右 下 の OK ボタンを 押 すとデータの 抽 出 が 実 行 され 下 図 のようにメイン 画 面 にデータが 表 示 されます この 結 果 マイクロアレイ 上 の 全 遺 伝 子 数 :37440 個 検 索 後 の 遺 伝 子 数 :372 個 まで 絞 り 込 めました この372 個 の 遺 伝 子 は 薬 物 投 与 によって 発 現 が 誘 導 され この 薬 物 の 作 用 を 規 定 するうえで 重 要 な 遺 伝 子 だと 考 えることが 出 来 ます 変 動 遺 伝 子 の 数 が 多 い 場 合 は Normalized intensity (mean) {ratio}やcutoffの 設 定 条 件 を 上 げて 抽 出 を 行 ってください ここでは Normalized intensity (mean) {ratio}を 使 用 しましたが Normalized intensity(mean) {log2ratio}でも 同 様 の 検 索 ができます 設 定 条 件 についてはLog2の 値 で 行 います 表 示 されたデータは 遺 伝 子 セットで 保 存 したり text 形 式 で 出 力 させることができ エ クセルでの 編 集 ができます 保 存 アイコンをクリックし 保 存 先 とファイル 名 を 指 定 してください メイン 画 面 上 で 表 示 されている 情 報 がそのまま 保 存 されます また その 後 の 機 能 解 析 やデータをまとめる 上 でも 変 動 データの 保 存 はUpとDown を 別 々に 抽 出 し それぞれを 保 存 あるいは 遺 伝 セットで 登 録 することをお 勧 めします 11
ここでは Filter Optionsなどにより 抽 出 されたデータ 群 を 遺 伝 子 セットして 登 録 する 方 法 を 説 明 します 一 度 登 録 すれば 後 日 同 じデータを 簡 単 に 選 択 する ことができます また 同 じ 規 格 のアレイであれば 別 の 実 験 データにおいて 登 録 した 遺 伝 子 セットの 結 果 も 抽 出 できます 4. 遺 伝 子 セットの 登 録 方 法 1ここでは 先 と 同 様 に2 倍 のUp 変 動 したデー タを 抽 出 します 抽 出 結 果 がメイン 画 面 に 表 示 されたのを 確 認 後 Filter Options 検 索 画 面 に おいて 遺 伝 子 セット 登 録 を 選 択 します 2 次 に 新 規 登 録 のボタンを 押 します 入 力 画 面 が 表 示 されますので 検 索 名 に 名 前 を 入 力 します ここでは 2Up と 入 力 します また 変 更 ボタンを 押 すと 色 の 変 更 ができます ここ での 色 は 登 録 した 遺 伝 子 セットのプロット 色 と なります ここでは 青 にします 最 後 にOKを クリックします 3 登 録 後 は 右 図 のように 登 録 情 報 が 表 示 され ます 12
4 次 にFilter Options 検 索 画 面 に 戻 り 今 度 は2 倍 の Down 変 動 の 条 件 設 定 で 抽 出 を 行 います 抽 出 結 果 がメイン 画 面 に 表 示 されたのを 確 認 後 先 と 同 様 に 遺 伝 子 セット 登 録 を 選 択 します ここでは 2Down と 入 力 します また 色 の 登 録 は 赤 にします 最 後 にOKボタンをクリックします 5 登 録 後 は 右 図 のように 登 録 情 報 が 追 加 されます 6[select]の 列 の 空 欄 をダブルクリックすると が 表 示 されます この 状 態 で 今 2つの 遺 伝 子 セット が 選 択 されたことになります ここで OKボタンを クリックすると 2つの 遺 伝 子 セットのみのデータが メイン 画 面 に 表 示 されます 76の 状 態 でスキャッタープロットを 表 示 させると 右 図 のように 先 ほど 設 定 した 色 で 表 示 させること が 出 来 ます 13
5. カテゴリー 検 索 先 の 説 明 では 変 動 しているデータに 着 目 して 抽 出 を 行 いました 次 は 自 分 の 興 味 ある 機 能 カテゴリーの 検 索 について 説 明 します Function 検 索 1 最 初 にFunctionのチェックボックスをクリックして チェックを 入 れてください *Human,Mouse,Ratアレイに 対 応 しています 2 検 索 時 にはカテゴリー 項 目 のSelectボックスをダブルクリックしてください 3 下 図 のカテゴリ 検 索 条 件 画 面 が 表 示 されます 分 類 には 大 まかなカテゴリー 分 類 と 各 カテゴリーをさらに 分 類 したサブカテゴリーがあります つまり 大 カテゴ リーにおける 該 当 遺 伝 子 数 は その 全 てのサブカテゴリーの 該 当 遺 伝 子 数 の 合 計 と 同 じになります カテゴリーの 選 択 は[select]の 列 の 空 欄 をダブルクリックします が 表 示 されますの で 該 当 カテゴリーが 選 択 されたことになります 14
4ここでは 下 記 の[Cytokine and Inflammatory Response ]の[Interleukin and Receotors]を 選 択 します 選 択 後 はOkボタンを 押 します さらにFilter Options 検 索 画 面 右 下 のOkボタンを 押 し 抽 出 が 実 行 されます 5 検 索 結 果 は 下 記 のようにメイン 画 面 に 表 示 されます アノテーション 情 報 のデータを 見 ていくとInterleukin 関 連 の 遺 伝 子 群 が 抽 出 されていることがわかります 65の 状 態 でスキャッタープロットを 表 示 させると 下 図 のように 選 択 したカテゴリーの みのグラフが 表 示 されます 先 の 変 動 遺 伝 子 の 条 件 設 定 などと 組 み 合 わせることにより 変 動 した 遺 伝 子 の 中 から 例 えばサイトカイン 関 連 の 遺 伝 子 を 抽 出 することも 可 能 です このように 本 ソフトウェアではいろいろな 条 件 設 定 でデータを 抽 出 することができます この 際 に 解 析 対 象 外 の 遺 伝 子 の 除 去 やノイズ 的 な 信 頼 の 低 いデータの 除 去 の 条 件 設 定 を 忘 れずに 行 ってください 15
6. 抽 出 した 遺 伝 子 の 機 能 解 析 絞 り 込 んだデータについて どのような 機 能 をもった 遺 伝 子 があるのかを 調 べるために Gene Ontology 解 析 を 行 います 1 Filter Optionsでデータの 絞 り 込 みを 行 います ここでは 下 記 の 条 件 設 定 を 行 います 解 析 対 象 遺 伝 子 のみにする Ignore cellsを 除 外 する 発 現 差 のあるデータ(2 倍 以 上 )を 抽 出 する ノイズレベルの 信 頼 性 の 低 いデータを 除 外 する (Normalized intensity (mean) {sum} が300 以 上 ) 以 上 で 条 件 設 定 は 終 わりです 最 後 に Filter Options 検 索 画 面 右 下 の OK ボタ ンを 押 すとデータの 抽 出 が 実 行 され 右 図 のようにメイン 画 面 にデータが 表 示 さ れます ここでは328 件 抽 出 されました 2 GO 解 析 アイコン をクリックし データベース 選 択 ウインドウを 開 きます ここで 解 析 に Gene Ontologyを 使 用 するか GO Slimを 使 用 するかの 選 択 ができます 本 解 析 では Gene Ontologyを 使 用 するので そちらをクリックしてください 3 次 にデータの 出 力 形 式 を 選 択 します ここで 選 択 できる 項 目 は 以 下 の 機 能 をもっています Gene Ontology Browser 全 てのGOカテゴリーを 階 層 構 造 で 表 示 させます GO Term List 統 計 学 的 に 有 意 なGOカテゴリーのみを 有 意 な 順 にリスト 形 式 で 表 示 させます TotalGene 保 存 マイクロアレイ 上 の 全 遺 伝 子 についての 全 GOカテゴリー 該 当 遺 伝 子 数 を 記 録 したファイルを 作 成 します ここで 作 成 し たファイルは 納 品 の 時 点 ですでに 作 成 添 付 されているので この 機 能 は 実 行 する 必 要 がありません 16
Gene Ontology Browser 本 機 能 は 全 てのGOカテゴリーを 階 層 構 造 で 表 示 し 同 時 に 該 当 遺 伝 子 数 や 統 計 学 的 有 意 確 率 も 表 示 します この 階 層 構 造 は 生 物 学 的 機 能 を 抽 象 度 によって 分 類 したものであり 階 層 を 下 にたどっていくごとに より 具 体 的 なGOカテゴリーが 出 現 します この 性 質 を 利 用 して 自 分 の 興 味 ある 機 能 について 上 位 階 層 から 見 ていき 下 位 のより 細 かいGOカテゴリーにつ いて 有 意 なものを 調 べることができます 1まず Gene Ontology 解 析 ウインドウで Gene Ontology Browser のアイコンをクリックします 右 図 のような 警 告 画 面 が 表 示 されますので 計 算 処 理 時 間 について 確 認 の 上 OKボタンをクリックしてく ださい その 後 計 算 が 始 まります 計 算 が 終 了 すると 以 下 の ような 画 面 が 表 示 されます Gene Ontology Browser 初 期 画 面 Gene Ontology Browserでは 最 初 は3つのGOカテゴリーしか 表 示 されません しかし 各 カ テゴリー 名 の 前 にある + をクリックしていくたびに 下 位 のGOカテゴリーが 表 示 されてい きます それでは 例 として molecular function の 下 位 に 属 する catalytic activity というカテゴリー について 調 べてみましょう molecular function の 前 の + をクリックすると 以 下 のよう な 画 面 が 表 示 されます molecular function 階 層 画 面 ここで catalytic activity の 項 目 ( 赤 線 で 囲 んだ 領 域 )を 見 てみますと Z-scoreが0より 大 きく なおかつP-valueが0.05 以 下 となっており このGOカテゴリーが 統 計 学 的 に 有 意 だと いうことを 示 しています ここでいう 統 計 学 的 有 意 差 とは 発 現 が 変 動 したものだけを 抽 出 したデータと マイクロアレイ 上 の 全 データという2つのグループの 遺 伝 子 に 対 して 各 GOカテゴリーの 該 当 遺 伝 子 数 を 数 え その 数 に 偏 りがあるかを 検 定 したものです つまり この 検 定 で 有 意 差 があれば 発 現 が 変 動 した 遺 伝 子 群 において 有 意 に 機 能 するGOカテ ゴリーとして 解 釈 ができます 17
さらに catalytic activity より 下 の 階 層 を 見 てみますと 様 々な 触 媒 活 性 についてのGO カテゴリーがあることが 分 かります catalytic activityの 下 位 階 層 画 面 様 々な 分 子 間 結 合 についてのGOカテゴリーがありますが そのなかでも 特 にP-valueが 小 さいものに hydrolase activity ( 赤 線 で 囲 んだ 領 域 )があります catalytic activity の みの 方 がP-valueは 小 さいのですが こちらの 方 が 機 能 としてより 具 体 的 で 分 かりやすくなっ ています 各 GOカテゴリーは + が 付 いている 場 合 より 下 位 の 階 層 が 存 在 するということなので もちろんこの hydrolase activity にも 下 位 階 層 が 存 在 します hydrolase activityの 下 位 階 層 画 面 hydrolase activity の 下 位 に 属 するGOカテゴリーのなかで Z-scoreが0より 大 きく なお かつP-valueが0.05 以 下 のものは hydrolase activity, acting on ester bonds ( 赤 線 で 囲 んだ 領 域 )のみでした また ここでGOカテゴリー 名 をダブルクリックすると このGOカテゴ リーをもつ 遺 伝 子 の 実 験 データが 右 側 領 域 に 表 示 されます このように 自 分 の 興 味 のあるカテゴリーについて 階 層 構 造 をたどっていき そのなかで Z-scoreが 大 きく かつP-valueのより 小 さいGOカテゴリーを 選 択 していくことによって より 具 体 的 で 統 計 学 的 に 有 意 なGOカテゴリーを 見 つけることができます またBrowser 上 部 のKeyword 欄 に 自 分 の 調 べたいカテゴリー 名 を 入 力 し 検 索 を 行 うこと で 目 的 のGOカテゴリーの 解 析 データを すぐに 調 べることができます 18
GO Term List Gene Ontology Browserでは 自 分 の 興 味 のあるカテゴリーについてP-valueなどを 参 考 にし て 階 層 をたどっていき 有 意 なGOカテゴリーを 見 つけるという 方 法 をとりました しかし この 方 法 では 階 層 を1つ1つたどっていかなければならないので 多 数 の 機 能 について 解 析 を 行 う 場 合 には 不 向 きです この 問 題 を 解 決 するために 取 り 入 れたのがGO Term List 機 能 です 1まず Gene Ontology 解 析 ウインドウで GO Term List ボタンをクリックします しばらく 待 つと 右 図 のような 出 力 項 目 選 択 画 面 が 表 示 されます ここでまず 遺 伝 子 IDのみ を 選 択 し OKボタンをク リックすると 計 算 が 始 まります 計 算 が 終 了 すると 以 下 のような 画 面 が 表 示 されます このリストは 全 てのGOカテゴリーをP-valueの 小 さい 順 に 並 び 替 え 右 側 の 領 域 には 各 GOカテゴリーをもつ 遺 伝 子 のIDが 表 示 されます つまり 統 計 学 的 に 有 意 なGOカテゴリー の 統 計 データと その 該 当 遺 伝 子 の 識 別 番 号 が 一 目 で 確 認 できます また 出 力 項 目 選 択 画 面 で 実 験 データとアノテーション を 選 択 した 場 合 以 下 のよう な 画 面 が 表 示 されます GOカテゴリー 1つ 分 GOデータ 実 験 データ このリストも 全 てのGOカテゴリーをP-valueの 小 さい 順 に 並 び 替 えて 表 示 します 先 の リストとの 違 いは 該 当 遺 伝 子 のIDではなく 実 験 データを 全 て 表 示 することです その ため 1つのGOカテゴリーに 該 当 する 遺 伝 子 の 実 験 データが 複 数 行 にわたって 表 示 されます 19
2 表 示 されたGO Term Listは 左 上 のファイル(Z) で 保 存 (Y)することができます 表 示 されている 情 報 がそのまま 保 存 されます 3 右 図 は 出 力 項 目 選 択 画 面 で 遺 伝 子 IDのみ を 選 択 し 保 存 したデータをエクセルで 開 いたものです GO Termの 横 に 該 当 データが 表 示 されます 4このリストから 希 望 のデータを 抽 出 したい 場 合 エクセルのオートフィルタ 機 能 を 使 用 します 右 図 の 様 にデータタイトル 行 を 選 択 し データ(D)のフィルタ(F)でオートフィルタ(F) を 選 択 します 5 選 択 後 は 各 列 のタイトル 行 にオートフィルタ の 機 能 が 追 加 されます 65で 追 加 したオートフィルタの 機 能 を 用 いて リスト 内 から Z-score>0 かつ P-value<0.01 を 満 たすGOカテゴリーのみを 抽 出 します まずP-valueの 列 の をクリックしてください すると 右 図 のように 列 内 の 値 が 表 示 されます そして ここで(オプション )をクリックすると オートフィルタ オプションが 表 示 されます オートフィルタ オプションで 右 図 のように 数 値 と 条 件 を 入 力 し OKボタンをクリック します Z-scoreの 方 も 条 件 を 変 えて 同 様 の 操 作 をします 前 述 の 条 件 Z-score>0 かつ P-value<0.01 で 抽 出 を 行 うと 右 図 のような 結 果 になり ました 以 上 抽 出 した 発 現 変 動 遺 伝 子 に 対 して Gene Ontology 解 析 を 行 うことによって 発 現 変 動 遺 伝 子 がどのような 機 能 をもっているのかを 調 べることができました 本 解 析 は 薬 物 投 与 によって 発 現 量 が 増 加 した 遺 伝 子 に 対 する 機 能 解 析 なので この 薬 物 は マウスに 投 与 すると6の 図 のGOカテゴリーにある 作 用 を 発 揮 するものと 考 えられます 20
7. 抽 出 した 遺 伝 子 のパスウェイ 解 析 絞 り 込 んだデータについて どのようなパスウェイと 関 連 のある 遺 伝 子 が 多 いのかを 調 べる ためにPathway 解 析 を 行 います 1 Filter Optionsでデータの 絞 り 込 みを 行 います ここでは6. 抽 出 した 遺 伝 子 の 機 能 解 析 のときに 指 定 した 条 件 をそのまま 使 用 します 2 Pathway 解 析 アイコン をクリックし Pathway 解 析 ウインドウを 開 きます Gene Ontology 解 析 と 同 様 データの 出 力 形 式 を 選 択 することができます またここで 選 択 できる 項 目 は Gene Ontology 解 析 とほぼ 同 じ 機 能 をもっています GenMAPP Pathway Browser 本 機 能 は 全 てのパスウェイを 階 層 構 造 で 表 示 し 同 時 に 該 当 遺 伝 子 数 や 統 計 学 的 有 意 確 率 も 表 示 します この 階 層 構 造 はパスウェイをカテゴリーごとに 分 類 したものであり 一 番 下 の 階 層 に 正 式 なパスウェイ 名 のデータが 表 示 されます 1まず Pathway 解 析 ウインドウで GenMAPP Pathway Browser のアイコンをクリック します その 後 計 算 が 始 まり 計 算 が 終 了 すると 以 下 のような 画 面 が 表 示 されます GenMAPP Pathway Browserでは 最 初 は1つのカテゴリーしか 表 示 されません カテゴリー 名 の 前 にある + をクリックしていくたびに 下 位 のカテゴリーが 表 示 されていきます まず 最 初 に GenMAPP の 前 の + をクリックすると 以 下 のような 画 面 が 表 示 されます 21
ここで 表 示 される4つのカテゴリーは パスウェイの 情 報 源 に 基 づくカテゴリーです それぞれ 以 下 のような 特 徴 があります Contributed: 既 知 の 分 子 間 相 互 作 用 情 報 をパスウェイごとに 分 類 し 図 で 表 したものです GenMAPPのパスウェイデータというと この Contributed を 指 すことが ほとんどです GO samples:gene Ontologyでの 分 類 をより 簡 潔 に 表 したものです 分 類 の 数 は 多 いの ですが この 図 には Contributed のような 相 互 作 用 情 報 までは 記 されて いません KEGG converted:kegg (Kyoto Encyclopedia of Genes and Genomes) によるパスウェイ データを 独 自 に 編 集 したものです Contributed と 同 様 分 子 間 相 互 作 用 を 表 したパスウェイ 図 があります Tissue-specific: 特 定 の 臓 器 で 発 現 している 遺 伝 子 ごとに 分 類 したものです パスウェイ 図 は GO samples と 同 様 分 子 間 の 相 互 作 用 までは 記 されていません それでは ここで Mm_Contributed の 階 層 をたどっていきましょう このカテゴリーの 下 に は さらに4つのカテゴリーがあったので この 中 の metabolic_process を 選 択 しました すると 上 図 のように 代 謝 反 応 に 関 わるパスウェイが 出 てきました そのなかでも 特 に Z-scoreが 大 きく かつP-valueが 小 さいものに Mm_Amino_Acid_Metabolism ( 赤 線 で 囲 んだ 領 域 )があります なお Z-scoreやP-valueの 意 味 は Gene Ontology 解 析 のときと 同 じです パスウェイ 図 を 見 たい 場 合 は 該 当 パスウェイ 名 を 選 択 し 右 クリックメニューの 図 表 示 (Z)を 選 択 します するとブラウザが 起 動 し パスウェイ 図 が 表 示 されます このように 分 類 されたカテゴリーから 自 分 の 興 味 のあるパスウェイを 探 し 出 し そのパスウェイに 対 する 解 析 データやパスウェイ 図 を 調 べることができます 22
GenMAPP Pathway List Pathway 解 析 でも Gene Ontology 解 析 と 同 様 に P-valueの 小 さい 順 にリスト 出 力 することが できます 1Pathway 解 析 ウインドウで GenMAPP Pathway List ボタンをクリックします するとGene Ontology 解 析 のときと 同 様 出 力 項 目 選 択 画 面 が 表 示 され るので 出 力 形 式 を 選 択 してください 遺 伝 子 IDのみ 出 力 リスト 実 験 データとアノテーション 出 力 リスト GenMAPP Pathway List も 遺 伝 子 IDのみ または 実 験 データとアノテーション の2 通 りの 出 力 形 式 を 選 択 できます また GO Term List との 大 きな 違 いは パスウェイ 名 をダブルクリックす ると パスウェイ 図 にリンクしていることです このリンクは 両 方 の 出 力 形 式 に 対 応 しており Pathway Nameの 項 ( 青 文 字 のところ)をダブルクリックするだけで 自 動 的 にブラウザが 立 ち 上 が り パスウェイ 図 が 表 示 されます 8. 結 果 MicroArray Data Analysis Tool を 使 用 し マイクロアレイデータを 解 析 することによって 1 発 現 変 動 遺 伝 子 の 抽 出 2 発 現 変 動 遺 伝 子 の 機 能 パスウェイ 解 析 を 行 うことができました 本 ソフトウェアでは 簡 単 なボタン 操 作 のみでデータの 抽 出 解 析 をおこなうことができます 今 回 は1 比 較 の 解 析 データの 進 め 方 を 説 明 しましたが 複 数 の 比 較 データを 用 いた 解 析 につ いてはVol.2でご 紹 介 いたします 23