GeneSpring GX11.0.2 ビギナーズガイド Agilent 1 色法 2 条件の比較繰り返し実験あり 適用 薬剤非投与と投与の解析 Wild type と Knock out の解析 正常細胞と病態細胞の解析 など ビギナーズガイドは 様々なマイクロアレイの実験デザインがあるなかで 実験デザインの種類ごとに適切なデータ解析の流れを 実例とともに紹介するガイドブックです ご自分の実験デザインに適合したガイドをお使いください
解説用のデータについてこのガイドでは NCBI GEO の GSE23072 を使用しています コントロール群 薬剤投与群 生理食塩水投与 エストラジオール投与 24 時間後 子宮組織から Total RNA 抽出 エストラジオール投与による子宮組織の遺伝子発現はどのように変化するだろうか?
解析手順とグラフイメージ エクスペリメントの作成 データインポート ノーマライズ QC とフィルタリング 低品質サンプルの除去 低品質プローブの除去 発現差解析 統計検定 平均値の変化 生物学的な解釈 GO 解析
プロジェクトの作成 Project メニュー /New project から新しいプロジェクトを作ります 作成したプロジェクトにはアレイプラットフォーム 生物種に関係なくエクスペリメントを作成することができます プロジェクト名を入力 プロジェクト データの階層構造の概念図 エクスペリメント アレイ 1 エクスペリメント アレイ 5 アレイ 2 アレイ 3 アレイ 4 アレイ 6
エクスペリメントの作成 プロジェクトの作成後 下記のウィンドウが開きます または Project メニューの New experiment からも同様の操作ができます エクスペリメント名の入力 プラットフォームの選択 Agilent Single Color ワークフローの選択 Advanced を選択
データインポート Choose Files ボタンから インポートしたい FE のテキストファイルを指定します Shift キーを押しながら インポートしたいサンプルを選択し 開くボタンをクリック
フラグの設定 各プローブに付加された FE の QC 情報を基に各プローブに Present Marginal Absent の評価を行います デフォルトが Agilent 推奨です シグナル検出できないプローブは Marginal データの品質が悪いプローブは Absent
ノーマライズオプション アレイ間の誤差を補正するノーマライズの設定を行います 整数で 1 以下の値は全て 1 に補正します ノーマライズ法を選択 Agilent では 75Percentile で Percentile Shift を推奨しています
ノーマライズの概要 Percentile shift とは 各サンプルの 75 パーセンタイルを揃えることで アレイ間の誤差を補正します 補正後は 75 パーセンタイルが 0 になります ノーマライズ前 ノーマライズ後 75 パーセンタイル 各サンプルの 75 パーセンタイル値を揃える 各サンプル 各サンプル
ベースライン補正 2 条件の比較の場合は ベースライン補正を使用しないほうが 元データに近い値を閲覧できます Do not perform~ にチェックしてください その後 Finish をクリックするとエクスペリメント作成が始まります ここでは使用しませんが ベースライン補正の詳細はベーシックトレーニングテキスト等をご参照ください http://www.chem.agilent.com/ja-jp/general/pages/generic35455.aspx GeneSpringGX11/ ドキュメント以下にあります
初めて解析する際の注意 GeneSpringGX で初めてアレイ解析をする際はテクノロジーのダウンロードが必要です 下記のポップアップが表示された場合は はい をクリックしてダウンロードを行ってください ダウンロードにはネットワークの速度により 時間がかかる場合があります テクノロジーとは アレイに搭載されているプローブの遺伝子名や染色体の位置情報等をまとめたデータです
実験条件の入力エクスペリメントグルーピング どのアレイがコントロールサンプルで どのアレイが薬剤投与サンプルかを入力します Samples GSM568946_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_1.txt GSM568947_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_2.txt GSM568948_US22502532_251486821582_S01_GE1-v5_95_Feb07_1_3.txt GSM568952_US22502532_251486821583_S01_GE1-v5_95_Feb07_1_3.txt GSM568953_US22502532_251486821583_S01_GE1-v5_95_Feb07_1_4.txt GSM568954_US22502532_251486821584_S01_GE1-v5_95_Feb07_1_1.txt Treatment type Control Control Control Estradiol Estradiol Estradiol
入力手順 Add Parameter をクリック パラメータ名と条件を入力する パラメータ名を入力 条件を入力するこの場合は Control と Estradiol
インタープリテーションの作成 各アレイにはマウスの個体差や実験誤差が含まれるので 各条件の繰り返し実験を平均値化してから薬物投与の効果を評価します 繰り返し実験があると統計検定が可能になります 繰り返しが無いと統計検定ができません
インタープリテーションとは 繰り返し実験があれば同じ群で平均値化するなどして ユーザーが解析したいデータを表示する設定項目です コントロール群 薬剤投与群 アレイ 1 アレイ 4 アレイ 5 アレイ 2 アレイ 3 アレイ 6 インタープリテーションの設定 平均値 比較 平均値
インタープリテーションの作成手順 1 Workflow メニューから Create Interpretation をクリック
インタープリテーションの作成手順 2 Treatment type にチェック 適宜設定して Next 表示したくない条件があったらチェックを外す
インタープリテーションの作成手順 3 Finish をクリック 平均値化され 表示が変わります
数値の表示について GeneSpringGX で通常表示される数値は全て Log2 の値です このデモデータの場合 Percentile shift した値が 0 になります 75 Percentile
スキャッタープロットの表示 横軸にコントロール 縦軸に薬物投与のデータをプロットします 中心線から大きく離れた点が大きく変動した遺伝子になります 高い 薬剤投与して発現量が上がった遺伝子 薬剤投与群の発現量 このライン上は発現変動なし 低い 薬剤投与して発現量が下がった遺伝子 低い コントロール群の発現量 高い
あらかじめ注目している遺伝子を探す Ctrl キー +F で検索ウィンドウが開くので遺伝子名を入力して下さい Trim25 がハイライトされる エストロゲンに反応する Trim25 遺伝子を入力
グラフの画像をファイルとして取得する グラフ上を右クリックして開くメニューから Export As Image を選択すると ファイル名を決定して保存することができます ファイル名を決める
アレイデータの品質チェック
3D PCA 3D 空間で X 軸を見た場合に コントロール群と薬剤投与群が左右に分かれていれば サンプルへの影響は薬剤投与が一番大きいということになり 良いデータだと言えます 実験誤差や 個体差の影響が薬剤投与よりも大きい場合は 影響の大きい要因が X 軸に表示されます 薬剤投与群 コントロール群 X 軸を水平にする Ctrl キーを押しながらドラッグすると 3D の方向を変えられます
Quality Control Metrics Plot QC の情報をプロットした図です 全てのサンプルが似たようなプロットになっていれば問題ないといえます 3DPCA の情報とあわせて判断して下さい
信頼できないサンプルがあった場合 3D PCA や QC Metrics で信頼できないサンプルがあった場合は除去できます サンプルを左に移して OK ボタンを押すと エクスペリメントから削除されます
フィルタリング低発現プローブの除去 全てのサンプルで発現していないプローブを除去します
低発現プローブの除去 1 フィルタをかけるリストを選択 Raw Data を選択 Filter by Percentile を選択 6 サンプル中 1 サンプルでも 20Percentile 以上ならフィルタ通過させます
低発現プローブの除去 2 フィルタ結果の表示 フィルタを通過した数が閲覧できます 保存する際のリストの名前を入力できます
低発現プローブの除去 3 新しいリストが保存されました
フィルタリング - 悪いフラグの除去
悪いフラグの除去 1 フィルタをかけるリストを選択 許容できるフラグを設定 Present: シグナル検出 Marginal: シグナル非検出 Absent: データの質が悪い 6 サンプル中 1 サンプルでも上記のフラグ設定値以上ならフィルタ通過
悪いフラグの除去 2 フィルタ結果の表示 フィルタを通過した数が閲覧できます 保存する際のリストの名前を入力できます
変動遺伝子の抽出 Volcano plot Volcano Plot は統計検定と平均値の変化の 2 つの手法を使い 発現変動している遺伝子を抽出します
変動遺伝子の抽出 フィルタをかけるリストを選択する Treatment type を選択する 要注意!! Condition1 に Estradiol Condition2 に Control を選択 T-Test unpaired を選択する
T-Test の設定 Asymptotic を選択する T 値が正規分布に従うと仮定する検定 FDR を選択する多重検定による偽陽性の増加を防ぐ
結果の閲覧 フィルタを通過した数 低い P 値とはコントロール群と薬剤投与群の発現量が同じ確率を表す 低い方がよい P 値 減少 増加 高い 平均値の差 減少 増加 数が多すぎる場合など Change cut-off からカットオフ値を変更できます 今回は p<0.01 平均値 3 倍以上で設定しました
フィルタ結果 薬剤投与して発現量が上がった遺伝子 薬剤投与して発現量が下がった遺伝子
発現 Up と Down を分けたい場合 Utilities の Filter on Entity List を選択
Filter on Entity List Regulation を選択 Equals を選択 Up と入力 Up した遺伝子がハイライトされる 名前を付けて保存
フィルタ結果 発現が減少した遺伝子をリストアップしたい場合はもう一度フィルタをかけて down を入力すればピックアップできます
遺伝子リストをテキストファイルにエクスポートする エクスポートしたいリストを右クリック エクスポートしたい値にチェックを入れる エクスポートしたいアノテーションを右側に移動する OK をクリックすると指定した場所にテキストファイルが保存されます
ジーンオントロジー (GO) 解析 GO 解析は 自分がピックアップした遺伝子リストと GO コンソーシアムが定義した機能別リストの間で遺伝子の内訳がよく似ているリストを検索します GeneSpringGX GO の機能別リスト GO の response to stimulus と似ている! 注意 : アノテーションの有無により GO 解析ができないアレイも存在します
Up regulated 遺伝子の GO 解析
GO 解析手順 解析したいリストを選択 遺伝子の個数 Cell Cycle 系の遺伝子が多い 右クリックメニューの Export as text でこの表をエクスポートできます
保存結果 選択したリストの遺伝子が表示される GO 解析の結果が保存される
Down regulated 遺伝子の GO 解析 ~development 関連の遺伝子が多い
まとめ GO 解析により Cell cycle 関連の遺伝子発現が増加し それらの遺伝子をリストアップできた また細胞や組織の発達に関連する遺伝子の発現が減少した アレイ解析の後はピックアップされた遺伝子を QPCR でバリデーションを経た後に機能解析等につなげる