Agilent miRNAアレイ 解析資料

Similar documents
Agilent 1色法 2条件比較 繰り返し実験なし

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

548BGeneSpring12.5

NGSデータ解析入門Webセミナー

2015アレイ解析プロトコル

Maser - User Operation Manual

PrimerArray® Analysis Tool Ver.2.2

内容 1 はじめに インストールの手順 起動の手順 Enterprise Architect のプロジェクトファイルを開く 内容を参照する プロジェクトブラウザを利用する ダイアグラムを開く 便利な機能.

ThermoFisher

目次 ページ 1. 本マニュアルについて 3 2. 動作環境 4 3. ( 前準備 ) ライブラリの解凍と保存 5 4. モデルのインポート 6 5. インポートしたモデルのインピーダンス計算例 8 6. 補足 単シリーズ 単モデルのインポート お問い合わせ先 21 2

このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

ふれんずらくらく流通図面マニュアル

2.Picasa3 の実行 デスクトップの をダブルククリック 一番最初の起動の時だけ下記画 面が立ち上がります マイドキュメント マイピクチャ デスクトップのみスキャン にチェックを入れ続行 これはパソコン内部の全画像を検索して Picasa で使用する基本データを作成するものですが 完全スキャン

Eschartマニュアル

DataWare-NETご利用ガイド

Qlucore_seminar_slide_180604

PowerPoint プレゼンテーション

EDITOR を起動する 1. MS-3 をパソコンと USB ケーブルで接続し MS-3 の電源を入れます MS-3 とパソコンを USB ケーブルで接続しなくても ライブセットの編集はできます ただし パッチをエディットした結果を保存することはできません 保存にはパソコンとの接続が必要です パッ

編集する ファイルを開く マイクロデータの設定を行うファイルまたはファイルを開きます 開かれたファイルは編集画面に表示されて ブラウザ表示した時のプレビューも同時に表示されます HTML ファイルの選択 編集する ファイルを開くためにメインメニューから ファイル 開く を選びます ファイル選択ダイア

目次 1. HLA Fusion 3.0 がインストール可能な環境 HLA Fusion 3.0 のインストール HLA Fusion 3.4 のインストール 初期設定用データベース接続 ( 初めての方のみ ) 既存データベースのUpg

RNA-seq

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

3Dプリンタ用CADソフト Autodesk Meshmixer入門編[日本語版]

ANOVA

ゲートウェイのファイル形式

住所録を整理しましょう

Manager編

PowerPoint Presentation

GWB_RNA-Seq_

電話機のファイル形式

2/17 目次 I. はじめに... 3 II. 操作手順 (Controlの場合) 断面の作成 寸法測定 異なる断面間の寸法測定 繰り返し処理...11 III. 操作手順 (Verifyの場合) 断面の作成... 1

スライド 1

Microsoft PowerPoint - Tutorial_2_upd.ppt

初めてのプログラミング

AppsWF ワークフロー設定ガイド Ver.1.1 株式会社オプロ

関数の定義域を制限する 関数のコマンドを入力バーに打つことにより 関数の定義域を制限することが出来ます Function[ < 関数 >, <x の開始値 >, <x の終了値 > ] 例えば f(x) = x 2 2x + 1 ( 1 < x < 4) のグラフを描くには Function[ x^

写真の閲覧方法 1. 閲覧する納品データの種類の選択 ( 写真 ) P3 写真の閲覧写真の閲覧写真の閲覧 2. 写真を一覧から選択 表示 3. 写真をサムネイル一覧から選択 表示 4. 写真をアルバム形式で表示 P5~ P7~ P9~ 5. 写真の便利な表示方法 拡大 / 縮小 回転 明るさ補正 6

PowerPoint プレゼンテーション

R80.10_FireWall_Config_Guide_Rev1

TunesGo (Win 版 ) ガイド Chapter1: 製品のインストール 1-1 製品のダウンロード 1-2 製品のインストール 1-3 製品の登録 Chapter2: データの転送 2-1 ios デバイスを PC に接続する 2-2 デバイスのメディアを itunes に転送 2-3 デ

ChIP-seq

<4D F736F F F696E74202D CB4967B2D8F6F93FC8AC48E8B8D9E F8E9E8C9F8DF5817A D C882F182C282A C520837D836A B2E707074>

2. FileZilla のインストール 2.1. ダウンロード 次の URL に接続し 最新版の FileZilla をダウンロードします URL: なお バージョンが異なるとファイル名が

目 次 セットアップ(windows版) 3 ソフトの起動 6 起動 製作開始まで 7 画面名称 9 製作を始める前に 9 フォトブック製作 ページに写真を配置する 10 写真の追加 10 写真の配置 画像ボックスの移動 12 画像ボックスのサイズ変更 12 フォトブック製作 自動流し込

Medical3

Microsoft Word - RefWorksコース doc

intra-mart Accel Platform — ViewCreator ユーザ操作ガイド   第6版  

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

生存確認調査ツール

ch2_android_2pri.indd

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

やってみようINFINITY-写真管理 編-

PowerPoint プレゼンテーション

ユーザ デバイス プロファイルの ファイル形式

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

OpenVPN接続マニュアル

PowerPoint プレゼンテーション

Microsoft Word - EndNoteWeb( _.doc

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

CubePDF ユーザーズマニュアル

ACD/1D NMR Processor:基本トレーニング

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

GeneSpringGX9  インストールガイド

更新履歴 変更履歴 版数 リリース日 更新内容 第 1 版 2017/5/15 第 1 版発行 第 2 版 2017/7/13 更新履歴 変更内容を追加 (2ページ) 編集の前に を追加(8 ページ ) ブロックエディタ スマートモード エディタモード の説明を追加 (10~12 ページ ) ブロッ

Rの基本操作

内容 MD00Manager とは?... MD00Manager をインストールする.... ソフトのインストール... MD00Manager の使い方.... 起動をする... 機能説明...7 機能説明 ( メニューバー )...8 機能説明 ( ステータスバー )...8 機能説明 ( コ

ZVH_VIEWER

電子版操作マニュアル スマートデバイス版

産能大式フローチャート作成アドインマニュアル

Microsoft Word - HOBO雨量専用説明書_v1.1.doc

印刷アプリケーションマニュアル

(Microsoft Word - TBC\221\200\215\354\203K\203C\203hRev,A.doc)

( 目次 ) 1. はじめに 開発環境の準備 仮想ディレクトリーの作成 ASP.NET のWeb アプリケーション開発環境準備 データベースの作成 データベースの追加 テーブルの作成

Microsoft Word - Outlook_manual doc

Microsoft Word - macマニュアル【 】.doc

概要 ABAP 開発者が SAP システム内の SAP ソースまたは SAP ディクショナリーオブジェクトを変更しようとすると 2 つのアクセスキーを入力するよう求められます 1 特定のユーザーを開発者として登録する開発者キー このキーは一度だけ入力します 2 SAP ソースまたは SAP ディクシ

やってみようINFINITY-WingFan 編-

スライド 1

Transcription:

Agilent mirna アレイ 解析資料 GeneSpring12.5 対応 2012/12/17 日本語資料

内容 はじめに...5 GeneSpring についての各種情報...5 用語解説...6 インターフェイスの説明...7 テクノロジーの作成... 10 アジレントのカタログ mirna アレイの場合 ( 初回のみ )... 10 アジレントのカスタム mirna アレイの場合 ( 初回のみ )... 10 エクスペリメントの作成... 11 ノーマライズとベースラインオプション... 13 ノーマライズの影響... 13 ベースラインオプションの影響... 14 Baseline to median of Control samples の設定方法 ( 必要な時のみ )... 15 データの見方... 16 基本的なグラフ... 17 グループの設定 (Experiment Grouping)... 19 パラメーターをファイルからインポートする ( 必要なときのみ )... 20 ブラウザでの表示順を変更する ( 必要なときのみ )... 21 Quality control on sample の PCA や 2way 実験の表示順を変更 ( 必要なときのみ )... 21 インタープリテーションの作成 (Create Interpretation)... 22 クオリティコントロール... 24 サンプルの品質管理 (Quality control on samples)... 24 3D PCA Scores... 24 Correlation plot... 24 Hybridization Controls... 25 サンプルの除外... 25 発現量によるフィルタリング (Filter Probesets by Expression)... 26 フラグによるフィルタリング (Filter Probesets by Flags)... 27 再現性によるフィルタリング (Filter Probesets by Error)... 28 解析 1 遺伝子リストの絞込み... 29 2

統計検定 (Statistical Analysis)... 29 実験デザインと利用する検定の対応... 29 t-test による検定... 30 統計検定 (t-test) の操作手順... 31 ANOVA による検定... 33 統計検定 (ANOVA) の操作手順... 34 Fold change(fold change)... 36 解析 2 クラスタリングなど... 38 クラスタリング (Clustering)... 38 k-means... 39 Hierarchical... 40 Self-Organizing Map(SOM)... 42 発現パターンの似ているエンティティの検索 (Find Similar Entities)... 43 数値パラメーターと相関するエンティティの検索 (Filter on Parameters)... 44 Principal Component Analysis( 主成分分析 )... 45 結果の解釈... 48 ターゲット mrna の予測 (Find Targeted Genes)... 48 データの準備... 48 ターゲット mrna の予測 (Find Targeted Genes) の実行... 49 GO 解析 (GO Analysis) Find Targeted Genes で得られた遺伝子リストのみ可能... 50 GO Analysis から ほしい遺伝子だけをピックアップする... 51 パスウェイ解析 Find Targeted Genes で得られた遺伝子リストのみ可能... 53 データの準備... 53 Single Experiment Analysis... 53 ゲノムブラウザ... 55 データの準備... 55 使い方... 55 参考資料... 58 便利な機能... 58 Translate 機能 遺伝子発現と mirna の統合解析に利用可能... 58 3

Export as Image... 60 Export List... 61 セレクションモードとズームモードの切り替え... 62 アノテーションの閲覧... 64 アノテーションからのエンティティの検索... 65 お問い合わせ... 66 4

はじめに GeneSpring についての各種情報 GeneSpring について情報を収集する場合は下記をご利用ください GeneSpring のヘルプページ GeneSpring の Help メニューから Documentation Index で英文の機能解説があります GeneSpring のサポートページ http://genespring-support.com/ 最新のインストーラーがダウンロードできます 要ユーザー登録 Agilent 日本の GeneSpringGX ページ http://www.chem-agilent.com/contents.php?id=27881 日本語マニュアルやデモデータなどを閲覧できます Agilent の FAQ ページ http://www.chem-agilent.com/contents.php?id=1001256 アジレントテクノロジーが作成している日本語 FAQ ページです Tomy digital biology の FAQ ページ http://www.digital-biology.co.jp/j_faq トミーデジタルバイオロジーが作成している日本語 FAQ ページです 5

用語解説ここでは GeneSpringGX で使用する用語を解説します プロジェクト (Project) ユーザーがデータを格納するワークスペースです GeneSpring を複数人で共有する場合など データを分けることができます また 用途の異なるデータは混乱を招くため異なるプロジェクトにしたほうが無難です エクスペリメント (Experiment) エクスペリメントはデータの解析単位になります 比較したいシグナルデータのインポートを行うとエクスペリメントが 1 つできます サンプル (Sample) アレイから得られたシグナルデータです シグナルデータのファイル名が Sample 名です ノーマリゼーション (Normalization) アレイ間の誤差を修正し 発現量を比較するための処理です 複数の方法が搭載されています ノーマライズはエクスペリメント単位で決定され変更することはできません パラメーター (Parameter) データを解析する上での条件の名称です ( 例 Time など ) コンディション (Condition) 設定されたパラメーター内にある条件です ( 例 1 時間 2 時間 3 時間など ) インタープリテーション (Interpretation) グルーピングと表示方法の設定です ( 例時系列での表示 性別での表示など ) エンティティ (Entity) マイクロアレイで扱われる 1 分子を指します DNA マイクロアレイはほとんどの場合遺伝子を指しますが mirna アレイや Exon アレイを使った場合はそれぞれの概念に従ってください テクノロジー (Technology) アレイに搭載されているエンティティの機能や公共 DB の ID を含んだアノテーションセットです 解析結果の解釈を得るためには十分なアノテーションが必要になります 6

インターフェイスの説明 メニュー群 アイコン群 ワークフロー プロジェクトナビゲーター ブラウザ レジェンド メニュー群 : 各操作を行うためのメニューですアイコン群 : よく使う操作はアイコン群になっていますプロジェクトナビゲーター : 自分の閲覧したいデータを選択しますブラウザ : プロジェクトナビゲーターで選んだデータが表示されますワークフロー : データ解析に関するメニューが並んでいますレジェンド : ブラウザの情報について補足がある場合 情報が表示されます インスペクター機能エクスペリメントやエンティティリストを右クリックし Inspect~ を選択すると 対象のインスペクターが開きます オブジェクトにもよりますが作成日や作成条件 解析結果などの情報が書き込まれています よくわからないデータがあった場合は ダブルクリックするか 右クリックしてください 7

プロジェクトを開く Project メニューから Open Project または を選択して開くことができます アイコンですでに作成済みのプロジェクト エクスペリメントを開くプロジェクトナビゲーターの Experiments フォルダ以下にあるアイコンをダブルクリックすると既存のエクスペリメントが開き ブラウザにデータが表示され データ解析可能な状態になります ダブルクリックで開く 8

エクスペリメントの切り替え エクスペリメントを複数開いている場合は プロジェクトナビゲーターのエクスペリメン ト名かブラウザ上部のタブをクリックで切り替えることが可能です 複数のエクスペリメントを開くと エンティティリストを共有することができます グラフ画面の切り替え 複数のグラフの切り替えはグラフ下部のタブを切り替えて行います 必要のないタブは右クリックから Close を選択して閉じることも可能です Window の並べ替え Windows メニューから Tile>Both と選ぶと 複数のグラフを一画面に並べて表示することができます 一度に閲覧できる情報量が多くなり 選択操作などが連動します 9

テクノロジーの作成 アジレントのカタログ mirna アレイの場合 ( 初回のみ ) 1. Annotations メニューから Create technology>from Agilent Server を選択 2. 開いたウィンドウから自分の microrna アレイに必要な Technology にチェックを入れます mirna アレイの Technology は 5 けたのアレイ ID と mirbase のバージョンからなっています ( 例 :21827_v15_0) 特別な理由が無ければ 最新の mirbase のデータをお使いください バージョンが変わると 計算されるシグナルも変わる場合があるので 比較するデータは同じ mirbase のバージョンをお使いください 自分の microrna アレイ ID は FE のテキストファイル名の 25 以下の 5 文字を確認します 例 )252182712910_S01_miRNA_107_Sep09_2_2.txt 3. Update ボタンをクリックすると データのダウンロードが始まります アジレントのカスタム mirna アレイの場合 ( 初回のみ ) 事前に earray からカスタムアレイのデザインファイル (GEML 形式 ) をダウンロードして下さい 1. Annotations メニューから Create technology> Custom Agilent mirna を選択 2. 開いたウィンドウで デザインファイルと対象生物種を指定し OK をクリックします 3. 数分で完了します 10

エクスペリメントの作成 解析したいシグナルデータセットをインポートすると エクスペリメントが 1 つ作成されます さらに エクスペリメント作成時にはアレイ間のノーマライズやベースライン補正などが行われます 1. Project メニューから New project をクリックし Project 名を入力します すでに Project を作成してある場合は Project メニューから New experiment をクリック 2. Create new experiment を選択 すでに作成済みのエクスペリメントを開くには Open existing experiment を選択 3. 解析条件を入力する mirna を選択 Agilent mirna を選択 Data Import Wizard を選択 4. Choose Files ボタンからテキストファイルを指定して Next 11

5. Technology を選択する 特別な理由が無ければ 最新の mirbase のデータをお使いください バージョンが変わると 計算されるシグナルも変わる場合があるので 比較するデータは同じ mirbase のバージョンをお使いください 6. ノーマライズの設定を行い Next をクリック まずは None で Experiment を作成してからデータを確認し 必要だと思われる場合はノーマライズを行ってください 7. ベースライン補正の設定を行い Finish ボタンをクリック 8. 以上でエクスペリメント作成が完了します 12

ノーマライズとベースラインオプション GeneSpring には異なるアレイ間の誤差を補正するノーマライズと ノーマライズ後のデータをパターン化して視覚的に見やすくするためのベースラインオプションがあります ここではそれぞれの影響について紹介します ここでは遺伝子発現アレイのデータを利用して説明しています ノーマライズの影響 ノーマライズなし 実験誤差と考えられるばらつき 75% 50% 25% Percentile shift 90% 各サンプルの 90% を 0 に補正 Quantile 各サンプルの全域を補正 GeneSpring は上記の様なグローバル補正のほかに 特定の遺伝子を使用して補正する Normalize to Control genes や サンプル毎に一定の数値で補正する Normalize to external value があります これらは事前に補正するための情報を必要としますが mrna の総量が大きく変わるサンプルや 網羅的ではない ある機能に特化した遺伝子のみを集めたアレイ等を利用する場合に有効です 13

ベースラインオプションの影響 Percentile shift 75% でノーマライズした後の 各ベースラインオプションの影響について紹介します ベースラインオプションは条件が多い場合にデータを単純なパターンにして解析を行うことができ クラスタリングの際などに有効です ベースライン補正なし発現量の情報は保持されているが 視覚的にパターンを見つけにくい Baseline to median of all samples 発現量の情報は失われるが サンプル間の発現比は保持される パターンを見つけやすい Baseline to median of control samples Control sample の発現量の情報は失われるが control sample からの比になりパターンを見つけやすい Control sample 14

Baseline to median of Control samples の設定方法 ( 必要な時のみ ) ベースラインオプションでコントロールサンプルを設定する際の操作方法を紹介します Baseline to median of Control samples を使いたい場合は エクスペリメント作成の際に下記の操作を行ってください 1. Baseline to median of control samples にチェックを入れる 2. 補正したいサンプルをドラッグしてハイライトしてから Assign value をクリック ドラッグ 3. コントロールに指定するサンプルを右側のウィンドウに移動して OK をクリック 4. 以上でコントロールサンプルが指定されます 2 群のデータで 2 種類のコントロールがある場合は 2-3 の操作を繰り返してください 15

データの見方 下記は本ガイドの設定に従って作成した Scatter plot です 検出していない mirna は 必ず 0.1 の値 (log2 では -3 付近 ) をとり 検出している mirna は 0 以上の値になります サンプル 1 では発現している がサンプル 2 で発現していない サンプル 1 Log2 のシグナル 両方発現している mirna 発現量が変化している場合は 真中の緑線から離れる サンプル 1 では発現していな いがサンプル 2 で発現してい る サンプル 2 の Log2 シグナルの 16

基本的なグラフ ここでは頻繁に使用する 4 つのグラフについて紹介します 巻末の参考資料にほかのグラ フの説明をのせてあります Box Whisker Plot Box Whisker Plot は複数サンプルの分布を 1 画面で閲覧することができます 中央値の揃い方やデータの対称性などをみることで ノーマライズの妥当性を判断することができます 青い四角の中央の線が中央値 上端が 75% 値 下端 25% 値になります BoxWhiskerPlot の形が大きく異なる場合は ばらつきの原因を検討してください 右クリックメニューの property から Column タブで表示するサンプルを選択できます Normalize を評価する場合は Baseline option を使用せずに Experiment を作ります Scatter plot 横軸と縦軸にそれぞれ任意のコンディションを設定すると 2 つの条件の再現性や発現量の違いを見ることができます 数値はすべて log2 の Normalize 値の表示になります View メニューから Plot Log10/Linear value で log10 や Linear のグラフを描画できます 2 色法の場合はアイコン右のプルダウンメニューから Cy3/Cy5 plot を選択できます Plot された点をダブルクリックするとアノテーションを閲覧 画面をドラッグするとエンティティを選択 Shift+ドラッグでフリーハンドで選択 選択したエンティティはエンティティリストで保存 右クリックメニューから Save Entities で 2 倍以上 2 倍以下の Entities を保存 17

Profile Plot Profile Plot は縦軸に Normalized Intensity 横軸にコンディションが設定され エンティティごとに折線グラフが描かれます Profile Plot は複数条件の発現量変化を表示することができます GX11.5 以降で numeric parameter を作成すると パラメータをスケールに合わせて表示できるようになりました 後述の Experiment grouping 機能で numeric parameter を設定する必要があります 線をダブルクリックするとアノテーションを閲覧 右クリックメニューから Properties>Visualization で Color By を選択することで 任意のコンディションの発現量で色を変えられます Venn diagram Venn Diagram は最大 4 つのエンティティリストの AND OR NOT を表示することができ リストの比較をすることができます また 図を表示した後でもドラッグ & ドロップでエンティティリストを変更することができます 興味深いエリアをクリックしてハイライトしてから ( ハイライトすると黄色く表示されます ) 左上のアイコン (Fig 赤枠 ) をクリックすると ハイライトしたエリアのエンティティリストを保存できます Venn 図からエンティティリストを作成する場合 必ずこのアイコンから保存してください 右クリックメニューの properties から Visualization タブから Select Entity lists を選択することで 比較するエンティティリストの数を変更可能 をクリックすると重なり具合を考慮した図になります 18

グループの設定 (Experiment Grouping) インポートが終わったサンプルに 実験条件を入力します 同じ処理群のサンプルは同じパラメーターを入力しておくと インタープリテーションを作成する際に平均することができます 1. ワークフローの Experiment setup から Experiment Grouping をクリック 2. Add Parameter をクリック 3. Parameter name と Parameter Values を入力 3-1 サンプル選択 3-3 値を入力 3-2 Assign value 選択 Parameter name: 任意の名称 (Time や Disease type 等 ) Parameter value: 実験条件の名称 Parameter type:normal, Disease などのカテゴリカルな値は Non-numeric で設定します 時系列等のデータは Numeric に設定し 数値のみを入力します 4. 必要なパラメーターの入力が全て終わったら OK ボタンで終了します もし変更が必要な場合は パラメーターを選択してから Edit parameter ボタンで編集してください 19

パラメーターをファイルからインポートする ( 必要なときのみ ) サンプル数やコンディションが膨大な場合 ファイルからパラメーターを取り込むことができます サンプルとコンディションの対応表をタブ区切りのテキスト (.txt) で作っておくと ウィンドウ左上のアイコン Load experiment parameter from file から取り込むことができます 例 : 下記のように情報をエクセル等で作成し タブ区切りテキストで保存する Import parameter from file アイコンから上記のテキストファイルを指定する 20

ブラウザでの表示順を変更する ( 必要なときのみ ) パラメーターのブラウザ上の表示順を変更したい場合は 並べ替えたいパラメーターを選択し Re-order parameter values をクリックしてください ポップアップしたウィンドウで表示する順番を変更することができます 上から順にブラウザでは左から並びます Quality control on sample の PCA や 2way 実験の表示順を変更 ( 必要なときのみ ) 複数のパラメーターがある場合 Quality control on sample の PCA の表示や 2way 実験での表示は Experiment Grouping での左右の順番に依存します 左側にあるパラメーターから利用していくので Move parameter left または right で利用したいパラメーターを左に寄せておくと使いやすくなります 21

インタープリテーションの作成 (Create Interpretation) 先ほど作成した Experiment Grouping の設定を使用し インタープリテーションを作成しま す これによりこの後の解析の比較解析を行うグループが決まります 1. ワークフローの Experiment setup から Create Interpretation をクリック 2. インタープリテーションを作成したいパラメーターにチェックして Next をクリック 3. Numerical か Categorical を設定する Numerical:Profile plot( 線グラフ ) の線をつないで表示 Categorical:Profile plot( 線グラフ ) の線をつなげない 4. 作成されるコンディションを確認 解析したくないコンディションがある場合 チェックを外す もし除外したい条件があれば チェックをはずす Averaged: ブラウザ上の表示の際に平均する Non-Averaged: 平均しない Both: 上記の両方を作る Use measurements flagged のチェックをはずすと任意の Flag のエンティティを除去できますが 欠損値が出現するため検定やクラスタリングできないエンティティが出てきます 22

5. 作成されるインタープリテーションの名前を確認して Finish をクリック 6. Interpretations フォルダの下にインタープリテーションが作成される 平均したインタープリテーション平均してないインタープリテーション 例 1:Numerical で 4 回繰り返した実験を平均した場合の表示 例 2:Numerical で 4 回繰り返した実験を平均しない場合 (Non-averaged) の表示 23

クオリティコントロール サンプルの品質管理 (Quality control on samples) ワークフローの Quality control から Quality control on samples をクリックします 3D PCA Scores ノーマライズする前の値での PCA の結果を表示です 各サンプルの点がコンディション別 に分かれるかどうかを確認します X Y Z の 3 軸があり X 軸で分かれたサンプルの要因が 一番影響が大きくなります Ctrl キーを押しながらドラッグすると角度を変えることができ Shift キーを押しながらドラッグすると 拡大縮小をすることができます ノーマライズ 後の値で PCA をする場合は Analysis にある Principal Component Analysis を使用します Correlation plot それぞれの Sample 間の相関係数をグラフで表示しています 相関係数が高くなるほど赤く 表示されます レプリケイト間の相関が高いか コンディション別で相関に変化があるかなどをチェックしてください 相関係数は絶対的な指標ではなく 他のサンプルと比べる場合などの相対的な指標として使用してください Color range は自動的に設定されますが range を任意に設定したい場合は Correlation plot 上で右クリックすると property が選択できるので Visualization タブから設定してください 24

Hybridization Controls アレイを作成した各メーカーが使用するコントロールプローブの値を表示します それぞれのサンプルが同じようなパターンを示していれば 均一な実験をしていると考えられます サンプルの除外今までの情報を基に除外したい sample がある場合は グラフ上で該当するサンプルを選択してから Add/Remove Samples で除外すると 指定したサンプルが除外された Experiment が再構築されます 元に戻したい場合も Add/Remove Samples で元に戻せます 注意 : ある程度解析を進めてからこのサンプルの除外操作を行うと Experiment を再構築の際に発現量も再計算されるために再構築前のデータと異なる値になる場合があります 25

発現量によるフィルタリング (Filter Probesets by Expression) 発現量の低いエンティティは再現性が低いため ある程度除去します 1. ワークフローの Quality control から Filter probe sets by Expression をクリック 2. フィルターをかけるエンティティリストとインタープリテーションを選択します 3. フィルターをかける範囲を設定して Next Raw Data:Normalize 前の値 Raw 値を用います Normalized Data:Normalized 値を用います Filter by value: 数値で範囲を設定 Filter by Percentile: パーセンタイルで範囲を設定 Upper cutoff: 最大値を設定 Lower cutoff: 最小値を設定 Retain entities in which: 指定した範囲で抽出する際の条件を設定します 上段 : インタープリテーションで定義した各コンディションから通過する % を設定下段 : すべてのサンプルから通過させる数を選ぶ 値を変更した後は 必ず Enter キーを押して設定を反映させてください 4. 結果が表示されます 設定を変えたい場合は Back 保存する場合は Next 5. 名前を確認して Finish で保存します 26

フラグによるフィルタリング (Filter Probesets by Flags) Flag はエンティティごとに付加される品質情報です Flag 情報は解析するアレイのプラットフォームで内容が異なります Agilent mirna アレイの Flag の種類 Detected: シグナルが検出された Spot Not-Detected: シグナルが検出されなかった Spot 1. Quality control から Filter Probesets by flag を選択する 2. エンティティリストとインタープリテーションを選択する 3. フィルター条件を設定して Next Retain entities in which: 指定した範囲で抽出する際の条件を設定します 上段 : インタープリテーションで定義した各コンディションから通過する % を設定 下段 : すべてのサンプルから通過させる数を選ぶ 値を変更した後は 必ず Enter キーを押して設定を反映させてください 4. 結果が表示されます 設定を変えたい場合は Back 保存する場合は Next 5. 名前を確認して Finish でエンティティリストを保存します 27

再現性によるフィルタリング (Filter Probesets by Error) 再現性の低いデータを CV 値や SD 値をもとにフィルターすることができます 1. ワークフローの Quality control から Filter Probesets by Error をクリック 2. フィルターをかけるエンティティリストとインタープリテーションを選択して Next をクリック インタープリテーションは平均化されているものを選んでください 3. フィルターの設定を行います CV 値 (0-100) か SD 値 (0- ) にチェックを入れ 数値を入力します どちらも 0 に近い値がより再現性が高くなります Retain entities in which: 指定した範囲で抽出する際の条件を設定します 上段 : インタープリテーションで定義した各コンディションから通過する % を設定下段 : すべてのサンプルから通過させる数を選ぶ値を変更した後は 必ず Enter キーを押して設定を反映させてください 4. 結果が表示されます 設定を変えたい場合は Back 保存する場合は Next 5. 名前を確認して Finish ボタンで保存します 28

解析 1 遺伝子リストの絞込み統計検定 (Statistical Analysis) 統計検定は 繰り返し実験から得られた様々な統計量を基に確率的な有意差で発現変動している遺伝子を抽出することができます 実験デザインと利用する検定の対応統計検定は 2 群比較 多群比較などで利用する手法が異なります 下記に実験デザインと利用する検定の対応表を示しました Unpaired test 例 ) 薬剤効果を比較するグループ間で個人が一致しないとき 1 パラメータ 1 パラメータ 2 パラメータ 2 条件 3 条件 2 条件以上 パラメトリックテスト ( 等分散 ) T-test unpaired Moderated t-test ANOVA 2-way ANOVA パラメトリックテスト ( 不等分散 ) T-test unpaired unequal variance ANOVA unequal variance -N/A ノンパラメトリックテスト Mann Whitney unpaired Kruskal Wallis -N/A Paired test 例 ) 薬剤効果を比較するグループ間で個人が一致しているとき 1 パラメータ 2 条件 1 パラメータ 3 条件以上 パラメトリックテスト T-test paired Repeated measures ノンパラメトリックテスト Mann Whitney paired Friedman 29

t-test による検定 t-test は繰り返し実験を行った 2 条件の発現差を検定する手法です 有意差の指標である p- value が低くなる要因は主に下記の 2 つになります 1. 検定する遺伝子の 2 条件間の平均値が大きく離れている 2. 検定する遺伝子の条件内の再現性が良い 例 : ある遺伝子の Box plot 遺伝子 A( 発現差なしと判断 ) 遺伝子 B( 発現差ありと判断 ) P=0.91 P=0.01 t-test のオプション統計検定はインプットした遺伝子の数だけ繰り返されます これにより統計検定の回数が増えると偽陽性が検出される確率もその分増えることになります 偽陽性の増加を制限するために GeneSpring には多重検定の補正 (Multiple testing correction) オプションが選択可能です デフォルトでは FDR に設定されています t-test と Fold change を組み合わせると有効繰り返し実験の数が少ない場合や 非常に再現性が高い場合などは平均値の差が 1.1 倍でも検出する場合があります この場合は後述の Fold change と組み合わせます t-test と Fold change を同時に行う Filter on Volcano plot 機能も搭載されています 30

統計検定 (t-test) の操作手順 1. ワークフローの Analysis から Statistical Analysis を選択 2. 検定するエンティティリストとインタープリテーションを選択 3. 比較する条件と検定の種類を設定 注意 : 結果で表示される Fold change の計算は Condition1/Condtion2 です Condition2 にコントロールに該当するコンディションを指定すると結果がわかりやすくなります 4. 多重検定の補正を設定する 31

5. 結果を閲覧する 値を変更した後は 必ず Enter キーを押して設定を反映させてください Result Summary( 左上 ) p-value と FC(Fold change) で段階的にフィルターした結果を表示しています たとえば P < 0.05 と FC > 2.0 に該当するセルを選択すると 右側にある Volcano plot に該当するエンティティが緑でハイライトされます ハイライトしたエンティティは Save custom list で保存することができます 検定の際 Multiple testing correction を使用した場合は Corrected p-value になります Expected by chance は予測される偽陽性 (Type I Error) の数です p-values( 左下 ) 検定を通過したエンティティです p-value の Cutoff を変更可能 Volcano Plot( 右 ) 縦軸に有意差 (-log10 p-value) 横軸に発現差 (log2 Fold change) をプロットしたグラフです 縦軸は p-value を -log10 に変換しているため 縦軸が高いほうが p-value が低いエンティティになります 6. 名前 ( 変更可能です ) を確認して Finish 7. 入力したエンティティリストの下層に検定済みの新しいリストが保存されます 32

ANOVA による検定 ANOVA は 3 条件またはそれ以上の比較で いずれかの条件で発現差がある遺伝子を検定す る手法です 1way-ANOVA や 1 元配置の分散分析と同義です 有意差の指標である p-value が低くなる要因は主に下記の 2 つになります 1. 検定する遺伝子の条件内のばらつきが小さい 2. 検定する遺伝子のサンプル全体の平均値から各条件の平均値のばらつきが大きい ANOVA は条件内のばらつきよりも サンプル全体の平均値から各条件の平均値のばらつき が十分大きい遺伝子が得られます 遺伝子 A( 発現差なしと判断 ) 遺伝子 B( 発現差ありと判断 ) P=0.45 P=0.008 ANOVA のオプション 1 統計検定はインプットした遺伝子の数だけ繰り返されます これにより統計検定の回数が増えると偽陽性が検出される確率もその分増えることになります 偽陽性の増加を制限するために GeneSpring には多重検定の補正 (Multiple testing correction) オプションが選択可能です デフォルトでは FDR に設定されています ANOVA のオプション 2 ANOVA は複数の条件を同時に比較することができ どこか 1 条件でも変動していると発現差ありとみなされます どの条件で変動しているかを確認するには ANOVA を通過した後の遺伝子リストに対して Post Hoc test を行うことで確認できます ANOVA と Fold change を組み合わせると有効繰り返し実験の数が少ない場合や 非常に再現性が高い場合などは平均値の差が 1.1 倍でも検出する場合があります この場合は後述の Fold change と組み合わせます 33

統計検定 (ANOVA) の操作手順 1. ワークフローから Statistical Analysis を選択 2. 検定を行うエンティティリストとインタープリテーションを選択 3. 検定の種類を選択する 4. Post Hoc test を選択する 各コンディションでいくつのエンティティに違いがあるかを検定することができます TukeyHSD が良いでしょう 5. 多重検定の補正方法を選択 6. ANOVA の結果に指定した条件からの Fold change を付加する事ができます ここでは Fold change でのカットオフはかかりません 34

7. 結果を確認 p-value の Cutoff を変更可能 値を変更した後は 必ず Enter キーを押して設定を反映させてください Result Summary( 左上 ) 段階的に p-value でフィルターした結果を表示しています 検定の際 Multiple testing correction を使用した場合は Corrected p-value になります Expected by chance は予測される偽陽性 (Type I Error) の数です p-values( 左下 ) 検定を通過したエンティティです Post-hoc Analysis Report( 右 ) Post Hoc test を選択した時のみ表示されます ANOVA を通過したエンティティについて Post Hoc test を行った結果を表示します 各コンディションをすべて比較し 発現差があるエンティティ数を青いセル 発現差がないエンティティを赤いセルで表示します 興味のあるセルを選択してから Save custom list をクリックするとエンティティリストとして保存されます 複数のセルを選択すると Union でマージしたエンティティリスト Intersection で重複部分のみのエンティティリストが保存されます 8. 名前 ( 変更可能です ) を確認して Finish 9. インプットしたエンティティリストの下層に結果が保存されます 35

Fold change(fold change) Fold change は発現量の変化が大きいエンティティを抽出することができます 1. ワークフローの Analysis から Fold change をクリックする 2. エンティティリストとインタープリテーションを指定する 3. 比較するコンディションを指定する Select pairing option で比較方法を 2 種類選択可能です All against single condition の場合は特定のコントロールを選択する Pairs of conditions の場合は比較するペアを選択する 注意 :Fold change の計算は Condition1/Condtion2 です Condition2 にコントロールに該当するコンディションを指定すると結果がわかりやすくなります また 画像赤枠のボタンで Condition1 Condition2 を切り替えることができます 36

4. 結果のプレビューが表示される Fold change 後のエンティティ数を表示 発現差のカットオフは変更可能 複数ペアがある場合はカットオフ可能 5. 名前を確認して Finish 6. 比較したペアごとに UP と DOWN のエンティティリストが保存されます 37

解析 2 クラスタリングなどクラスタリング (Clustering) 膨大なデータの中からエンティティやコンディションの発現パターンが似ているものを分類します コンディションが少ないものは Scatter plot や Profile plot でも変動をつかめますが コンディションが多くなるとそれぞれのエンティティの発現変動を理解しづらくなるので クラスタリングでパターン別に分けて それぞれのクラスターに 後述の GO Analysis などで意味付けしていきます クラスタリングする際の注意点 1:Baseline Transformation を利用する Baseline transformation は発現値を同じスケールに置き換えパターンに変換します この補正は個々の遺伝子の条件変化による変動を見つけやすくなります クラスタリングする際の注意点 2: はずれ値を除去するクラスタリングでは 極端な値を持つはずれ値や変動していないエンティティの影響を受けます 事前に Quality control を行い 信頼性の高い かつ変動したエンティティを絞り込むことが重要です 38

k-means K-means は エンティティまたはコンディションをユーザーが指定した K 個のクラスターに 分けるアルゴリズムです 例えば ある病態に 3 つのサブタイプが存在する という仮 説がある場合など コンディションを 3 つのクラスターに分ける K-means を実行する価値 があります 初期の K 個のクラスターはランダムに配置されるので 結果が安定しない場 合があります メモリ使用量が低く非常に処理が早いアルゴリズムですが エンティティ同士の関連やク ラスター同士の関連情報は得られません 1. ワークフローの Analysis から Clustering を選択する 2. エンティティリスト インタープリテーションを選択し K-means を選択して Next エンティティリストを指定 インタープリテーションを指定 K-means を指定 3. Parameters を設定する Cluster on: クラスタリングする対象を選択 Entities か Condition または両方 Distance metric: 距離の定義を設定します Number of clusters: クラスター数を指定します Number of iterations: クラスターを探す工程を繰り返す回数 ( 大きいほど再現性が良くなる ) 4. Preview ボタンで結果が表示されます 保存する場合は OK をクリックします 5. 名前を確認して Finish 6. 結果がプロジェクトナビゲーターに保存されます 7. 結果を右クリックして Expand as Entity list をクリックするとクラスター毎のリストが保存されます 各クラスターに後述の GO 解析やパスウェイ解析をお試しください 39

Hierarchical Hierarchical は階層的クラスタリングです エンティティとコンディションの距離をツリー で表現します 枝が近いほど似ていると解釈します 全ての関連を表示することができま すが クラスターの明確な境界が無いためその点はユーザーが判断する必要があります 1. ワークフローの Analysis から Clustering を選択する 2. エンティティリスト インタープリテーションを選択し Hierarchical を選択して Next エンティティリストを指定 インタープリテーションを指定 Hierarchical を指定 3. Parameters の設定 Normalized intensity values:normalized intensity を利用します Associated values:p-value や Fold change 等エンティティリストに付加された値を利用 Cluster on: クラスタリングする対象を選択 Entities か Condition または Both( 両方 ) Distance metric: 距離の定義を設定します Linkage rule: クラスター間を比較するためのアルゴリズムを選択します Single: クラスター間の最近のノードの距離を比較 ( 最近隣距離法 ) Complete: クラスター間の最遠のノードの距離を比較 ( 最遠距離法 ) Average: クラスター間のそれぞれのノードの平均距離を比較 ( 群平均距離法 ) Centroid: クラスター内の重心 ( 平均 ) 同士の距離を比較 ( 重心距離法 ) Ward s:anova に似たアプローチで クラスター内の誤差の平均値を計算し全体の誤差の平均値から差が小さいものを新しいクラスターに結合します 4. Preview をクリックすると 結果が表示されます 保存する場合は OK をクリックします 5. 名前を確認して Finish 40

6. 結果がプロジェクトナビゲーターに保存されます 7. 保存後は 発現量に応じた階層的クラスタリングの図が表示されます 全体図 Gene 拡大図 サンプルまたはコンディション 発現量のカラーチャート 画面左側の任意の位置のツリーをクリックすると そのツリー以下に存在する遺伝子が選 択されます アイコンで 選択した遺伝子をエンティティリストとして保存可能です 41

Self-Organizing Map(SOM) SOM はユーザーが行と列を指定したグリッドに対して 近いグリッドが近い値を持つよう に値を繰り返し更新して クラスターを作ります グリッドの隣り合ったクラスターはパターンが似ている傾向があります 1. ワークフローの Analysis から Clustering を選択する 2. エンティティリスト インタープリテーションを選択し Self-Organizing Map を選択する エンティティリストを指定 インタープリテーションを指定 Self-Organizing Map を指定 3. Parameters の設定 Cluster on: クラスタリングする対象を選択 Entities か Condition または両方 Distance metric: 距離の定義を設定します Maximum number of iterations: クラスターの更新の回数を設定 Number of grid rows: グリッドの列の数を指定 Number of grid columns: グリッドの行の数を指定 作成されるクラスター数 = 上記で指定した列 行になります 4. Preview ボタンをクリックすると結果が表示されます 保存する場合は OK をクリックします SOM の結果は 隣り合うクラスターはパターンが似ているという特徴があります 5. 名前を決めて Finish ボタンをクリックすると SOM の結果がプロジェクトナビゲーターに保存されます 6. SOM の結果を右クリックして Expand as Entity list をクリックすると各クラスター毎のリストが保存されます それぞれのクラスターに後述の GO 解析やパスウェイ解析等をお試しください 42

発現パターンの似ているエンティティの検索 (Find Similar Entities) 注目すべき発現パターンのエンティティが既にある場合 そのエンティティと似た相関ま たは逆相関する発現パターンを示すエンティティを検索します 1. Analysis から Find Similar Entities を選びます 2. エンティティリスト インタープリテーション Query Entity Similarly metric を選択します Query Entity は注目しているエンティティを Select ボタンから検索して設定してください ピアソン相関係数は線形の相関解析です 非線形の相関を解析したい場合はスピア マン順位相関係数を使用します 3. 検索結果が表示されます Cutoff 値のレンジは 1 に近いと相関 0 で相関なし -1 に近いと逆相関になります 4. エンティティリストの名前を確認して Finish ボタンでエンティティリストを保存します 43

数値パラメーターと相関するエンティティの検索 (Filter on Parameters) タイムコース実験や薬剤の投与量など量的なパラメーターがある場合 パラメーターと発現量について相関 逆相関するエンティティを検索します 時間依存で変動するエンティティや薬剤の量特異的に変動するエンティティなどの抽出が可能です 事前に Experiment Grouping で Parameter type が Numeric のパラメーターを作成します 1. Analysis から Filter on parameter を選択します 2. エンティティリスト インタープリテーション 相関を探すパラメーター Similarity Metric を選択 ピアソン相関係数は線形の相関解析なので 非線形の相関を解析したい場合はスピアマン順位相関係数を使用します 3. 結果を閲覧する Cutoff 値のレンジは 1 に近いと相関 0 で相関なし -1 に近いと逆相関になります 4. 名前を確認して Finish ボタンでエンティティリストを保存します 44

Principal Component Analysis( 主成分分析 ) PCA はアレイデータをベクトルデータとみなし 空間にプロットすることでその分布から新 たな軸 ( 主成分 ) を作ります これによりエンティティやコンディションを視覚的に分類 することができます PCA on Entity と PCA on Condition のどちらかを選べます Quality control on samples の PCA とは違い ノーマライズ後のデータを使い 使用するエン ティティリストやインタープリテーションも選択可能です 初めに Tools メニュー /Options/Data Analysis Algorithms フォルダを選択し Principal Component Analysis の 3-D Scores にチェックを入れてから Apply してください 1. Analysis から Principal component Analysis を選択 2. エンティティリストとインタープリテーションを選択 3. 各条件を設定して Next PCA on:entity か Condition を選択する ( ここでは Condition を選択 ) Number of principal components: 入力した数字だけ主成分を作成します 45

4. 結果を閲覧する PCA Scores:X 軸 (PCA Component1) と Y 軸 (PCA Component 2) の 2 次元のスキャッタープロットです 3D PCA Scores:X 軸 (PCA Component1) と Y 軸 (PCA Component 2)Z 軸 (PCA Component3) のスキャッタープロットです デフォルトでは影響の大きい X>Y>Z の順に並びます PCA Loadings:PCA on Condition を選んだ場合 各 Entity が各 PCA Component に対して持っている負荷量をプロットすることができます PCA 終了後にエンティティリストに付加される値と同じものです C-C Plot: 共分散と相関をプロットしたグラフです Eigen values: この値は各 PCA Component がデータの持つ変動を全体からどの程度説明しているかを表す寄与率です 青は累積の寄与率になります 累積寄与率が 80% 程度までの PCA Component を見れば 十分な情報を捉えていることいえるでしょう 5. Entity list の保存 NEXT をクリックすると PCA の結果を Entity list で保存できます この時 Entity list に付加される Associated value として PCA loading factor が付加されます これは各 PCA Component に対する個々の Entity のインパクトを表します 46

6. PCA の結果はプロジェクトナビゲーターに保存され ダブルクリックで結果を見ることができます 7. PCA の結果を右クリックして Expand Entity list をクリックすると エンティティリストとして結果が保存されます View メニューの Plot list associated value を使うと PCA の Loading factor をヒストグラム等で表示することができます 47

結果の解釈 ターゲット mrna の予測 (Find Targeted Genes) これまでの解析で抽出された mirna と相互作用する可能性のある Gene を探索します GeneSpring12.5 から下記の公開データベースの情報を用いることができます データの準備 micrornaorg :http://www.microrna.org/microrna/home.do PicTar :http://pictar.mdc-berlin.de/ PITA :http://genie.weizmann.ac.il/pubs/mir07/mir07_data.html TarBase :http://diana.cslab.ece.ntua.gr/tarbase/ TargetScan :http://www.targetscan.org/ ターゲット予測アノテーションのタウンロード 1. Annotations メニューから Annotations manager を選択 2. 開いたウィンドウ左上の List メニューから From server を選択 3. 目的の生物種のターゲット予測アノテーションにチェックを入れる例 )Human のアノテーション情報 4. 右下の Update ボタンをクリックしてダウンロードを行う 5. ダウンロードが完了したら終了 バイオロジカルゲノムの作成 Find Targeted Genes を行うにはその生物種の Biological genome(ncbi のアノテーション ) が必要になります ネットワーク環境によりますが かなり時間がかかります 1. Annotation メニューから Create Biological Genome を選択 2. Choose Organisms から解析する生物種を選択 3. Download from NCBI ftp site にチェックを入れ OK をクリック 4. ダウンロードが終わると 終了です 48

ターゲット mrna の予測 (Find Targeted Genes) の実行 1. Workflow の Results Interpretations から Find Targeted Genes を選択 2. 必要な情報を入力して OK ボタンをクリック mirna のリストを選択 利用したい database を選択チェックを入れると 選択した全ての database でサポートされる情報のみを出力する 3. 結果の確認 4. Entity list をダブルクリックすることで mirna と mrna の対応表を閲覧できます 49

GO 解析 (GO Analysis) Find Targeted Genes で得られた遺伝子リストのみ可能 GO(Gene Ontology project:http://www.geneontology.org/) は生物学的な語彙とそれに関連する遺伝子を収集し 遺伝子の機能や 局在 プロセスごとにカテゴライズしています GeneSpring の GO Analysis は自分の解析で得たエンティティリストが GO で分類された遺伝子のリストと偶然一致する確率を計算します 偶然一致する確率が低い (p-value が低い ) 関連が高いと解釈します 1. ワークフローの Results Interpretation から GO Analysis を選択します 2. エンティティリストを選択して Next をクリックします 3. 結果の閲覧 4. Spreadsheet の見方基本的には Corrected p-value の値が低い順に見ていきます Change cutoff ボタンをクリックすることで p-value( 実際には FDR) のカットオフを変えることができます カットオフ値を低くすると 検定はより厳しくなります GO ACCESSION:GO Term の ID GO Term:GO によって定義されたカテゴリ名 P-value:Fisher s exact test の p-value Corrected p-value:multiple testing correction 後の p-value この値で Cutoff します Count in selection: 自分のエンティティリストと GO カテゴリで重複した遺伝子数 %Count in selection: 自分のエンティティリストでその GO カテゴリに該当し割合 Count in total: All entities から その GO Term が含まれる遺伝子の数 %count in total:all entities から その GO Term が含まれる遺伝子の割合 50

5. Finish で Project Navigator にエンティティリストに保存されます GO Analysis から ほしい遺伝子だけをピックアップする自分のエンティティリストから興味のある遺伝子だけを検索する場合は 下記の方法を使用します 1. 通常通り GO Analysis を行います 2. 次に Cut off を 1 に変更します 3. GO Tree タブを選択します 51

4. 検索単語を入力して Find をクリックします 複数の GO Term がヒットする場合は Select をクリックすると すべて選択されます 5. Save custom list ボタンで保存します 注意 :Cutoff を 1 にしたまま Finish ボタンをクリックしないでください すべての GO Term が保存されるため 大幅に時間がかかります 終了する際は Cancel することをお勧めします 52

パスウェイ解析 Find Targeted Genes で得られた遺伝子リストのみ 可能 GeneSpring12 では WikiPathway に対応したことにより 自分のデータを簡単に既知のパスウ ェイにマップすることができるようになりました データの準備 インタラクション DB のダウンロード 1. Annotations メニューの Update pathway interaction/from server を選択 2. 初めてこの機能を使う場合は基本データのダウンロードが始まります 3. Interactiondb のリストが表示されたら目的の生物種を選択して Update をクリック 4. しばらくするとインポートが完了します Human などはファイルサイズが 1GB 程度あるのでかなり時間がかかります BridgeDb のダウンロード 1. Annotations メニューから Update BridgeDb/From Agilent Server を選択 2. 目的の生物種がある場合はチェックを入れ Update をクリック WikiPathway のダウンロードとインポート 1. http://wikipathways.org/index.php/download_pathways にブラウザでアクセスして目的の生物種の Pathway をダウンロードしする 2. ダウンロードしたファイルを解凍する 3. GeneSpring の Tools メニューから Import pathway from file>gpml を選択 4. 新しく開いた Import pathway 画面の Choose file(s) をクリックし 3 で解凍したファイルを指定 5. Import pathway 画面で OK をクリック 6. 生物種を確認して OK をクリック 7. しばらくするとインポートが完了します Single Experiment Analysis Single experiment analysis は自分の解析したエクスペリメント 1 つと既知のパスウェイデータとの関連を調べることができます マイクロアレイ解析では主にこちらを使います また Multi-Omic Analysis は ほぼ同じ操作で 2 つの Experiment から遺伝子リストを選び既知のパスウェイデータとの関連を調べることができます 1. ワークフローの Pathway Analysis から Single Experiment Analysis をクリック 2. 対象生物と解析対象のパスウェイを選択します 53

3. 解析するインタープリテーションとエンティティリスト 利用する ID を選択 4. 結果が表示されるので Next 5. Save pathway list が開くので 名前を決めて Finish 6. ブラウザで結果を閲覧 ブラウザ パスウェイリスト フィルタ 遺伝子リスト パスウェイリストは p-value でソートして小さい順に見てください 54

ゲノムブラウザ Technology にゲノムの位置情報があればゲノムブラウザ上にエクスペリメントを表示する ことができます 遺伝子発現だけでなく CGH のようなゲノム構造 メチル化や転写因子 といった発現制御の情報なども同時にゲノムブラウザで閲覧することができます データの準備 1. Annotations メニューから Annotations manager をクリック 2. Annotations manager が開いたら 左上の List から Annotation server を選択 3. 生物種一覧が表示されるので 必要な生物種にチェックを入れる 4. Update ボタンをクリックするとダウンロードが始まります 5. ダウンロードが終わると完了です 使い方 1. アイコンでゲノムブラウザを起動する 2. ゲノムビルドが複数ある場合は 使用するゲノムビルドを選択する 55

3. データを表示させたいエクスペリメントをブラウザにドラッグ & ドロップする 表示したいインタープリテーションとサンプルを選ぶ エンティティリストもドラッグ & ドロップでゲノムブラウザに表示させることができます 4. アノテーションを表示させたい場合は右側の Annotation タブからダブルクリックで表示する ライセンスによっては表示されないアノテーションもあります 5. ゲノムブラウザの表示は Scatter plot ですが 右クリックメニューの Edit track property でグラフタイプや軸の設定などを変更することができます 56

ゲノムブラウザ操作アイコンの説明 A B C D E F G H I J K A: ゲノムブラウザの全画面表示 B: トラックのマージ :Ctrl キーを押しながら 2 つトラックを選択してからマージします C: トラックの自動サイズ調整 D: トラックのフルズームアウト E: トラックのズームアウト F: トラックのズームイン Shift キー +ドラッグでも拡大できます G: トラックの方向切り替え H: トラックの表示順変更 I: 画像ファイルのエクスポート J: 染色体の切り替え K: 閲覧する染色体位置の指定 または Gene Symbol を入力して遺伝子の検索 57

参考資料便利な機能 Translate 機能 遺伝子発現と mirna の統合解析に利用可能同一のサンプルから mirna データと Gene Expression(mRNA) データの両方を取得した場合 mirna 解析の Find Targeted Genes で得られた遺伝子リストを Gene Expression に移動することができます アレイのプラットフォームや生物種が異なっても自動的に対応する遺伝子リストに変換する機能があります Translate の操作手順 ( 例 :A エクスペリメントから B エクスペリメントに Translate) 1. エンティティリストを Translate する先の B のエクスペリメントを選択 A B 2. A のエクスペリメントのエンティティリストを右クリックし Translate List を選択 3. ID と一緒に Translate する値を選択 Import list associated values にチェックを入れると エンティティリストに p-value や Fold change などの associated value がある場合は一緒に Translate できます Import signal values: 選択したインタープリテーションの Normalized 値か Raw 値を一緒に Translate できます 4. Translation mapping が表示される 58

Percentage of entities translated ~ で変換されたパーセンテージを確認できます この対応表を保存したい場合 図上で右クリックメニューの Export As text を使用してください 5. 名前を確認して Finish をクリック 6. B のエクスペリメントに Translate 結果が保存される Translate の注意点 アノテーションに Entrez GeneID が無い場合 利用できません Homologene(http://www.ncbi.nlm.nih.gov/homologene) で定義されていない生物種は利用できません ProbeID と Entrez GeneID が 1 対 1 ではない場合 ( ほとんどの場合 1 対 1 ではない ) Translate 前後でエンティティリストの数が変化します 59

Export as Image ブラウザ上の画像をファイルでエクスポートすることができます 1. エクスポートしたい画面上を右クリックで Export as Image をクリック 2. ファイル名の決定 画像の大きさ 解像度を指定して OK をクリックすると保存されます 60

Export List Entity List にアノテーションを付加した情報をテキストファイルでエクスポートすることが できます 論文作成や他のソフトウェアへのデータ排出に使用します 1. Entity List を右クリックで Export List 2. エクスポートしたいデータにチェックを入れます アノテーションは選択して矢印ボタンで移動することができます Selected items に含まれるアノテーションがエクスポートされます 3. ファイル名とファイルタイプを指定して保存します 61

セレクションモードとズームモードの切り替え ブラウザ上で右クリックすることで セレクションモードとズームモードを選択できます セレクションモードスキャッタープロットの興味深い分布を範囲選択することで後述の機能でエンティティリストを作ることができます ズームモード見えにくい部分を拡大する場合 ズームモードに切り替えて範囲選択することで選択した部分を拡大することができます Create Entity List from selection Scatter plot や Profile plot のブラウザで選択したエンティティをエンティティリストとして保存できます 1. セレクションモードで興味のあるエンティティを選択する 2. Create Entity list from selection をクリック 3. 名前をつけて保存する 62

Import Entity List from File 論文や参考書にある外部の遺伝子リストを GeneSpringGX にインポートします 1. インポートしたい遺伝子リストをタブ区切りテキストで準備する準備するリストには GeneSpringGX 内のデータとマッチする ID が必要です お使いのチップのプローブ ID や Entrez GeneID 等を準備してください 2. Utilities から Import entity list from file をクリックする Choose file: テキストファイルを指定 Choose column to match: テキストファイル内の ID に相当するものを選択 Choose technology column: テキスト内の ID とマッチさせる GX 内の ID を選択 Choose columns to import: テキストファイル内に ID 以外にインポートしたい情報があれば Available Items から Selected Items に移動させる 3. OK ボタンをクリックして取り込み完了 取り込めない場合は マッチさせるテキスト内の ID と GX 内のアノテーションが同じタイプの ID かどうかを確認してください 63

アノテーションの閲覧自分が解析している Technology にはどんなアノテーションが含まれるかどうかを確認します 1. Search メニューから Technology を選択 何も入力せずに Next 2. インポート済みの Technology 一覧が表示されるのでアノテーションを閲覧したい Technology を選択して Inspect ボタンをクリック 3. アノテーションを閲覧する Configure column ボタンで表示するアノテーションを選べます 64

アノテーションからのエンティティの検索 Technology に含まれるアノテーションから興味のあるエンティティを検索できます ブラ ウザ上で Ctrl キー +F でも検索ウィンドウを開くことができます 1. Search メニューから Entities を選択 2. 検索条件を決定して Next Search for: 検索するテキストを入力 検索対象のアノテーションを左から選んで右に移動します 3. 検索結果を確認して Next 4. 名前を確認して Finish で保存します 65

お問い合わせ GeneSpring のサポートは 大まかに企業ユーザーはアジレントテクノロジー アカデミックユーザーはトミーデジタルバイオロジーと分かれています ここにはそれぞれの会社のサポートと連絡先を記述しましたので ご不明な点がある場合は下記までご連絡ください 事前に GeneSpringGX のバージョンやお使いのアレイの名称を準備いただけるとスムーズに対応できますのでお手数ですがよろしくお願い致します アジレントテクノロジー株式会社 192-8510 東京都八王子市高倉町 9-1 電話 :0120-477-111 E-mail : genespring_jp_support@agilent.com 担当石井 トミーデジタルバイオロジー株式会社 110-0008 東京都台東区池之端 2-9-1 電話 :03-5834-0810 E-mail : support@digital-biology.co.jp 担当田中 高木 66