Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Similar documents
Agilent 1色法 2条件比較 繰り返し実験なし

NGSデータ解析入門Webセミナー

PrimerArray® Analysis Tool Ver.2.2

解析法

機能ゲノム学(第6回)

機能ゲノム学(第6回)

Microsoft Word - lec_student-chp3_1-representative

GeneChip 遺伝子発現解析

ChIP-seq

ThermoFisher

2015アレイ解析プロトコル

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

講義「○○○○」

リアルタイムPCRの基礎知識

Microsoft PowerPoint - LDW.ppt [互換モード]

セゾン保険_PDF用.indd

2 3


Microsoft PowerPoint - CVM.ppt [互換モード]

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

機能ゲノム学(第6回)

<4D F736F F F696E74202D E838A B83805F D B838093FC96E55F E707074>

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Rの基本操作

サイボウズ ガルーン 3 管理者マニュアル

P indd


85

1


1 2 STEP 1 STEP 2 STEP 3


untitled

H1_H4_ ai

今日からはじめるプロアクティブ

制御盤BASIC Vol.3

altus_storage_guide

1

Microsoft PowerPoint - talk pptx

統計的データ解析

テイカ製薬株式会社 社内資料

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

ビジネス統計 統計基礎とエクセル分析 正誤表

EBNと疫学

CycleavePCR® 呼吸器系感染症起因ウイルス検出キット Ver.2(製品コード CY216) 補足

第4回

PowerPoint プレゼンテーション

Microsoft PowerPoint - SDF2007_nakanishi_2.ppt[読み取り専用]


好きですまえばし


GWB_RNA-Seq_

Cycleave®PCR 呼吸器系感染症起因菌検出キットVer.2(製品コード CY214) 補足

PrimerArray Analysis Tool Ver.2.1

Microsoft PowerPoint - pr_12_template-bs.pptx

解析センターを知っていただく キャンペーン

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

画像類似度測定の初歩的な手法の検証

スライド 1

PowerPoint プレゼンテーション

スライド 1

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

はじめに 実験 血漿由来 mirna の白血病マーカー探索などをはじめとして ( Tanaka M. et al., 2009) 体液中に含まれる RNA が病態 の変化に関与していることが知られています 近年ではさらに 体液中の細胞外小胞 特にエクソソームに含まれる RNA が細胞間の情報交換を担

Microsoft Word - 卒論レジュメ_最終_.doc

RNA-seq

数値計算法

< 染色体地図 : 細胞学的地図 > 組換え価を用いることで連鎖地図を書くことができる しかし この連鎖地図はあくまで仮想的なものであって 実際の染色体と比較すると遺伝子座の順序は一致するが 距離は一致しない そこで実際の染色体上での遺伝子の位置を示す細胞学的地図が作られた 図 : 連鎖地図と細胞学


Microsoft PowerPoint - 資料04 重回帰分析.ppt

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

PRESS RELEASE (2014/2/6) 北海道大学総務企画部広報課 札幌市北区北 8 条西 5 丁目 TEL FAX URL:

Microsoft PowerPoint - statistics pptx

untitled

untitled


untitled

QuickPrimer 結果判定用エクセルシート は QuickPrimer (Real Time) シリーズ病原因子遺伝子検出用 ( 製品コード MR101 ~ MR107 MR109 ~ MR113) および細菌遺伝子 (16S rdna) 検出用 ( 製品コード MR201 ~ MR205 M

DL_Tool B J

Microsoft PowerPoint - WAK Flow H20 [互換モード]

Vol.7

コンピュータ応用・演習 情報処理システム

040402.ユニットテスト

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Probit , Mixed logit

Qlucore_seminar_slide_180604

次世代シークエンサーを用いたがんクリニカルシークエンス解析

<4D F736F F D208D7E959A82A882E682D18F498BC78BC882B B BE98C60816A2E646F63>

untitled

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

GWB

相互依存と交易からの利益 取引 ( 交易 ) はすべての人をより豊かにする. 実際私たちは複雑で多様な経済的相互依存関係をもつ社会に生きている. この相互依存性は特定の誰かによって意図されたものではない. 互いに取引することの利益について少し正確に考える 絶対優位と比較優位を理解する

青焼 1章[15-52].indd

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

T ダイの流動解析 HASL 社 FlatCAD を使用した池貝製 T ダイの流動解析事例 各種の樹脂粘度を考慮した T ダイの流路設計 Rich Green on Land Deep Blue in Sky and Sea 株式会社池貝開発室横田新一郎

_KyoukaNaiyou_No.4

Microsoft Word - apstattext04.docx

スペクトルの用語 1 スペクトル図表は フーリエ変換の終着駅です スペクトル 正確には パワースペクトル ですね この図表は 非常に重要な情報を提供してくれます この内容をきちんと解明しなければいけません まず 用語を検討してみましょう 用語では パワー と スペクトル に分けましょう 次に その意

Microsoft Word - SPARQアプリケーションノートGating_3.docx

Transcription:

color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 ( 実験デザイン ) を考慮して 適切な Normalization 方法を選択する必要があります ここでは color 実験の Normalization の基本的な考え方を理解するために GeneSpring GX の設定を例として 代表的な2つの Normalization シナリオを紹介します Normalization Step Normalization を行う Step は 大きく分類すると Data Transformation Per Chip Normalization Per Gene Normalization の 3 種類あります - Data Transformation の例としては バックグランド補正の結果生じたデータのマイナス (-) 値をプラス (+) 値に変換することが挙げられます - Per Chip Normalization は アレイ間のシグナル強度の系統的な誤差を補正して 生物学的な変動を抽出することが目的です - Per Gene Normalization は サンプル間の遺伝子発現の絶対値ではなく 発現パターンの違いに着目して解析し 生物学的な意味を引き出すために行います 実験デザインにあわせた設定をする必要があります これらの Normalization Step 中には 様々な Normalization のアルゴリズムが存在します 下記に Normalization Step に含まれる代表的な Normalization アルゴリズムを示します 実験デザインに応じて 適切な Normalization アルゴリズムを含んだ Step を組み合わせ Normalization シナリオを作成します Data Transformation Set measurements less than 0.0 to 0.0 バックグランド補正の結果生じ 生物学的に意味のない負 ( マイナス ) の値を引き上げます この設定では 0.0 以下の数値を 0.0 の値に置き換えます Per Chip Normalization Normalize to a median or percentile アレイごとに 測定値の median または特定の percentile の値をにそろえます Normalize to Positive Control Genes アレイごとに ポジティブコントロールの測定値の median で補正します この補正は ポジティブコントロールのターゲットとプローブが いかなる条件下でも一定量のハイブリダイゼーションを示し かつハイブリダイゼーションの効率がポジティブコントロールの遺伝子群と その他の遺伝子群で同等であるという前提に基づいています

Per Gene Normalization Normalize to median - 発現の絶対量にかかわらず 発現量の変化 ( 発現パターン ) に着目して解析する場合に使用します 明確なコントロールサンプルが存在しない場合に使用します Normalize to specific samples - コントロールサンプルに対する各遺伝子の発現量の増減に着目して解析する場合に使用します 代表的な Normalization シナリオ例 例 明確なコントロールサンプルが存在しない実験デザインの場合. Data Transformation: Set measurements less than 0.0 to 0.0 2. Per Chip: Normalize to 0 percentile 3. Per Gene: Normalize to median Data Transformation バックグラウンド値を差し引いた結果 測定値がマイナス値になる場合があります マイナス値は実験値として意味がなく また得られた数値を対数変換することができなくなります 発現をしていない意味の数値である 0 に引き上げると 数値計算上問題となるので (0 除算 ) 0 に代わり 0.0 まで数値を引き上げます Per Chip Normalization 図 に示した Raw Data の分布を表したヒストグラム ( シグナル強度を縦軸においたヒストグラム ) では 他の Sample に比べて Sample (S) のシグナル強度が 全体的に高くなっています この場合 sample の真の遺伝子発現が全体的に高いことも考えられますが この仮定が妥当なものとみなされない場合は このシグナル強度の違いは RN 抽出 ハイブリ 染色 洗浄 スキャニングのムラなどの実験誤差による影響だと考えられます Per Chip Normalization は 枚のアレイ全体のシグナルレベルを補正し 実験誤差による影響をキャンセルすることで 生物学的な変動を抽出することを目的とした Normalization です Per Chip: Normalize to median or percentile は 多数の遺伝子を網羅的に搭載したアレイデータを使った場合 大多数の遺伝子の発現量に変化がなく その Median 値 ( 中央値 ) は各アレイ間でほとんど変動しないという仮定に基づいています その仮定をもとに 各アレイでの発現強度の Median 値を使い 全遺伝子の発現強度 ( シグナル強度 ) を割って補正を行います いわゆるグローバルノーマライゼーションになります この Normalization の結果 Median が となる Normalization 値が算出され 各アレイ (Sample) 間のシグナル強度を相互比較することが可能になります ( 図 ) 2

Median ( 0 percentile) S S 2 S 3 S Raw Data S S 2 S 3 S Per Chip: Normalization to median 図. Per Chip: Normalize to median (0 percentile) 対象となる生物種の遺伝子を網羅することを目的としてデザインされたアレイでは 搭載されているプローブ数に比べて 実験に用いる Sample で真に発現している遺伝子が少ない場合があります この場合 真に発現していない遺伝子プローブが シグナル強度が低い領域に多数存在し その割合の違いが median の値に影響を与えます この影響を避けるには 発現していないとみなされる遺伝子に absent のフラグがたったプローブを除いて median を計算する方法があります またフラグが自動的に付かない数値化ソフトウェアを使用している場合は 各 Sample で適切な percentile( 例 :70 percentile) 値を検討してもよいでしょう ( 参考 ) 比較したいサンプル間で 遺伝子の発現量の median 値が一定であるという仮定が成立しない場合 Per Chip: Normalize to median or percentile は適切なアルゴリズムではありません 仮定が成立しない例として 下記の場合が考えられます. 遺伝子数が少なすぎる (Median が信頼できない ) 2. 特定の遺伝子のみを意図的に集めたテーマアレイ ( 大部分の遺伝子の発現が変化する ) 3. 大多数の遺伝子の発現を変えるような状態 あるいは処理を行った このような場合には Per Chip Normalization: Normalize to Positive Control Genes が選択肢のひとつとして考えられます Positive Control Gene は ハウスキーピング遺伝子に代表される遺伝子群 ( 常に一定のレベルで発現していることが期待される遺伝子群 ) や 一定量に調製されたスパイクコントロールサンプルに対応するプローブなどがあります ただし この方法は個々の Positive Control Gene の発現レベルが変動した場合 結果に大きな影響を与えます ハウスキーピング遺伝子群を用いる場合は できるだけ多くの Positive Control Genes を設定し その Median 値を使うと より保守的な 3

Normalization になります Per Gene Normalization Per Chip Normalization の後に サンプル間の遺伝子の発現量の違いではなく 発現パターンの変化に注目して 生物学的な意味を抽出するのを助ける目的で行います 発現量の多少にかかわらず 同じときに発現量が増えたり減ったりしている遺伝子は 機能的に近い関係にある 2 同じ転写制御の元にある 3 同じカスケードの下流にある といった仮定にもとづいて解析を行う場合に有効です 逆に この Normalization により すべての遺伝子がの周りの変動に収束するので 発現量の絶対値に注目した解析を行う場合は この Normalization Step は必要ない もしくは不適切な場合があります Per Gene Normalization: Normalize to Median は 特にコントロールサンプルが存在しない実験デザインの場合に用います Per Gene Normalization: Normalize to Median の計算例を図 2 で示します 図 2 は つの Sample 中での 遺伝子 と遺伝子 の動きを示しています 遺伝子 では S の値が 遺伝子 では S3 の値が median になります よって 遺伝子 では S の Per Chip Normalization 後の Normalized 値で各 Sample の値を 遺伝子 では S3 の Normalized 値で各 Sample の Normalized 値を割ります 結果として 遺伝子 では S の値が 遺伝子 では S3 の値が となります Per Chip Normalization を適用した段階では 発現量の絶対レベルによって Normalized 値が示されます 次に Per Gene Normalization: Normalize to Median を適用すると 全ての遺伝子がの周りの変動に収束してきます 3 (Median) 2 2 3 (Median) S S 2 S 3 S S 明確なコントロールサンプルが存在しない場合 S S 2 S 3 S S Per Gene Normalization: Normalize to median 図 2. Per Gene: Normalize to median

例 2 コントロールサンプルに対する比較実験の場合. Data Transformation: Set measurements less than 0.0 to 0.0 2. Per Chip: Normalize to 0 percentile 3. Per Gene Normalization: Normalize to Specific Samples コントロールサンプルに対する比較実験の場合は Step3 で Per Gene Normalization: Normalize to Specific Samples を適用します コントロールサンプルの各遺伝子の Per Chip Normalization 後の Normalized 値で 全 Sample の Normalized 値を割ります コントロールサンプルの Normalized 値は になります それ以外の Sample でより大きな ( 小さな )Normalized 値を得れば その Sample ではコントロールサンプルよりも発現が高い ( 低い ) ということができます Per Gene Normalization: Normalize to Specific Samples の例を図 3 に示します この例では S がコントロールサンプルであり 遺伝子 ともに S の値で各 Sample の値を割ります その結果 遺伝子 は S の値が になっています Median もしくは Specific Sample のどちらを使用した場合も Per Gene Normalization の適用により 全ての遺伝子の Normalized 値はの周りに収束してきます S S 2 S 3 S S S S 2 S 3 S S S が明確なコントロールサンプルの場合 Per Gene Normalization: Normalize to Specific Samples 図 3. Per Gene: Normalize to Specific Samples お問い合わせ先 : アジレント テクノロジー株式会社 GeneSpringサポート担当 GeneSpringテクニカルサポートURL:http://www.chem.agilent.com/cag/bsp/sig/support/j/TechSupport.asp E-mail: genespring_jp_support@agilent.com