ChIP-seq

Similar documents
PowerPoint Presentation

RNA-seq

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

リード・ゲノム・アノテーションインポート

GWB_RNA-Seq_

NGSデータ解析入門Webセミナー

GWB

GWB

RNA-seq

ThermoFisher

PowerPoint プレゼンテーション

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

目次 Ion Reporter 概要とメタゲノム解析 Ion16S Metagenome Kit データ解析概略 解析実行手順 解析実行結果 カスタムプライマー利用時のWorkflow 作成 サポート情報 p.3 p.9 p.14 p.19 p.26 p.35 2

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

使いこなそう!CLC Genomics Workbench パート1 QCからトリミング

GWB

untitled

データ科学2.pptx

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

機能ゲノム学(第6回)

Agilent 1色法 2条件比較 繰り返し実験なし

PowerPoint Presentation

nagasaki_GMT2015_key09

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

機能ゲノム学(第6回)

PowerPoint プレゼンテーション

PowerPoint Presentation

Qlucore_seminar_slide_180604

バイオ解析チーム教育セミナーMS04

RESEARCH

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

スライド タイトルなし

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

AJACS18_ ppt

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

リアルタイムPCR実験のためのガイドライン

Microsoft PowerPoint - SDF2007_nakanishi_2.ppt[読み取り専用]

Athena の起動 デスクトップ上の Athena のアイコンをダブルクリックする もしくは スタートメニューのプロ グラム一覧から Demeter with Strawberry Pert 内の Athena をクリックする デスクトップ上のアイコン スタートメニューのプログラム一覧 プラグイン

Maser - User Operation Manual

Microsoft Word - 計量研修テキスト_第5版).doc

PrimerArray® Analysis Tool Ver.2.2

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

247.indd

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.

配付資料 自習用テキスト 解析サンプル配布ページ 2

Corporate Template 4:3 for External Use

Microsoft Word - Stattext12.doc

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

解析センターを知っていただく キャンペーン

ソフト活用事例③自動Rawデータ管理システム

人工知能補足_池村

青焼 1章[15-52].indd

Syslog、SNMPトラップ監視の設定

KEGG.ppt

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

Microsoft PowerPoint - statistics pptx

日心TWS

QNAP TurboNAS Container Station 設定手順書


Untitled

Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth

wireshark dissector with lua

Consuming a simple Web Service

SAC (Jap).indd

2015アレイ解析プロトコル

Fig. 3 Flow diagram of image processing. Black rectangle in the photo indicates the processing area (128 x 32 pixels).

特論I

発環境を準備しよう2 章開Eclipseをインストールしようそれでは Eclipseをセットアップしましょう Eclipseは Eclipse Foundationのサイトからダウンロードできます ダウンロードのページを開くと いく

PowerPoint Template

IIS8でのクライアント証明書の設定方法

Microsoft Word - manual doc

..0.._ e.qxp

1

4 5 4

h01

法人保険( )



情報工学概論

Oracle ESB - レッスン02: CustomerDataバッチCSVファイル・アダプタ

Medical3

統計的データ解析

untitled

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド

ゲートウェイ ファイル形式

EBNと疫学

RADIUS サーバを使用して NT のパスワード期限切れ機能をサポートするための Cisco VPN 3000 シリーズ コンセントレータの設定

Easy Sep

Symantec AntiVirus の設定

Microsoft iSCSI Software Targetを使用したクラスタへの共有ディスク・リソースの提供


統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

TunesGo (Win 版 ) ガイド Chapter1: 製品のインストール 1-1 製品のダウンロード 1-2 製品のインストール 1-3 製品の登録 Chapter2: データの転送 2-1 ios デバイスを PC に接続する 2-2 デバイスのメディアを itunes に転送 2-3 デ

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

基礎統計

Transcription:

ChIP-seq 1

ChIP-seq 解析原理 ChIP サンプルのフラグメントでは タンパク質結合部位付近にそれぞれ Forward と Reverse のリードがマップされることが予想される ChIP のサンプルでは Forward と Reverse のリードを 3 側へシフトさせ ChIP のピークを算出する コントロールサンプルでは ChIP のサンプルとは異なり 特定の場所に多くマップされないため バックグラウンドの分布を計算する Park, P. ChIP--seq: advantages and challenges of a maturing technology Nature Reviews Genetics, 2009, 10, 669-680 Pepke, S.; Wold, B. & Mortazavi, A. Computation for ChIP-seq and RNA-seq studies Nature methods, 2009, 6, S22-S32 2

ChIP-seq 解析原理 コントロールに対する ChIP ピークの差 コントロールに対する ChIP ピークの差を 2 項分布 負の 2 項分布やポアソン分布などに当てはめ 統計的な有意差があるかどうかを計算 ピークの精査 Pepke, S.; Wold, B. & Mortazavi, A. Computation for ChIP-seq and RNA-seq studies Nature methods, Nature Publishing Group, 2009, 6, S22- S32 3

ChIP-seq 原理少し詳細 Control サンプルがある場合 ChIP Control w1 w w 4 3 w4 w i k 1i k 2i n i k 1i k2i : i 番目のウィンドウ :ChIPサンプルのi 番目のウィンドウのリード数 : コントロールサンプルのi 番目のウィンドウのリード数 :ChIPサンプルとコントロールサンプルのi 番目のウィンドウのリードの合計数 以上から 以下の2 項分布を使って ウィンドウに含まれるリード数に応じてChIPピークがある場合の リード数を推定できます k1i r o i Bi n,, ro 1 ro k2i i 4

ChIP-seq 原理少し詳細 Control サンプルがない場合 ChIP Control サンプルがない場合は ChIP サンプルのリード数が少ないウィンドウを使って バックグラウンドとなる分布を推定します そしてウィンドウに含まれるリード数に応じて 何個のリード数から ピークを含むウィンドウとなるかを決定します 5

ChIP-seq Genomics Workbench での解析ステップ 1. バックグラウンドの分布 ( 帰無分布 ) の計算 2. バックグラウンドの分布から推定される値よりも大きな値を持つコンティグを選択 3. ピークの候補領域を選択 4. フィルタリングによってピークを精査 ピークの決定 コントロールがない場合には Ji らの方法に基づき バックグラウンドの分布を推定 Ji, H., Jiang, H., Ma, W., Johnson, D., Myers, R., and Wong, W. (2008). An integrated software system for analyzing ChIP-chip and ChIP-seq data. Nature Biotechnology, 26(11):1293--1300. 6

よいピーク??? False Positive が少ない FDR を使って検討 Forward と Reverse 側に均等にリードがマップしている ChIP のピークがある程度の長さがある Forward リード数 Reverse リード数 /(Forward リード数 + Reverse リード数 ) ピークの長さ Forward 側と Reverse 側のリードの分布が十分に離れている Forward のリードの分布と Reverse のリードの分布を検定 7

ChIP-seq 解析フロー インポート リードデータ ゲノムのインポート Quality check Quality の低い塩基 リードの排除 マッピング ゲノムへマッピング ピーク検出 ピーク検出 ピーク精査 より正確なピークの探索 アノテーション確認 ピーク配列切り出し ピーク領域の配列の切り出し エクスポート モチーフ探索 ピーク配列にモチーフ 8

ChIP-seq 解析フロー インポート Quality check マッピング ピーク検出 ピーク精査 ピーク配列切り出し モチーフ探索 9

ChIP-seq 先に説明した方法で Mapping を作成しておく Navigation Area から使用するデータを選択 Toolbox から ChIP-seq Analysis を選択 ダブルクリック ウィザードが起動し 選択したデータが選ばれていることを確認 10

ChIP-seq Control samples Use control data: コントロールサンプルの有無 Peak detection Window size: ピークを調べる際に何塩基ごとに調べていくか Maximum false discovery rate: 許容できる False Discovery rate の最大値 Shift reads Shift reads based on fragment length: ゲルから切り出した配列の長さ ピーク検出の際に この長さ 0.5 の長さ分シフトされます Background distribution Analyze each reference separately: リファレンスが複数ある場合に Background の分布をそれぞれ別に計算するかどうか 11

ChIP-seq 以下の例では Windows 1 と Windows 3 にそれぞれ 2 つずつリードがありますが これを Shift させると 以下のようになり Signal /Noise 比を増やしてピークの位置の同定が行いやすくなります リードの Shift はピーク検出の場合にのみ用いられ その後のステップでは リードは本来の位置で処理されます 12

ChIP-seq Peak refinement settings ここではこれまでのウィザードで見つかったピークの候補を精査するための設定を行います これは ChIP サンプルのみ使用するので コントロールサンプルのデータは必要ありません Boundary refinement: Filter peaks based on difference in read orientation counts:dna とタンパク結合部位の上流 下流に存在するリードの数のバランスを考慮してフィルターをかけます この値を小さく設定することで 上流 下流に存在するリード数が同じピークを検出できます Normalized difference of read counts は以下の式で計算されます Filter peaks on probability of identical locations of forward reverse reads:dna とタンパクの結合部位の上流 下流にあるリードが同じ分布からできていると帰無仮説 (Null hypothesis) を設定して Wilcoxon rank-sum 検定を行い 設定した Maximum probability よりも小さいものをピークとする 13

ChIP-seq Next で次の画面に進み データを保存する場所を決め処理開始 で 14

ChIP-seq 15

ピーク領域の Export ChIP-seq 解析後 ピーク領域のモチーフ検索を行う事が多いです そのためにピーク領域を Export し モチーフ検索のソフトウェアを利用します (GWB にはモチーフ検索は含まれていません ) ここでは ピーク領域を簡単に Export する方法をご紹介します

Extract Annotations プラグインのインポート 17

Extract Annotations 18

Extract Annotations 19

Extract Annotations 20

Extract Annotations 21

Extract Annotations Type selection Type:ChIP-seq のアノテーションは Binding site というタイプに格納されているので Binding site を選択 Name of sequences 作成されるピーク配列につける名前 後からわかりやすいように ユニークに認識できる名前をつけるため リージョンなどを含めると便利 22

Extract Annotations 23