解 析 の 実 際 (Bismark) インストールするソフトウェア(インストール 上 の 注 意 ) Bismark (v0.12.5) インストールはダウンロードして 解 凍 するだけです BowWe2 (v2.2.3) インストールはダウンロードして 解 凍 するだけです SAMTools (v0.1.9) Makefile の curses を ncursesに 書 き 換 えてmakeします TrimmomaWc (v0.32) インストールはダウンロードして 解 凍 するだけです 1. Filtering poor quality reads, and reads with adapter sequences (TrimmomaWc) 2. GeneraWon of bisulfite converted genome (Bismark) 3. Genome Alignment (Bismark - BowWe) 4. MethylaWon calls (Bismark) 5. GeneraWon of genome wide tracks for visualizawon (SAMtools, Genome Browser) 詳 細 は 以 下 を 参 照 してください h7p://www.epibio.com/docs/default- source/protocols/ epignome- bioinformawcs- user- guide.pdf?sfvrsn=2 注 意 : コマンドやマニュアルは 頻 繁 に 変 わりますので 最 新 のもので 確 認 してください 本 日 のものは セミナー 時 点 で 動 作 していますが いつまで 動 くかはわかりません コマンドの 使 用 は 自 己 の 責 任 で 実 施 してください
解 析 の 実 際 2 (Bismark) 1. Filtering poor quality reads, and reads with adapter sequences (TrimmomaWc) アダプターのトリミング コマンド 例 java - jar /root/bin/trimmomawc- 0.32.jar SE - phred33 test.fastq test- trim.fastq ILLUMINACLIP:TruSeq2- SE:2:30:10 LEADING:3 TRAILING:3 MINLEN:36 & 注 ; 上 記 と 同 じコマンドが 通 るとは 限 りません マニュアルをよく 読 んで 自 分 の 環 境 に 合 わせて 書 き 換 えてください
解 析 の 実 際 3 (Bismark) 2. GeneraWon of bisulfite converted genome (Bismark) bisulfite converted genome の 作 成 1) 以 下 のイルミナのiGenome のサイトから 自 分 の 実 験 に 該 当 する 参 照 配 列 をダウンロードします かなり 時 間 がかかります h7p://support.illumina.com/sequencing/sequencing_solware/igenome.ilmn コマンド 例 wget lp://igenome:g3nom3s4u@ussd- lp.illumina.com/homo_sapiens/ucsc/ hg19/homo_sapiens_ucsc_hg19.tar.gz tar zxvf Homo_sapiens_UCSC_hg19.tar.gz /Homo_sapiens/UCSC/hg19/Sequence/Chromosome というフォルダー 内 に ゲノム 配 列 があることを 確 認 する
解 析 の 実 際 4 (Bismark) 2. GeneraWon of bisulfite converted genome (Bismark) ( 続 き) 2) bisulfite converted genome を 置 くファイルを 作 成 する mkdir p Genome/Bisulfude/hg19 3) Homo_sapiens/UCSC/hg19/Sequence/Chromosome/ の 中 のクロモソームを 含 む fastaファイルをgenome/bisulfude/hg19にコピーします cp /Homo_sapiens/UCSC/hg19/Sequence/Chromosome/*fa Genome/Bisulfude/hg19 4) bisulfite converted genome の 作 成 bismark_genome_preparawon - - verdose Genome/Bisulfude/hg19 - - bowwe2 - - path_to_bowwe /usr/local/bin - - verdose にはbisulfite converted genome を 置 くファイルを - - path_to_bowweにはbowwe2 が 置 かれているファイルを 指 定 します
解 析 の 実 際 5 (Bismark) 2. Genome Alignment (Bismark - BowWe2) ( 続 き) 1) Bismark (bowwe2) によるアラインメント Perl のモジュールのGD::Graphを 最 初 にインストールしておかないと 結 果 のグラフが 出 てきません あらかじめ gd とgd- devel をインストールしておき perl MCPAN e shell cpan> upgrade RHELとか CentOS 系 はこのあたりのパッケージの cpan> install YAML 依 存 性 が 壊 れていて 構 築 にそれなりに 工 夫 が 必 要 cpan> GD です 詳 細 は 個 別 にお 問 い 合 わせください Cpan> GD::Graph でperl のモジュールをインストール zlib, libpng, freetype, jpeg, xpm 関 連 のライブラリも 一 緒 にインストール コマンド: bismark - q - - bowwe2 - - path_to_bowwe /root/bin/ Genome/Bisulfide/hg19 - - 1 test1-2.fq - - 2 test2-2.fq - q fastq の 場 合 - - phred64- quals クオリティスコア phred64 を 使 用 している 場 合 - - path_to_bowweにはbowwe が 置 かれているファイルを 指 定 Genome/Bisulfide/hg19 bisulfite は converted genome の 場 所
解 析 の 実 際 6 (Bismark) 2. Genome Alignment (Bismark - BowWe2) ( 続 き) 1) Bismark (bowwe2) によるアラインメント ( 続 き) コマンド 例 : bismark - q - - phred64- quals - - bowwe2 - - path_to_bowwe /root/bin/ Genome/Bisulfide/hg19 - - 1 test1-2.fq - - 2 test2-2.fq うまくいば *.png *.sam *.txt の3つのファイルができているはず 2) duplicate 除 去 コマンド 例 : deduplicate_bismark s test1-2.fq_bismark_bt2.sam オプション - s : シングルエンドの 場 合 - p:ペアエンドの 場 合
解 析 の 実 際 7 (Bismark) 複 数 箇 所 にalign 1) Bismark (bowwe2) によるアラインメント ( 続 き) *alignment_overview.png の 結 果 Alignしなかったもの 1 箇 所 にalign h7p://www.bioinformawcs.babraham.ac.uk/projects/bismark/bismark_user_guide.pdf
解 析 の 実 際 8 (Bismark) 3. メチル 化 部 位 の 検 出 コマンド 使 い 方 : bismark_methylawon_extrctor [オプション] <ファイル 名 >.sam 以 下 でヘルプが 見 れます bismark_methylawon_extractor help more コマンド 例 bismark_methylawon_extractor - s comprehensive test1-2.fq_bismark_bt2.duplicated.sam - s : シングルエンドの 場 合 - p:ペアエンドの 場 合 - - comprehensive 結 果 の 出 力 形 式 の 指 定 ヘルプを 参 照 以 下 のような 接 頭 文 字 をもつ 出 力 ファイルが3つできる CpG_content_...txt CHG_content_...txt CHH_content_...txt これらのデータから 情 報 を 抽 出 して いろいろな 統 計 情 報 を 作 れる
解 析 の 実 際 9 (Bismark) 4. メチル 化 部 位 の 視 覚 化 コマンド 使 い 方 : bismark_methylawon_extrctor [オプション] <ファイル 名 >.sam 以 下 でヘルプが 見 れます bismark_methylawon_extractor help more コマンド 例 bismark_methylawon_extractor - s - - bedgraph counts test- 2.fq_bismark_bt2.duplicated.sam - s : シングルエンドの 場 合 - p:ペアエンドの 場 合 - - bedgraph counts できた *.bedgraph ファイルをUCSC Genome Browser などで 視 覚 化 できます
解 析 の 実 際 10 (Bismark) 4. メチル 化 部 位 の 視 覚 化 ( 続 き) bedgraphの 中 身 はこんな 感 じです (このあとは, RやPerlなどでいろいろ 処 理 できます ) # head test- 2.fastq_bismark_bt2.deduplicated.bedGraph track type=bedgraph chr21 1050344 1050345 0 chr21 1050919 1050920 0 chr21 1050920 1050921 50 chr21 1050987 1050988 100 chr21 1050988 1050989 50 chr21 1051049 1051050 100 chr21 1051238 1051239 100 chr21 1051282 1051283 100 chr21 1051395 1051396 100 メチル 化 率 大 体 1 千 万 箇 所 くらい ありました
解 析 の 実 際 11 (Bismark) ここで 取 り 込 んだ 4. メチル 化 部 位 の 視 覚 化 ( 続 き) メチル 化 部 位 を bedgraph で 以 下 のような 感 じで 閲 覧 できます(UCSC Genome Browser) 参 照 できます
解 析 の 実 際 12 (Bismark) 4. メチル 化 部 位 の 視 覚 化 ( 続 き) IGVによる 視 覚 化 例 h7p://nbviewer.ipython.org/urls/dl.dropboxusercontent.com/u/115356/ip/claire/ Larv_BS_Workflow_Example- IGV.ipynb
解 析 の 実 際 13 (Bismark) 4. メチル 化 部 位 の 視 覚 化 ( 続 き) M- biasの 出 力 結 果 メチル 化 の 偏 りが 確 認 できる h7p://www.bioinformawcs.babraham.ac.uk/projects/bismark/bismark_user_guide.pdf
解 析 の 実 際 14 (Bismark) インストールや 解 析 に はまりどころが 結 構 ある Perl のモジュールのGD::Graphをインストールしないと グラフの 出 力 ができないが RHEL では パッケージの 依 存 性 が 壊 れているようで yum でエラーが 出 る 特 定 のパッケージをウェブ 上 で 検 索 し rpmコマンドをつかってインストールする 必 要 があった その 後 perl - MCPAN - e shell でインストール (Ubuntu などでは 未 確 認 ) 時 間 がかかる( 時 間 のオーダー 1プロセス 数 時 間 ) メモリもかなり 必 要 ( 数 百 ギガのオーダー)
解 析 の 実 際 15 (Bismark) このあとすること (RNA- Seq や ChIP- Seqでの 作 業 と 類 似 ) 1 アノテーション genes.g refflat.txt から 情 報 を 抽 出 して bash, perl/python/ruby などでスクリプトを 作 って 注 釈 をつけま す Methylkit などRのパッケージ 他 も 使 えます 2 differenwal methylawon 各 実 験 区 のbedGraph をマージして 変 動 比 を 出 し 統 計 解 析 3 機 能 解 析 GO 解 析 とか パスウェイ 解 析 とか (DAVIDなどをつかって ) 4 モチーフ 解 析 WebLogo, MEME
解 析 の 実 際 次 世 代 シーケンサーによる 網 羅 的 メチル 化 解 析 (RRBS Sure Select Methyl- Seq) 現 状 で 定 量 性 を 持 たせるには かなりのリード 数 が 必 要 データ 解 析 もかなりのパワーを 要 する 現 状 で 多 検 体 の 解 析 に 向 くか どうか 厳 しい ところ
今回の解析で用いた 解析サーバーのスペック HP ProLiant DL980G7 CPU:80コア メモリ 2TB RHEL6.4 HP様のご協力に大変感謝いたします