Sequence Analysis Viewer (SAV) で MiSeq の Run 結果を評価する 小林孝史イルミナ株式会社 テクニカルアプリケーションサイエンティスト 2013 Illumina, Inc. All rights reserved. Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cbot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iselect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
Sequence Analysis Viewer (SAV) とは? イルミナが頒布している ランの状況をモニターするソフトウェア です 個別のクラスター由来の配列を参照できるわけではありません 2
Sequence Analysis Viewer (SAV) とは? SAV をインストールできる PC の条件 WindowsXP/Vista/7 が必要 イルミナ株式会社のホームページからダウンロードが可能です ( 次ページ以降参照 MyIllumina のアカウントは必要ではありません ) http://support.illumina.com/sequencing/sequencing_software/sequencing_analysis_viewer_sav/downloa ds.ilmn MiSeq や HiSeq では購入時に SAV がインストールされています 3
SAV のダウンロード およびセットアップ イルミナの website に行く (www.illuminakk.co.jp) サポート シーケンサー ソフトウェア をクリック 4
SAV のダウンロード およびセットアップ Sequencing Analysis Viewer をダブルクリック 5
SAV のダウンロード およびセットアップ Download を選択 6
SAV のダウンロード およびセットアップ ZIP 形式のインストーラー ( 最新のもの ) をダウンロードください ユーザーガイド インストーラー 7
SAV を使用する目的 A) ランが正常に行われたかを評価したい B) fastq ファイルなど大きなサイズのファイルを送る前に ランの状態を共同研究者と情報共有したい C) テクニカルサポートにランの診断を依頼したい ランのモニターに必要なファイルは下記の 3 つです : D: Illumina MiSeqOutput <Run_Folder>(MiSeq の場合 ) D あるいは E: Illumina HiSeqTemp <Run_Folder>(HiSeq の場合 ) の中の 1InterOp フォルダー ( フォルダーごと必要です ) 2Runparameters.xml 3Runinfo.xml 上記のファイルは BaseSpace でも簡単に共有可能です 8
Analysis タブ ランフォルダーを設定 (Full Path) して Refresh 9
10 Imaging タブ
11 Summary タブ
12 Quality Score の分布
Quality Score (Q score) %>=Q30: ラン中全サイクルにおいて Q30 以上でベースコールされた塩基の割合まず %>=Q30 の割合を見てランの状況を見極める 13
なぜ Q30 で評価するのか? Q Score = Phredクオリティスコアベースコールにおけるエラー率の予測指標 Phredというプログラムで算出 Q30=Quality Score 30 %>=Q30 はラン全体の平均値を示す ラン全体の値 リード毎 サイクル毎ではない %>= Q30 の値は様々な要因に左右される %>=Q30 が良ければ Run は成功 Phred Score % Error Error の確率 Q10 10% 1 in 10 Q20 1% 1 in 100 Q30 0.1% 1 in 1,000 Q40 0.01% 1 in 10,000 Ewing B, Hillier L, Wendl MC, Green P (1998). "Base-calling of automated sequencer traces using phred. I. Accuracy assessment". Genome Res. 8 (3): 175 185. 14
それぞれの装置における %>=Q30 の仕様 (PhiX を使用したデータです ) 1x35bp 2x50bp 2x100bp 2x150bp 2x250bp 2x300 GAIIx 90% 85% 80% N/A N/A N/A HiSeq High Output HiSeq Rapid Run MiSeq (MCS2.3) 90% 85% 80% N/A N/A N/A 90% 85% 80% 75% N/A N/A 90% 85% 80% 80% 75% 70% 一般的にランのサイクル数が長くなると Q score は低下します 15
良好な Q Score を得るためには 適度なクラスター密度を持つこと Bulletinを参照ください : https://my.illumina.com/myillumina/bulletin/dumedxxekueuxzo ujdr7ta/cluster-density-specifications-for-illumina-sequen サンプルの塩基バランスが良いこと ( 偏りのない配列 ) 16
サイクル毎の Q30 の見方 サイクル毎の Q30 以上の Q score でベースコールされた塩基の割合 17
サイクルごとの %>=Q30 の推移 良好なラン Read 後半まで高い %>=Q30 を維持 18
Sequence Analysis Viewer: Data By Lane 19
適正なクラスター密度を狙って実験を行う 適正なクラスター濃度でないと Q score が低くなったり % Cluster Passing Filter (% Cluster PF) が得られない可能性があります クラスター密度 (Cycle1-4 のデータで算出される ) Cluster PF の数値 ( 後で説明 ) Recommended Cluster Density Software Version (K/mm 2 ) HCS 1.4 (and later) 200-850 SCS 2.8 (and later) 100-800 MCS 2.0 (and later) 50-960 20
クラスター密度が高すぎると オーバークラスター ( クラスターができすぎ ) 隣のクラスターと区別できない (Q score 低下 ) 正しいクラスター密度が計算できない 適正なクラスター密度 隣のクラスターとの距離を保てる 21
クラスター密度が高すぎると Saturated! Q score が低くなる! 22
Sequence Analysis Viewer: Data By Cycle 23
MiSeq の試薬バージョンにより波形が異なります MiSeq の場合は Reagent のバージョンによって Intensity のカーブが異なる シグナルを取得する時間がそれぞれで異なるため V1 reagent ( 販売終了 ) HiSeq の波形に似ている V2 reagent V3 reagent 24
SAV の結果からできるトラブルシュート (MiSeq, V2 試薬を使用 ) Case1 Case2 順調なラン 短いライブラリー 一時的なフォーカス外し 試薬の送液不良 品質低下など Read の後半まで インテンシティーが なだらかに上昇する 25
Intensity 取得に不具合があったサイクルの特定 1 塩基表示に切り替え ( この場合は G) 当該サイクルの Thumbnail images を見てみる 26
流路の不具合の例 27
FWHM: フォーカスがうまく取れているかの指標 28
FWHM とは? FWHM :Full Width Half Max Intensityが最大値の半分の時のクラスターの幅数値はライブラリーの長さなどに依存します ぼんやりとした大きなクラスター 明るくシャープなクラスター 29
FWHM とは? 数値はライブラリーの長さなどに依存します 急激な数値の変化がある場合は正常にランが行われていない可能性があります 30
%Base: それぞれのサイクルの塩基のばらつき 31
塩基のばらつきに注意してクラスター密度を決定する 塩基のばらつきのよい配列 ( 全ゲノムなど ) 偏りのある塩基配列 (PCR 断片など ) 偏りのある塩基配列の場合は PhiX を入れたり密度を小さくするなど工夫が必要 詳しくは 32
Sequence Analysis Viewer: Flowcell Chart 33
Sequence Analysis Viewer: Qscore Heatmap 34
% Cluster Passing Filter 35
% Cluster Passing Filter Pass Filterしたクラスターとは? Chastity Filteringをパスしたクラスター クラスター上のシグナルの 純度 によりフィルタリング PF しないリード : Chastity<0.6のサイクルが25サイクルまでに2サイクル以上検出 完全に重なったようなクラスタは このフィルタによるフラグの有無で 選択することができる クラスター密度 (Cycle1-4 のデータで算出される ) Cluster PF の数値 (Cycle1-25 で算出される ) 36
Run の結果を評価するー Phasing/Prephasing 37
Run の結果を評価するー Phasing/Prephasing Phasing と Prephasing 1 クラスター中の数分子のサイクルの進みと遅れ ( 通常 ~0.2-0.5%) 38
Phasing と Prephasing について 一つのクラスターを形成するライブラリー鎖 (1000 分子ほど ) のうち 低い %( 通常 ~0.2-0.5%) のライブラリーは正しく反応が生じていないものがある 一つのクラスターの中のライブラリー Phasing Prephasing G C C C C C A A 39
Phasing と Prephasing の意義 Phasing と Prephasing は酵素反応や試薬 Delivery の失敗を補正する 試薬のライン中でのコンタミ (Washが不十分) 試薬の品質 ( 使用期限 ) 室内温度 装置のFC Reagent Chiller 温度 バランスの悪い塩基配列の場合計算ができない 40
おまけ ) イルミナ テクニカルサポートに SAV データの診断を依頼する 1. デスクトップシェア (GoToAssist システム ) を使用して イルミナから装置にリモート接続させていただき直接データを拝見させていただく MiSeq などの装置がインターネットに接続されている必要がある ( イルミナの website など一般的な website が閲覧できれば可能です ) 2. SAV でランを参照するのに必要なファイルをテクニカルサポートまで送付いただく D: Illumina MiSeqOutput <Run_Folder> の中の下記 4 ファイルを送付ください InterOp フォルダー Runparameters.xml Runinfo.xml SampleSheet.csv 3. BaseSpace でランをシェアいただく SAV データをダウンロードして送付いただく 41
42 BaseSpace から SAV データをダウンロードする
BaseSpaceからSAVデータをダウンロードする 43
44 BaseSpace からデータをシェアする
BaseSpace からデータをシェアする このアドレスをメールに添付して送付いただく 45
Thank You! 2013 Illumina, Inc. All rights reserved. Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cbot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iselect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
Additional Resources SAV Support Page: http://support.illumina.com/sequencing/sequencing_software/sequen cing_analysis_viewer_sav.ilmn SAV User Guide: http://support.illumina.com/documents/documentation/software_doc umentation/sav/sequencinganalysisviewer_userguide_15020619 D.pdf TechSupport Bulletin Board (on MyIllumina): https://my.illumina.com/home/index Ewing B, Hillier L, Wendl MC, Green P. (1998): Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res. 8(3):175-185 47