次世代シークエンサーを用いた がんクリニカルシークエンス解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1
がん遺伝子パネル がん関連遺伝子のターゲットシークエンス用のアッセイキット コストの低減や 研究プログラムの簡素化に有用 網羅的シークエンス解析の場合に比べて 1 遺伝子あたりのシークエンス量が増えるため より高感度な変異の検出が可能 2
変異データ解析パイプライン 1. リファレンスゲノム配列へのアライメント / マッピング 2. 変異の検出 3. アノテーション付けとフィルタリング 4. レポートの作成 3
2 次解析パイプライン VCF File シークエンスによって検出された変異のリストデータ エラーやノイズも含め 数千 数万のデータとなる場合もある 多くの場合 各変異の詳細情報 ( 遺伝子情報 臨床情報など ) は記載されていない または限定的な情報のみが記載されている 4
3 次解析パイプライン アノテーションソース VCF ファイル クリニカルレポート フィルタリング 5
VarSeq シンプルな操作で 変異データのアノテーション付け フィルタリング データの解釈が可能 ワークフローを用いたユーザー独自の解析パイプラインを作成可能 各種公共データベース ユーザー独自定義データベースによるアノテーション付け dbsnp ClinVar COSMIC 1000 Genome NHLBI 6500 Exomes SIFT and PolyPhen... など 家族内サンプルを用いたトリオ解析 がん - 正常サンプルの解析に対応 各種グラフ表示機能 LD( 連鎖不平衡 ) プロット 数値データプロット BAM ファイルプロット ( ゲノムブラウザー ) アレル配列プロット... など 6
アノテーションデータのダウンロード アノテーションデータは Golden Helix 社の サーバーから データベース管理ツールを使っ てダウンロード 各アノテーションデータは Golden Helix 社 によってデータの精査 メンテナンスが行われ ている データは生物種ごとに分類されており 解析 に使用する生物のデータをダウンロード可能 7
独自フォーマットファイルのインポート 独自フォーマットで作成された HGVD (http://www.genome.med.kyotou.ac.jp/snpdb/index.html) などの日本人変異データをインポートし 各種解析に 利用が可能 8
データ解析用アルゴリズム サンプルデータから 各種データの集計を行うための 様々な解析アルゴリズムを搭載 9
フィルタリングワークフロー フィルタリングワークフローでは フィルタリング項目が表示 フィルタリング項目は自由に追加 並べ替えが可能 フィルタリング条件を柔軟に変更し 変更結果がリアルタイムで反映される 10
グラフ表示機能 Linkage Disequilibrium( 連鎖不平衡 ) プロット 数値データプロット BAM ファイルプロット アリル配列プロット 11
製品ラインナップ OncoMD-Access VSPipeline VSReport がん関連変異データベース 変異データへのアノテーション付けに利用 臨床試験や FDA 承認薬の情報などを含む コマンドライン解析用ツール 複数サンプルデータのバッチ処理に利用 VarSeq で作成したワークフローを実行可能 ユーザー独自で構築したバイオインフォマティクス解析パイプラインに組み込んでの使用が可能 レポート作成モジュール フィルタリングを行った変異データから 疾患レポートを作成 変異と疾患との関連付けには OMIM データベースの情報を利用 遺伝子パネルを用いた解析結果のサマリーに有用 12
OncoMD-Access がん研究にフォーカスした ヒューマンキュレーションのナレッジデータベース VarSeq からアクセスし アノテーション 付けに使用可能 変異や遺伝子の 関連する臨床試験 や FDA 承認薬 さらに薬物ターゲットなど の情報を含む 13
VSPipeline 解析作業のオートメーション化に利用 作成したワークフローのコマンドプログラムをロー ドし 複数サンプルデータのバッチ処理が可能 14
VSReport OMIM データベースの情報に基づき 変異 または遺伝子の臨床情報とリンクしたレ ポートを作成 レポートには サンプル情報や実験情報な ども記載し カスタマイズも可能 15
VerSeq Viewer 無償で利用できる 専用のビューワーソフ トを使用し 解析結果の共有や視覚化が 可能 16
解析例 1 シークエンサー機種 :Illumina MiniSeq 遺伝子パネル :Illumina TruSight Cancer panel 変異コールソフトウェア :Isaac Enrichment v2.1.0 BaseSpace App 解析サンプル : 腫瘍細胞 (1 サンプル ) 日本人がん患者の腫瘍サンプルを Illumina 社の最新のシークエンサー MiniSeqと 同社の TruSight Cancer panelを用いて がん関連遺伝子のターゲットシークエンスを行った 得られたFASTQファイルは 同社 BaseSpaceプラットフォームのIsaac Enrichment v2.1.0アプリを用いて変異コールを行い アライメントデータのBAMファイルと 変異コールデータのVCFファイルを取得した 17
サンプルデータのインポート VCF ファイル サンプルの VCF ファイルのインポートと同時に BAM ファイルを関連付けることができる BAM ファイル 18
サンプルデータの表示 変異データ アライメントデータ インポートした変異データ (VCF ファイル ) と アライメントデータ (BAM ファイル ) を表示 することが可能 19
カバレッジの確認 アライメントデータから 遺伝子パネルの Target Region のカバレッジ ( リード深度 ) を確認 20
アノテーション情報の付加 Annotation データベース管理ツールから 任意のアノテーションソースを選択するだけで 自動的にアノテーション情報の付加が実行される 21
フィルタリングワークフローの作成 フィルタリング用ワークフロー アノテーションソースやシークエンス情報に基づき 任意のフィルタリングワークフローを作成する 22
クリニカルレポートの出力 レポートに含める変異を選択して クリニカルレポート を作成する 必要に応じて サンプル情報や実験情報なども記載 し テンプレートとして保存することも可能 作成したレポートは PDF ファイル出力が可能 23
解析例 2 シークエンサー機種 :Illumina HiSeq 2000 シークエンス :Exome Sequencing 変異コールソフトウェア :BWA + GATK 解析サンプル : 胃腺がん腫瘍細胞と正常細胞 ( それぞれ 1 サンプル ) 日本人胃腺がん患者の腫瘍細胞サンプルと正常細胞サンプルを Illumina 社 HiSeq 2000 を用いて全エクソームシークエンスを行った 得られた FASTQ ファイルは BWA および GATK ソフトウェアを用いて変異コールを行い それぞれのサンプルにおいて BAM ファイルと VCF ファイルを取得した 24
サンプルデータのインポート サンプルの関連情報として Tumor/Normal を選択し さらに各サンプルのどちらが Tumor または Normal なのかを指定する 25
サンプルデータの表示 変異データ アライメントデータ Tumor サンプルと Normal サンプルの両方のデータを並べて表示が可能 26
フィルタリングワークフローの作成 Tumor サンプルのフィルタリング条件 Normal サンプルのフィルタリング条件 Tumor サンプルでは検出されたが Normal サンプルでは検出されなかった変異を検索 27
アライメントデータの確認 アライメントデータで 各サンプルにおける変異をもつリード配列を確認 28
ソフトウェアの詳細は 以下の弊社 Web サイトをご覧ください VarSeq : http://www.filgen.jp/product/bioscience21-software/goldenhelix/index2.html お問い合わせ先 : フィルジェン株式会社 TEL 052-624-4388 (9:00~17:00) FAX 052-624-4389 E-mail: biosupport@filgen.jp 29