GWB

Similar documents
GWB

NGSデータ解析入門Webセミナー

GWB

次世代シークエンサーを用いたがんクリニカルシークエンス解析

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成

PowerPoint プレゼンテーション

リード・ゲノム・アノテーションインポート

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

PowerPoint Presentation

PowerPoint Presentation

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

使いこなそう!CLC Genomics Workbench パート1 QCからトリミング

GWB_RNA-Seq_

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

ChIP-seq

AmpliSeqDataAnalysis

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

RNA-seq

Microsoft PowerPoint - 3. 資料2 がんゲノム情報管理センターの進捗状況

Qlucore_seminar_slide_180604

nagasaki_GMT2015_key09

Agilent 1色法 2条件比較 繰り返し実験なし

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.


AJACS_komachi.key

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

PowerPoint プレゼンテーション

初めての方でも大丈夫、クラウドを用いた簡単クリック情報解析

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx

PowerPoint プレゼンテーション

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

スライド 1

講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2

5_motif 公開版.ppt

PowerPoint プレゼンテーション

RNA-seq

2015 年 5 月 15 日イルミナサポートウェビナー Nextera Rapid Capture Exome キットを用いたエクソームシーケンス - ドライ編 BaseSpace で行うかんたん NGS データ解析 < Enrichment アプリ > イルミナ株式会社バイオインフォマティクスサ

Sequence Read Archive 2013 年年 10 月 25 日 第 10 回シーケンサー利利 用技術講習会 ( 理理研横浜 ) 1

KEGG.ppt

成果 本研究の解析で着目したのは 25 の遺伝性疾患とそれらの 57 の原因遺伝子で これらは ACMG が推奨する 偶発的 二次的所見としての遺伝情報の結果の返却を推奨する遺伝子のセットのうち常染色体上のものに相当し 大部分が遺伝性腫瘍や遺伝性循環器疾患の原因遺伝子です 本研究では 当機構で作成し

スライド 1

PowerPoint Presentation

PowerPoint プレゼンテーション

Maser - User Operation Manual

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

KEGG_PATHWAY.ppt

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方 理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド

サンプルシート作成ツール: Illumina Experimental Manager(IEM)の使用方法 -最新バージョンIEMv1.15のご紹介-

研究成果報告書

Slide 1

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

次世代遺伝子解析装置を用いた難病研究の連携

東京医科歯科大学医歯学研究支援センター illumina Genome Analyzer IIx 利用基準 平成 23 年 10 月 1 日医歯学研究支援センター長制定 ( 趣旨 ) 第 1 条次世代型シークエンサーはヒトを含むあらゆる生物種の全ゲノム配列の決定 全エキソンの変異解析 トランスクリプ

機能ゲノム学(第6回)

直接 Reports & Statistics タブへの移動も可能です A. Publication Finder の統計を取得する Publication Finder Reports 1 Publication Finder タブが選択されていることをご確認下さい 2 下記項目を入力して下さい

課題 ips 細胞治療による悪性腫瘍発生のリスクを genetic な点から評価し 現時点のベストサイエンスの知識の中で リスクを最小限にするには? 1. ips 細胞作製 維持の過程で発生する de novo somatic changes の評価 2. ips 細胞を樹立するソースにおける pr

特論I

NEBNext Direct Target Enrichment Technology 次世代シーケンサー用遺伝子パネル be INSPIRED drive DISCOVERY stay GENUINE

PowerPoint プレゼンテーション

Easy Sep

GBS(Genotyping by Sequencing)によるアグリゲノミクス解析

分子系統解析における様々な問題について 田辺晶史

My Document

次に Exce ファイルを 意します DB2 for i にインポートするデータですので 以下の条件 で Exce ファイルを 意ください 1 がヘッダー 2 以降がデータ ヘッダー ( カラム名 ) は英数字ファイル形式は.xsx もしくは.xs ファイル名は英数字推奨 今回のご紹介では Navi

Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

PowerPoint プレゼンテーション

平成26年度「統合化推進プログラム(統合データ解析トライアル)」 研究開発課題名: HLA遺伝子完全配列決定パイプラインの構築

QualysGuard(R) Release Notes

3rd-jikken-ngs

_unix_text_command.pptx

Bioinformatics2

目次 Ion Reporter 概要とメタゲノム解析 Ion16S Metagenome Kit データ解析概略 解析実行手順 解析実行結果 カスタムプライマー利用時のWorkflow 作成 サポート情報 p.3 p.9 p.14 p.19 p.26 p.35 2

ThermoFisher

サンプルのマルチプレックスおよび下流の解析におけるインデックスのミスアサインメントの影響

楽々 Web データベース 簡単アプリ作成ガイド ( コレクトアプリ ) Ver 住友電工情報システム ( 株 )

人工知能補足_池村

機能ゲノム学(第6回)

作成するアプリ 本書は 楽々 Web データベースで 一覧アプリ を作成する方法を説明します 以下のような Excel ファイルの一覧表を題材に 楽々 Web データベースに Excel ファイルを読み込ん でアプリを作成し 使用するまで を説明します 課題管理表.xlsx タイトル詳細 内容対応優

PowerPoint Presentation

ソフト活用事例③自動Rawデータ管理システム

目次 Webフォルダの特長と仕組み 3 Webフォルダの開き方 4 1 児童生徒の場合 4 2 先生の場合 5 Webフォルダ機能 ファイルのアップロード ( 保存 ) 6 ファイルのダウンロード 7 ファイルの開き方 8 新規フォルダの作成 9 フォルダ ファイルの名称の変更 10 フォルダ ファ

バイオインフォマティクスⅠ

PrimerArray® Analysis Tool Ver.2.2

CONTENTS マニュアルの表記... S01-13_01 1.DataNature Smart 全体概要図... S01-13_11 2. 基本操作... S01-13_ Web レポートの表示... S01-13_ 画面構成... S01-13_ 集計表 /

Microsoft PowerPoint - 社外資料_TruSeq Synthetic Long-Read DNA Library Prep.pptx

試作ツールは MIT ライセンスによって提供いたします その他 内包された オープンソース ソフトウェアについてはそれぞれのライセンスに従ってご利用ください

IonTorrentPGM_appnote_0319.indd


ノム解析が実施された場合に偶発的 二次的所見としての遺伝情報を知ることが患者にとって有意義としている遺伝性疾患の原因遺伝子です 具体的には 現在示されている 26 疾患 (59 遺伝子 ) のうちから 常染色体上に存在する 57 遺伝子 (25 疾患 ) を本研究の解析対象としました 2KJPN の

NGS_KAPA RNA HyperPrep Kit

基本的な利用法

CDM Studio

ステップ 5: ファイルの管理 ステップ 6: レイヤーのデータソースの変更 演習のまとめ 第 3 章レイヤーの操作と共有 第 3 章概要 画面移動 1 : レイヤーの全体表示 画面移動 2 : [XY へ移動 ] ツール...

Transcription:

NGS データ解析入門 Web セミナー : 変異解析編 1

NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2

解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 参照ゲノム配列へのマッピング 再アライメント 変異検出 CLC Genomics Workbench または Biomedical Genomics Workbench 遺伝子名 アミノ酸配列置換情報の付加 ゲノムブラウザー表示 機能アノテーション情報の確認 GenomeBrowse または VarSeq 3

データインポート ~ 遺伝子名 アミノ酸配列置換情報付加 4

CLC Genomics Workbench 使用ツール シークエンスデータのインポート NGS data import クオリティチェック Create Sequencing QC Report Trim Reads 参照ゲノム配列へのマッピング 再アライメント Map Reads to Reference Local Realignment 変異検出 Basic Variant Detection Fixed Ploidy Variant Detection Low Frequency Variant Detection 遺伝子名 アミノ酸配列置換情報の付加 Amino Acid Changes Annotate with Overlap Information 5

シークエンスデータのインポート CLC Genomics Workbench, Biomedical Genomics Workbench ともに シークエンサー機種やファイルフォーマットに合せたインポートメニューを利用可能 Toolbar の Import アイコンから表示されるインポーターから選択して インポートを実行 プラットフォーム Illumina PacBio Ion Torrent ファイル形式.txt.fastq.fq.qseq.bas.h5/.bax.h5.fastq.fq.fasta.fa.fna.sff.fastq.fq Ion Torrent の Unmapped BAM ファイルは Standard Import よりインポートを行う 6

High-Throughput Sequencing Import シークエンスデータファイル (FASTQ ファイルなど ) シークエンサー機種などに合わせてメニューを選択し シークエンスデータファイルを選択ペアエンドシークエンスデータのインポートにも対応 7

High-Throughput Sequencing Import シークエンスデータがインポートされ 各種解析に使用できるようになる各リードの塩基配列やクオリティスコアなどを確認できる 8

クオリティチェック インポートしたシークエンスデータに対して クオリティチェックレポートの作成や 低クオリティリードの除去などを行う その他 重複リードの除去や マルチプレックスシークエンス時のサンプルバーコードのソートなどの 各種データ前処理用ツールなども利用が可能 Create Sequencing QC Report インポートしたシークエンスデータのクオリティや PCR Duplicate の状況などを確認するためのレポートを作成 Trim Reads アダプターの除去 クオリティスコアによる除去 長さを指定した除去などを選択 組み合わせて リードのトリミングを実行 9

Create Sequencing QC Report Create Sequencing QC Reportでは シークエンスデータのクオリティ情報をまとめたレポートが作成される GC 含量やクオリティスコア分布などのグラフデータや数値データを確認が可能 10

Trim Reads Trim Readsの使用により 各リードの低クオリティ部分がカットされるその他 アダプター配列の除去なども可能 11

参照ゲノム配列へのマッピング 再アライメント 変異の検出前に シークエンスデータの各リードが ゲノム上のどの部分を読んだものか さらにどの部分で塩基が違っているかを調べるために 参照ゲノム配列へのリードのマッピングを行う サイズの大きい Insertion / Deletion を含んだリードは マッピングが正確に行えない場合もあるので 必要に応じて再アライメントも行う Map Reads to Reference 任意の参照ゲノム配列に対して シークエンスデータのマッピングを行う Local Realignment すでにマッピングを実行したデータを使用し リードの再アライメントを行う 12

Map Reads to Reference Map Reads to Referenceでは 実行時のオプションパラメータで 任意の参照ゲノム配列データを選択が可能ヒト マウス ラットなどのモデル生物の参照ゲノム配列データは ソフトウェア標準搭載のダウンロードツールから取得でき その他 NCBIに登録されている参照ゲノム配列データや ユーザーカスタム作成の配列データを使用することも可能 13

Map Reads to Reference Map Reads to Referenceを実行すると ゲノム配列 ( 染色体 ) ごとに マッピングされたリード配列がどの領域に多いのかを示したカバレッジグラフが表示されるカバレッジグラフを拡大していくと 各リードの塩基配列も表示され 変異部位なども確認できる 14

Local Realignment Local Realignment 前 Local Realignment 後 Local Realignmentの使用により すでにマッピングされた各リードに対して 同じ領域にマッピングされた周辺のリードに基づき 再アライメントが実行されるサイズの大きいInsertion / Deletionの検出に対して有効 15

変異検出 マッピング 再アライメント後のデータより変異の検出を行うためのツールは 3 種類あり それぞれ計算時のアルゴリズムが違っているが すべて SNV または小サイズの Insertion / Deletion の検出のみに用いられる 変異検出時の感度や特異度 さらにサンプルの種類などに合わせて どのツールを用いるのかを判断する必要がある Basic Variant Detection 特殊な統計モデルを使用せずに SNV, Small Indel を検出する パラメータの設定を調整することで 検出可能な変異に制限を設けずに解析が可能 Fixed Ploidy Variant Detection 確率モデルを用いて SNV, Small Indel を検出する パラメータで指定した Ploidy( 倍数体 ) の値に基づいて変異の検出を行う カバレッジ中に低頻度 (15% 以下 ) で存在する変異は検出できない Low Frequency Variant Detection 確率モデルを用いて SNV, Small Indel を検出する カバレッジ中に低頻度で存在する変異の検出が可能 16

変異検出 3ツールともオプションパラメータで 変異をもつ最低リード数や頻度 リードのクオリティなどを設定が可能遺伝子パネル解析の場合 変異検出の対象とする ゲノム上のターゲット領域などを指定する 17

変異検出 Chromosome: 変異の検出された染色体番号 Region: 変異のポジション Type: 変異の種類 (SNV, Insertion, Deletion など ) Reference: リファレンスの塩基配列 Allele: 検出された塩基配列 Zygosity: 変異の接合性 (Hetero か Homo か ) Count: マップされたリードのうち 変異を有するリードの数 Coverage: マップされたリード数 Frequency: 変異の頻度 検出された変異はテーブル形式で保存され Excelなどにファイル出力が可能変異テーブルには 変異の存在する位置や変異の種類 検出されたアリル リード数などの情報が含まれる変異テーブル上では 各テーブル項目に基づきフィルターをかけることができ 信頼性の高い変異のみを抽出することも可能 18

遺伝子名 アミノ酸配列置換情報の付加 変異テーブルには 変異部位に存在する遺伝子名や 変異によるアミノ酸置換などの情報を追加することが可能 変異データから 生物学的な解釈などを行う場合に これらの情報が必要となる 使用ツール 変異データ 遺伝子名データ 19

遺伝子名 アミノ酸配列置換情報の付加 パラメータオプションで 遺伝子アノテーション情報データを指定して実行 20

解析ワークフローの作成 解析の自動化を行うために 各ツールの使用の順番をプログラムしたワークフローを作成することが可能サンプルが複数存在する場合は 全サンプルまとめてバッチ処理を行うことも可能 21

Biomedical Genomics Workbench の場合 クオリティチェック用ワークフロー : 全ゲノムシークエンス解析用ワークフロー : 全エクソームシークエンス解析用ワークフロー : ターゲットアンプリコンシークエンス解析用ワークフロー : Biomedical Genomics Workbenchでは レディーメイドのワークフローが標準で搭載されており これらワークフローを使用するだけで 各解析を一気に実行することが可能がん 遺伝性疾患用のワークフローがあり 腫瘍 / 正常ペアサンプル比較や 家族性のトリオサンプル解析を実行することも可能 22

ゲノムブラウザー表示 ~ 機能アノテーション情報の確認 23

ゲノムブラウザー表示 変異テーブルのみではなく マッピングされたリードを直接目視で確認し 実際にリードに変異が含まれているか などの確認のために用いられる マッピングや変異テーブルデータのみではなく データベースのアノテーション情報なども同時に表示させ 各変異の生物学的な解釈を行うことも可能 24

ゲノムブラウザー表示 CLC Genomics Workbench, Biomedical Genomics Workbench ともにゲノムブラウザー機能が搭載されており マッピングデータや変異データ さらに各種遺伝子情報データなどをまとめて表示することが可能 25

ゲノムブラウザー表示 無料で使えるゲノムブラウザーで BAM ファイル VCF ファイルなどのデータをグラフ表示が可能 様々な公共データベースの情報もアノテーションとしてゲノムブラウザーに表示させ データの詳細を確認 数値データ 変異データ アノテーションデータの表示の他 連鎖不平衡プロットやヒートマップも表示が可能 様々な公共データベースの情報を基に 変異データへアノテーション付けを実行 アノテーション付けされた情報などを用いて 任意の検索条件でデータのフィルタリングを行うワークフローを作成 カバレッジ計算やトリオ解析 表現型情報に基づく遺伝子ランキングなどの解析アルゴリズムを搭載 GenomeBrowse を搭載し BAM ファイルデータや各種アノテーションデータをグラフ表示 26

ゲノムブラウザー表示 FASTQ マッピング 変異検出の実行 解析結果データのファイル出力 VCF BAM インポート 27

ゲノムブラウザー表示 GenomeBrowse では BAM ファイルや VCF ファイルをドラッグ & ドロップするだけで ゲノムブラウザー上に表示が可能 同時に表示するアノテーションリソースは 標準搭載のデータライブラリーよりダウンロード 28

ゲノムブラウザー表示 Console Window にて マッピングされたリード数カウントやアノテーションの詳細などを確認が可能 29

機能アノテーション情報の確認 遺伝子名やアミノ酸置換情報だけではなく 様々なアノテーションリソースを用いて 変異テーブルに疾患との関連情報などのアノテーション付けを行う GenomeBrowse ではゲノムブラウザー上で情報を閲覧するだけだが VarSeq では変異テーブルに情報を追加したうえで フィルタリングも行うことができる アノテーションリソースの種類 : dbsnp RefSeq Genes COSMIC 1000 Genome NHLBI 6500 Exomes ExAC Variant gnomad Exomes SIFT and PolyPhen dbnsfp Functional Predictions ClinVar CIVic ICGC Simple Somatic Mutation 各種遺伝子パネルのターゲットデータ... など 30

機能アノテーション情報の確認 フィルタリングワークフロー 付加したアノテーション情報などを用いて 変異データに対する任意のフィルタリングワークフローを作成 ワークフローの各項目ごとに フィルタリング結果の変異データテーブルを確認可能で 項目を変更するとフィルタリング結果の変異データテーブルも自動的にアップデートされる 31

お問い合わせ先 : フィルジェン株式会社 TEL 052-624-4388 (9:00~17:00) FAX 052-624-4389 E-mail: biosupport@filgen.jp 32