GWB

Similar documents
NGSデータ解析入門Webセミナー

GWB

GWB

GWB_RNA-Seq_

次世代シークエンサーを用いたがんクリニカルシークエンス解析

リード・ゲノム・アノテーションインポート

PowerPoint プレゼンテーション

PowerPoint Presentation

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

ChIP-seq

nagasaki_GMT2015_key09

RNA-seq

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

Qlucore_seminar_slide_180604

Slide 1

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

PowerPoint Presentation

使いこなそう!CLC Genomics Workbench パート1 QCからトリミング

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

PowerPoint Presentation


国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

ThermoFisher

分子系統解析における様々な問題について 田辺晶史

RNA-seq

PowerPoint プレゼンテーション

スライド 1

リアルタイムPCR実験のためのガイドライン

特論I

PowerPoint Presentation

機能ゲノム学(第6回)

第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方 理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

AJACS18_ ppt

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx

PowerPoint プレゼンテーション

Microsoft PowerPoint - 社外資料_TruSeq Synthetic Long-Read DNA Library Prep.pptx

3rd-jikken-ngs

特論I

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

LinuxServerMori.pdf

メタゲノム解析(2017NGSハンズオン講習会-2017年8月31日)

Sequence Read Archive 2013 年年 10 月 25 日 第 10 回シーケンサー利利 用技術講習会 ( 理理研横浜 ) 1

機能ゲノム学(第6回)

PowerPoint プレゼンテーション



Easy Sep

■リアルタイムPCR実践編

Agilent 1色法 2条件比較 繰り返し実験なし

講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを


Microsoft PowerPoint - 阿部貴志.ppt

Microsoft PowerPoint _SINET_cloud

7-1(DNA配列から遺伝子を探す).ppt

人工知能補足_池村

NGS_KAPA RNA HyperPrep Kit

Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

東京医科歯科大学医歯学研究支援センター illumina Genome Analyzer IIx 利用基準 平成 23 年 10 月 1 日医歯学研究支援センター長制定 ( 趣旨 ) 第 1 条次世代型シークエンサーはヒトを含むあらゆる生物種の全ゲノム配列の決定 全エキソンの変異解析 トランスクリプ

Quick guide_GeneArt Primer and Construct Design Tool_v1(Japanese)

免疫形式文法

機能ゲノム学

農学生命情報科学特論I

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド

AJACS_komachi.key

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

PrimerArray® Analysis Tool Ver.2.2

機能ゲノム学(第6回)

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

Slide 1

2016_RNAseq解析_修正版

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

KEGG.ppt

Create!Form V11 - Excel 出力設定

Microsoft PowerPoint - プレゼンテーション1

サンプルのマルチプレックスおよび下流の解析におけるインデックスのミスアサインメントの影響

Slide 1


プレゼンテーション2.ppt

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

機能ゲノム学(第6回)

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

QualysGuard(R) Release Notes

ユーザズサイトのオフライン用検出エンジン( ウイルス定義データベース)を利用したオフライン更新手順書(バージョン 7 向け)

PowerPoint プレゼンテーション

Slide 1

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

CDM Studio

CONTENTS マニュアルの表記... S01-13_01 1.DataNature Smart 全体概要図... S01-13_11 2. 基本操作... S01-13_ Web レポートの表示... S01-13_ 画面構成... S01-13_ 集計表 /

スライド 1

Microsoft Word - 基礎編<20>siRNA設計.doc

分子系統解析における様々な問題について 田辺晶史

Transcription:

NGS データ解析入門 Web セミナー : De Novo シークエンス解析編 1

NGS 新規ゲノム配列解析の手順 シークエンス 遺伝子領域の検出 アセンブル データベース検索 2

解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 前処理 コンティグ配列の作成 CLC Genomics Workbench 遺伝子領域の検出 Blast2GO PRO データベース検索 3

CLC Genomics Workbench 4

CLC Genomics Workbench 使用ツール シークエンスデータのインポート NGS data import クオリティチェック 前処理 Sample Reads Create Sequencing QC Report Merge Overlapping Pairs Trim Reads コンティグ配列の作成 De Novo Assembly 遺伝子領域の検出 Find Open Reading Frames Extract Annotations データベース検索 BLAST 5

シークエンスデータのインポート CLC Genomics Workbench, Biomedical Genomics Workbench ともに シークエンサー機種やファイルフォーマットに合せたインポートメニューを利用可能 Toolbar の Import アイコンから表示されるインポーターから選択して インポートを実行 プラットフォーム Illumina PacBio Ion Torrent ファイル形式.txt.fastq.fq.qseq.bas.h5/.bax.h5.fastq.fq.fasta.fa.fna.sff.fastq.fq Ion Torrent の Unmapped BAM ファイルは Standard Import よりインポートを行う 6

High-Throughput Sequencing Import シークエンスデータファイル (FASTQ ファイルなど ) シークエンサー機種などに合わせてメニューを選択し シークエンスデータファイルを選択ペアエンドシークエンスデータのインポートにも対応 7

High-Throughput Sequencing Import シークエンスデータがインポートされ 各種解析に使用できるようになる各リードの塩基配列やクオリティスコアなどを確認できる 8

クオリティチェック 前処理 クオリティチェックでは インポートしたシークエンスデータに対して クオリティチェックレポートの作成や 低クオリティリードの除去などを行う 必要に応じて ペアリードの結合や シークエンスデータのサンプリングなどの コンティグ作成前の前処理を行う クオリティチェック用ツール Create Sequencing QC Report インポートしたシークエンスデータのクオリティや PCR Duplicate の状況などを確認するためのレポートを作成 Trim Reads アダプターの除去 クオリティスコアによる除去 長さを指定した除去などを選択 組み合わせて リードのトリミングを実行 前処理用ツール Sample Reads シークエンスデータのサンプリングを行う Merge Overlapping Pairs オーバーラップしているペアリード同士の結合を行う 9

Create Sequencing QC Report Create Sequencing QC Reportでは シークエンスデータのクオリティ情報をまとめたレポートが作成される GC 含量やクオリティスコア分布などのグラフデータや数値データを確認が可能 10

Trim Reads Trim Readsの使用により 各リードの低クオリティ部分がカットされるその他 アダプター配列の除去なども可能 11

Sample Reads シークエンスデータのリード配列数を減らす設定が可能シークエンスデータのデータ量が サンプルのゲノムサイズより極端に大きい場合は De Novo Assembly 実行前に 本ツールでデータ量を最適な値 ( ゲノムサイズの30x) に揃える必要がある 12

Merge Overlapping Pairs オーバーラップ領域 Forward リード Reverse リード Merged リード ペア同士のForward / Reverseリード配列間のオーバーラップ領域をマージし 一つのリード配列に統合するペアエンドシークエンスを行っており かつペアリード配列同士がオーバーラップする場合のみ この処理が必要となる先にTrim Readsを実行している場合 各リード配列の末端部分がトリミングされ マージが上手く実行できない場合もあるので注意する 13

コンティグ配列の作成 リード配列データのクオリティチェック 前処理が終了したら De Novo Assembly によってコンティグの作成を行う コンティグのカバレッジや リード配列のバリアントなどを確認したい場合は 作成コンティグに対してリード配列データのマッピングを実行する De Novo Assembly ショートリードデータを用いて ゲノム配列のアセンブルを実行する ( ロングリード およびトランスクリプトーム配列のアセンブルは非対応 ) Map Reads to Contigs コンティグ配列を参照ゲノム配列として使用し リード配列のマッピングを行う 14

De Novo Assembly Word size (K-mer) 設定 マッピング実行の設定 Scaffolding 設定 パラメータ設定画面では アセンブル実行時のWord size (K-mer) の値や ペアリード使用時のScaffolding さらにアセンブルと同時にマッピングも行うかどうかなどの設定を行うことができる 15

De Novo Assembly Simple Contigs Mapping data Simple Contigs を選択した場合 各コンティグが一覧になって表示され そのまま配列解析用ツールに使用することが可能 アセンブル結果の統計値 ( コンティグ配列の最長塩基数や N50 など ) をまとめたレポートも出力される 16

遺伝子領域の検出 ゲノムシークエンスデータより作成したコンティグ配列には 非遺伝子領域の配列も含まれており そのままではデータベース検索に使用できないため コンティグ上の遺伝子領域を検出し その領域のみの配列データを作成する必要がある CLC Genomics Workbench では 本機能については 基本的に原核生物ゲノム配列の解析しか実行できないため 真核生物ゲノムの解析には Biobam 社 Blast2GO PRO ソフトウェアを使用する Find Open Reading Frames 配列データ上の ORF (Open Reading Frame) 領域を検出して アノテーション付加を行う ( 真核生物ゲノムのような エクソン イントロン構造をもつ配列データには非対応 ) Extract Annotations 配列データ上の 任意のアノテーション領域の配列の抽出を行う 17

Find Open Reading Frames Find Open Reading Frames を実行すると もとの配列データ上に ORF 領域を示すアノテーションが追加される 用いるスタートコドンやストランドなどの各種パラメータ設定を調整することが可能 18

Extract Annotations Extract Annotations では 配列データ上の任意のアノテーション領域の配列を抽出することができる 19

データベース検索 抽出された各遺伝子配列に対し BLAST で相同性検索を実行することで 各遺伝子の機能情報などを取得する CLC Genomics Workbench では BLAST ツールの他 検索に用いるデータベースのダウンロードやカスタム作成用のツールが搭載されている BLAST ローカルコンピュータを使用して BLAST 検索を行う BLAST at NCBI NCBI サーバーで BLAST 検索を行う Download BLAST Database NCBI などで公開されている 様々なカテゴリーごとに分類されたターゲット配列をダウンロードする Create BLAST Database 配列データを BLAST 解析用の Database データとして登録する Manage BLAST Database 登録した Database データの管理を行う 20

データベースの作成 ローカル BLAST を使用する場合 Download BLAST Databases で nr/nt などのデータベースをダウンロードしたり カスタム作成の配列データを Create BLAST Databases でデータベース登録が可能 21

BLAST ローカル BLAST のパラメータ設定画面では BLAST プログラム (BLASTN や BLASTP など ) の選択と ターゲットの BLAST database の種類などを指定する 22

BLAST BLAST に使用したクエリー配列ごとに ヒットしたターゲット配列数と その中で一番相同性が高い配列の詳細情報などがテーブル表示される テーブルの各行をダブルクリックすると 二番目以降にヒットしたターゲット配列も確認が可能 23

Blast2GO PRO 24

Blast2GO Pro Gene Ontology Annotation BLAST と InterProScan による 配列データへのアノテーション付け 取得した Gene Ontology 情報を使用した 遺伝子機能エンリッチメント解析やグラフ作成 Genome Characterization 真核生物ゲノム用 Augustus と原核生物用 Glimmer プログラムを用いた 配列データ内の遺伝子領域予測 RNA-seq FASTQ ファイルのクオリティチェック (FastQC) とトリミング RNA-Seq De Novo Assembly (Trinity) 新規転写物の発現量測定 (Fasta+Fastq) とサンプル間比較解析 Volcano Plot や MA plot Heatmap などのグラフ作成 25

遺伝子領域の検出 De Novo Assembly で作成したコンティグ配列などの DNA 配列データを用いて 配列内の遺伝子やタンパク質コード領域を予測 原核生物と真核生物解析用の 2 種類のプログラムを搭載 真核生物用プログラム (Augustus) 原核生物用プログラム (Glimmer) 26

Eukaryotic GeneFinding 真核生物ゲノム用プログラムでは 実行時に近縁生物種や RNA-Seq マッピングデータを参照することが可能 27

Eukaryotic GeneFinding 解析が終了すると 遺伝子領域の詳細をまとめた GFF ファイルと CDS 配列リスト さらに解析結果をまとめたレポートが出力される 28

Eukaryotic GeneFinding GFF ファイルは専用のビューワーで エクソン / イントロンなどの遺伝子構造を表示可能 29

Eukaryotic GeneFinding CDS 配列リストは 配列名をまとめたテーブルと DNA 配列またはアミノ酸配列のビューワーが表示される 30

データベース検索 CLC Genomics Workbench と同様に NCBI BLAST と Local BLAST を使用できる他 高速なクラウドベースの BLAST ツール CloudBlast も使用可能 Local BLAST 用のデータベース作成機能も搭載 CloudBlast Biobam 社専用のクラウドサーバー上で BLAST を安全にかつ高速に実行する (Computation Units を消費 ) NCBI Blast NCBI サーバーで BLAST 検索を行う Local Blast ローカルコンピュータを使用して BLAST 検索を行う 31

CloudBlast どの BLAST を使用する場合でも BLAST プログラムと BLAST データベースを設定する CloudBlast と NCBI Blast では レディメイドの BLAST データベースを使用するが Local Blast ではユーザー定義のデータベースを作成する必要がある 32

CloudBlast BLAST を実行すると CDS 配列リストに各配列のトップヒット配列の情報が表示される Blast Result ビューで ヒットした配列の詳細情報を確認が可能 33

データベース検索後は BLAST 実行後は ヒットした配列の詳細情報をグラフ化や Gene Ontology などの遺伝子機能解析が可能 34

お問い合わせ先 : フィルジェン株式会社 TEL 052-624-4388 (9:00~17:00) FAX 052-624-4389 E-mail: biosupport@filgen.jp 35