PowerPoint プレゼンテーション

Similar documents
シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

PowerPoint プレゼンテーション

NGSデータ解析入門Webセミナー

リード・ゲノム・アノテーションインポート

PowerPoint プレゼンテーション

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

Raspberry Pi で WEB カメラを使用 会津大学 RT ミドルウェア講習会 2017 The University of Aizu

講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2

141025mishima

GWB

はじめに このドキュメントではftServerに関する障害調査を行う際に 必要となるログ データの取得方法を説明しています ログ データの取得には 初期解析用のデータの取得方法と 詳細な調査を行うときのデータ取得方法があります 特別な理由でOS 側のログが必要となった場合には RHELログの取得につ

Maser - User Operation Manual

NSR-500 Create USB Installer Procedures

NSR-500 Create DVD Installer Procedures

RNA-seq

Microsoft Word - DUC登録方法.doc

Microsoft Word - PrivateAccess_UM.docx

Maeda140303

目次 1 はじめに 導入手順 必要なファイルのダウンロード GMT 本体と gawk( テキストデータ加工用ツール ) Ghostscript,GSview インストール

NGSハンズオン講習会

PowerPoint Presentation

アンケート2

untitled

Red Hat Enterprise Linux 6 Portable SUSE Linux Enterprise Server 9 Portable SUSE Linux Enterprise Server 10 Portable SUSE Linux Enterprise Server 11 P

L3 Japanese (90570) 2008

AJACS18_ ppt

2015-s6-4g-pocket-guidebook_H1-4.indd

GWB

PowerPoint Presentation

2016_RNAseq解析_修正版

ダウンロード方法 アルテラのソフトウェアをインストールするためのダウンロード ファイルには以下の種類があります.tar フォーマットのソフトウェアとデバイス ファイルがバンドルされたセット ダウンロードとインストールをカスタマイズするための個別の実行ファイル ディスクに焼いて他の場所にインストールす

国際恋愛で避けるべき7つの失敗と解決策

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

ソフトウェアについて Rev 年 1 月 16 日 このマニュアルでは標準でインストールしているソフトウェアの入手元 インストール方法の概要 インストール場所 についてご案内致します ABySS

Please enter the following 'extra' attributes to be sent with your certificate request A challenge password []: An optional company name []: Using con

目次 第 1 章はじめに... 3 第 2 章ネットワーク設定 DNS の設定 アウトバウンド HTTPS 接続の許可 アウトバウンド SMTP/POP 接続の許可... 4 第 3 章 JDK への追加ライブラリインストール

PowerPoint プレゼンテーション

28 Docker Design and Implementation of Program Evaluation System Using Docker Virtualized Environment

MENU 키를 누르면 아래의 화면이 나타납니다

cocos2d-x #cocos2d-x

先端社会研究 ★5★号/4.山崎

生研ニュースNo.132

A B C B C ICT ICT ITC ICT

ダウンロード方法アルテラのソフトウェアをインストールするためのダウンロード ファイルには以下の種類があります.tar フォーマットのソフトウェアとデバイス ファイルの完全なセット ダウンロードとインストールをカスタマイズするための個別の実行ファイル ディスクに焼いて他の場所にインストールするための

CONTEC DIOプロバイダ ユーザーズガイド

Look over there. Touch your toes. OK. Please turn around. (stop, turn right, turn left, stand up, sit down, raise your right hand, put your hands down

Microsoft Word - Win-Outlook.docx

Contents Logging in 3-14 Downloading files from e-ijlp 15 Submitting files on e-ijlp Sending messages to instructors Setting up automatic

Windows Server 2012 および Windows Server 2008 のインストール

============================================================

ServerView ESXi CIM Provider VMware vSphere ESXi 6.0 インストールガイド

GWB

インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows : インストール・ガイド

AERA_English_CP_Sample_org.pdf

Web Web Web Web Web, i

Microsoft Word - SSI_Smart-Trading_QA_ja_ doc

HIS-CCBASEver2

Microsoft Word - VPN...[.U.K.C.hLinux doc


エンドポイント濁度測定装置 LT-16 取扱説明書

ServerView ESXi CIM Provider / ServerView RAID Core Provider VMware vSphere ESXi 6.0 インストールガイド

2. インストールの方法 インストールの手順は まずインストーラーをサイトからダウンロードし イールドブック カリキュレーターと Java Web Start をインストールします 次にイールドブック カリキュレーターを起動してサーバー接続し Java のファイルをダウンロードします 以下の手順に従

ドライバインストールガイド

fx-9860G Manager PLUS_J


Read the following text messages. Study the names carefully. 次のメッセージを読みましょう 名前をしっかり覚えましょう Dear Jenny, Iʼm Kim Garcia. Iʼm your new classmate. These ar

CUCM と VCS 間のセキュア SIP トランクの設定例


GWB_RNA-Seq_

ServerView ESXi CIM Provider VMware vSphere ESXi 6.5 インストールガイド

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]


ServerView ESXi CIM Provider VMware vSphere ESXi 6.5 インストールガイド


Taro-cshプログラミングの応用.jt

ソフトウェアエンジニアリング - 機能 #54

Microsoft Word - D JP.docx

Transcription:

バイオインフォマティクス 講習会 V 事前準備 が完了されている方は コンテナの起動 ファイルのコピー (Windows) まで 進めておいてください

メニュー 1. 環境構築の確認 2. 基本的なLinuxコマンド 3. ツールのインストール 4. NGSデータの基礎知識と前処理 5. トランスクリプトのアッセンブル 6. RNA-seqのリファレンスcDNAマッピングとFPKM 算出 7. RNA-seqのリファレンスゲノムマッピングとFPKM 算出 8. DNA-seqのリファレンスゲノムマッピングとvariant call

2. 基本的な Linux コマンド 1 現在のディレクトリ ( フォルダ ) の表示 pwd ディレクトリの移動 cd [path] ディレクトリの作成 mkdir [directory_name] シンボリックリンク ( ショートカット ) の作成 ln s [path] ファイルのコピー cp [path_from] [path_to]

2. 基本的な Linux コマンド 2 ファイルの初めから N 行を出力 ( デフォルト N=10) head N [file] ファイルの後ろから N 行を出力 ( デフォルト N=10) tail n N [file] ファイルから XXX を含む行を抽出 grep XXX [file] ファイルから XXX を含む行を抽出し その最初の N 行を出力 grep XXX [file] head N

3. ツールのインストール 各ツールのマニュアルやダウンロードしたファイル群にある READMEやINSTALLなどのドキュメントを読みましょう

4.NGS データの基礎知識と前処理

ショートリードの種類

FASTQ フォーマット

FASTQファイルのQualityの見方(1) fastqファイルの各レコードの4行目はクオリティスコア ASCII文字 ASCII文字からクオリティスコアを求める方法 1. 2. ASCII文字を10進数に変換 シーケンサーに応じて-33 または -64 する https://en.wikipedia.org/wiki/fastq_format

FASTQ ファイルの Quality の見方 (2)

クオリティチェック $ fastqc --nogroup filtered_r1_rna.fastq

アダプターのコンタミチェック

QV フィルター

アダプター除去

フィルタリング後のリード

アダプターの残存

前処理の最後に

5. トランスクリプトのアッセンブル 1. 共有ディレクトリに移動 [root@d854568b0eb2 ~]# cd /data 2. 作業ディレクトリ作成 移動 [root@d854568b0eb2 data]# mkdir trinity [root@d854568b0eb2 data]# cd trinity/ 3. データのリンク [root@d854568b0eb2 trinity]# ln -s /data/filtered_r[12]_rna*./ 4. bowtie2にpathを通す [root@d854568b0eb2 trinity]# export PATH=$PATH:/tool/bowtie2/ 5. Trinity実行 [root@d854568b0eb2 trinity]# /tool/trinity/trinity --seqtype fq --max_memory 1G --left filtered_r1_rna.fastq --right filtered_r2_rna.fastq --CPU 1 一行のコマンド 6. 統計値算出 [root@d854568b0eb2 trinity]# /tool/trinity/util/trinitystats.pl trinity_out_dir/trinity.fasta

6. RNA-seqのリファレンスcDNAマッピングとFPKM算出 1. 共有ディレクトリに移動 [root@d854568b0eb2 ~]# cd /data 2. 作業ディレクトリ作成 移動 [root@d854568b0eb2 data]# mkdir rsem [root@d854568b0eb2 data]# cd rsem/ 3. データのリンク [root@d854568b0eb2 rsem]# ln -s /data/filtered_r[12]_rna*./ [root@d854568b0eb2 rsem]# ln -s /data/trinity/trinity_out_dir/trinity.fasta./ 4. bowtie2にpathを通す [root@d854568b0eb2 rsem]# export PATH=$PATH:/tool/bowtie2/ 5.遺伝子IDとトランスクリプトID(isoform ID)の対応表を作成 (optional) [root@d854568b0eb2 rsem]# grep ">" Trinity.fasta cut -f1 -d " " sed -e 's/> (. + ) (_. + )/ 1 t 1 2/' > gene2isoform.tsv 一行のコマンド [root@d854568b0eb2 rsem]# head -2 gene2isoform.tsv TRINITY_DN24_c0_g1 TRINITY_DN24_c0_g1_i1 TRINITY_DN30_c0_g1TRINITY_DN30_c0_g1_i1

6. index 作成 [root@d854568b0eb2 rsem]# /tool/rsem/rsem-prepare-reference --transcript-to-genemap gene2isoform.tsv --bowtie2 Trinity.fasta Trinity 7. RSEM 実行 [root@d854568b0eb2 rsem]# /tool/rsem/rsem-calculate-expression --paired-end filtered_r1_rna.fastq filtered_r2_rna.fastq Trinity out --bowtie2 一行のコマンド --transcript-to-gene-map を指定しないと 配列はすべて gene として認識される 8. 結果 一行のコマンド [root@d854568b0eb2 rsem]# head out.genes.results gene_id transcript_id(s) length effective_length expected_count TPM FPKM TRINITY_DN0_c0_g1 TRINITY_DN0_c0_g1_i1 633.00 456.61 32.00 22742.26 23129.02 TRINITY_DN10_c0_g1 TRINITY_DN10_c0_g1_i1 610.00 433.61 33.00 24696.96 25116.97 [root@d854568b0eb2 rsem]# tail -4 out.isoforms.results transcript_id gene_id length effective_length expected_count TPM FPKM IsoPct TRINITY_DN9_c0_g1_i1 TRINITY_DN9_c0_g1 1167 990.61 46.82 15337.63 15598.47 45.54 TRINITY_DN9_c0_g1_i2 TRINITY_DN9_c0_g1 1489 1312.61 74.18 18339.31 18651.20 54.46 TRINITY_DN9_c0_g1_i3 TRINITY_DN9_c0_g1 1482 1305.61 0.00 0.05 0.06 0.00 TRINITY_DN9_c0_g2_i1 TRINITY_DN9_c0_g2 431 254.61 18.00 22941.53 23331.69 100.00

7.RNA-seqのリファレンスゲノムマッピング ### Bowtie-tophatによるマッピング cd /data # working directoryを作成して移動 mkdir exp_ref_genome cd exp_ref_genome # 必要ファイルへシンボリックリンク ln -s /data/filtered_r[12]_rna2*./ ln -s /data/tair10*./ # bowtieへパスを通す export PATH=$PATH:/tool/bowtie2/ # bowtie index bowtie2-build TAIR10_chr1_short.fa TAIR10_chr1_short # Mapping /tool/tophat/tophat -G TAIR10_GFF3_short.gff -o tophat_out TAIR10_chr1_short filtered_r1_rna2.fastq filtered_r2_rna2.fastq

FPKM算出 ### CufflinksによるFPKM算出 # オプションの確認 /tool/cufflinks/cufflinks -h # -u optionなし /tool/cufflinks/cufflinks -G TAIR10_GFF3_short.gff -o cufflinks_out tophat_out/accepted_hits.bam # -u optionあり /tool/cufflinks/cufflinks -G TAIR10_GFF3_short.gff -u -o cufflinks_out_u tophat_out/accepted_hits.bam # -u optionありなしの結果の違い grep "AT1G01060" cufflinks_out/isoforms.fpkm_tracking cut -f1,10 sort grep "AT1G01060" cufflinks_out_u/isoforms.fpkm_tracking cut -f1,10 sort

8.DNA-seqのリファレンスゲノムマッピング # 準備 cd /data mkdir snpcall cd snpcall/ ln -s /data/s288c_chromosome_1.fsa./ ln -s /data/filtered_r1_dna.fastq./ ln -s /data/filtered_r2_dna.fastq./ 以下のWebページのWorkflowに従います Samtools -- WGS/WES Mapping to Variant Calls - Version 1.0 http://www.htslib.org/workflow/#mapping_to_variant

DNA-seq のリファレンスゲノムマッピング # To prepare the reference for mapping you must first index it by typing the following command where <ref.fa> is the path to your reference file: /tool/bwa/bwa index S288C_Chromosome_1.fsa # Once you have finished preparing your indexed reference you can map your reads to the reference: /tool/bwa/bwa mem -R '@RG tid:foo tsm:bar tlb:library1' S288C_Chromosome_1.fsa filtered_r1_dna.fastq filtered_r2_dna.fastq 1> bwa.sam 2> bwa.log # Because BWA can sometimes leave unusual FLAG information on SAM records, it is helpful when working with many tools to first clean up read pairing information and flags: /tool/samtools/samtools fixmate -O bam bwa.sam bwa_fixmate.sam # To sort them from name order into coordinate order: /tool/samtools/samtools sort -O bam -o bwa_fixmate_sort.bam bwa_fixmate.sam

DNA-seq のリファレンスゲノムマッピング ### Improvement # GATK steps are skipped in this lecture since account registration is needed. # Remove PCR dupilicate java -Xmx2g -jar /tool/picard/picard.jar MarkDuplicates VALIDATION_STRINGENCY=LENIENT INPUT=bwa_fixmate_sort.bam OUTPUT=picard.bam METRICS_FILE=metrics.out # Lastly we index our BAM using samtools: /tool/samtools/samtools index picard.bam

DNA-seq のリファレンスゲノムマッピング ### Variant Calling # You can do this using a pipe as shown here: /tool/samtools/samtools mpileup -ugf S288C_Chromosome_1.fsa picard.bam /tool/bcftools/bcftools call -f 'GQ' -vm -o result.vcf # Finally you will probably need to filter your data using commands such as: /tool/bcftools/bcftools view -i 'DP>3 & FMT/GQ>10' result.vcf > result_filt.vcf