ex1: TopHat キイロショウジョウバエ Drosophila melanogaster の RNA-seq を行った ライブラリは 2 種類 それぞれ single end( イン

Size: px
Start display at page:

Download "ex1: TopHat キイロショウジョウバエ Drosophila melanogaster の RNA-seq を行った ライブラリは 2 種類 それぞれ single end( イン"

Transcription

1 ex1: TopHat キイロショウジョウバエ Drosophila melanogaster の RNA-seq を行った ライブラリは 2 種類 それぞれ single end( インサートの片側だけ読む ) で 75bp シークエンスした 10 万リード得られた これらのリードを D. melanogaster のゲノムにマッピングしたい TopHat を用いて splice-aware なマッピングを行う Data Input reads (~/data/ex/ 以下にある ) C1_10k_Read1.fq C2_10k_Read1.fq Reference D. mel genome and annotation (Ensembl BDGP5.25) をiGenomes ( [ からダウンロードする ftp://igenome:g3nom3s4u@ussd-ftp.illumina.com/drosophila_melanogaster /Ensembl/BDGP5.25/Drosophila_melanogaster_Ensembl_BDGP5.25.tar.gz [ftp://igenome:g3nom3s4u@ussd-ftp.illumina.com/drosophila_melanogaster/ensembl /BDGP5.25/Drosophila_melanogaster_Ensembl_BDGP5.25.tar.gz] ただ ファイルサイズが比較的大きくダウンロードに時間がかかると思われる 演習用のMacに同じファイルが置いてある (~/data/ex/ 以下にある ) Drosophila_melanogaster_Ensembl_BDGP5.25.tar.gz Setup Setup environment ex1 ディレクトリをつくり 以下の解析はその下で作業しよう $ mkdir ex1 $ cd ex1 Sequence reads less などのコマンドで C1_10k_Read1.fq の内容を確認する 注 ) 本番の解析では リード数の確認 フォーマットの確認 クオリティの確認などを行う 必要であればアダプター配列の除去 低クオリティ部位のトリムも行う Reference sequence and annotation files Drosophila_melanogaster_Ensembl_BDGP5.25.tar.gz を解凍する 1

2 $tar xzvf Drosophila_melanogaster_Ensembl_BDGP5.25.tar.gz Run tophat TopHat を実行 C1_10k_Read1.fq $ tophat -p 4 -G genes.gtf -o C1_tophat_out genome C1_10k_Read1.fq gene.gtf は known transcript が記録された gtf ファイル ファイルパスを指定すること ダウ ンロードした Drosophila_melanogaster_Ensembl_BDGP5.25 の中のどこかにある genome には bowtie2 用のゲノムのインデックスファイルの base name を指定する ダウンロー ドした Drosophila_melanogaster_Ensembl_BDGP5.25 の中のどこかにある -p は使う CPU core を指定するオプション 使用するコンピュータのスペックに合わせて オススメ : transcriptome-index オプションは指定した方が良い 初回に作製した bowtie2 index が 2 回目以降使い回せる 複数ライブラリを解析する際は大幅に時間の節約になる 同様に C2_10k_Read1.fq をマッピング $ tophat -p 4 -G genes.gtf -o C2_tophat_out genome C2_10k_Read1.fq Inspect Results 計算が終わったら どのようなファイルが生成されたか確認する $ ls -l C1_tophat_out/ total rw-r--r-- 1 shige staff Mar 6 23:10 accepted_hits.bam -rw-r--r-- 1 shige staff 52 Mar 6 23:10 deletions.bed -rw-r--r-- 1 shige staff 54 Mar 6 23:10 insertions.bed -rw-r--r-- 1 shige staff Mar 6 23:10 junctions.bed drwxr-xr-x 17 shige staff 578 Mar 6 23:04 logs -rw-r--r-- 1 shige staff 66 Mar 6 23:04 prep_reads.inf prep_reads.info の中身を less で確認しよう accepted_hits.bam がアライメント結果だ 中身を samtools で確認しよう $ samtools view C1_tophat_out/accepted_hits.bam less IGV IGV で可視化しよう IGV で bam ファイルを読むためには インデクシングをしなければいけない sort indexing の段階をふむ $ samtools sort accepted_hits.bam accepted_hits.sorted # => accepted_hits.sorted.bam ができる $ samtools index accepted_hits.sorted.bam # => accepted_hits.sorted.bam.bai ができる 1. IGV を立上げる 2

3 2. 左上のプルダウンメニューから Drosophila melanogaster のゲノムを選ぶ ( 今回使っているリファレンスと同一のバージョンの Dmel ゲノムがないが今回の練習では r5.33 を選んで問題はない ) 3. メニュー File > Load from File accepted_hits.sorted.bam を選択 4. 適当な染色体の適当な場所を指定し 適当にズームアップする X:830,000 近辺 git2014sopen/ex1.txt Last modified: 2014/03/04 20:03 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 3

4 ex2: Transcript-based Mapping with Bowtie2 マウス Mus musculus の RNA-seq を行った ライブラリは 1 種類のみで single end ( 片側 Read1 のみ ) 75bp シークエンスを行った これらのリードをマウス mrna リファレンスにマッピングさせたい 戦略 :bowtie2 で mrna リファレンスにマッピング Data データファイルは ~/data/ss 以下に保存してある Input reads IlluminaReads1.fq Reference minimouse_mrna.fa Setup Setup environment ex2 ディレクトリをつくり 以下の解析はその下で作業しよう Sequence reads less などのコマンドで シーケンスファイル (IlluminaReads1.fq) の内容を確認する 注 ) 本番の解析では リード数の確認 フォーマットの確認 クオリティの確認などを行う 必要であればアダプター配列の除去 低クオリティ部位のトリムも行う Reference sequence and annotation files minimouse_mrna.fa の内容を less などで確認する Create index of reference $ bowtie2-build reference.fasta output_basename たとえば reference.fasta : referenceのfastaファイル 今回の場合はRefSeq.MM9.cds.nr.fasta( のパス ) output_basename : 生成されるインデックスファイル群のbase name bowtie2-build Data/RefSeq.MM9.cds.nr.fasta myref を実行すると 4

5 myref.1.bt2 myref.4.bt2 myref.2.bt2 myref.rev.1.bt2 myref.3.bt2 myref.rev.2.bt2 の 6 つのファイルができる Run Bowtie2 bowtie2 でマッピングしよう Usage: bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> -U <r>} [-S <sam>] bowtie2には様々なオプションがあるが今回は最低限のオプションだけを設定して実行する どのようなオプションが利用可能かは bowtie2 -h で確認できる また開発者ホームページに詳細な解説がある 本番の解析では 適切なオプションを適切なパラメータで実行しなければいけない 実際は いくつかパラメータを振って試行錯誤することになる $ bowtie2 -p 4 -x RefSeq.MM9.cds.nr -U mouse_200k.left.fq -S out.sam out.sam がマッピング結果 SAM format -p は使うCPUコア数 使用するコンピュータにあわせて設定する コマンドを実行するとしばらくして reads; of these: (100.00%) were unpaired; of these: (57.37%) aligned 0 times (34.12%) aligned exactly 1 time (8.51%) aligned >1 times 42.63% overall alignment rate のようなレポートが表示されて終了する マッピング率など有用な情報なので テキストファイルにコピー & ペーストして保存しておくと良い Inspect Results 計算が終わったら どのようなファイルが生成されたか確認する (ls -l など ) out.sam の内容を確認しよう (less, head, tail など ). 最初の約 2 万行はヘッダで アライメントはそのあとに続く SAM to BAM mapping 結果を可視化したりカウントしたり 様々な下流解析を行うために SAM ファイルを sort 済の BAM に変換する そしてインデクシングする SAM BAM の変換は NGS 研究ではよく行う作業なので必ず身に付けること $ samtools view -bs out.sam > out.bam $ samtools sort out.bam out.sorted # => out.sorted.bam が生成される $ samtools index out.sorted.bam 5

6 # => out.sorted.bam.bai が生成される Count by transcript samtools を使って transcript ごとにカウントする簡易な方法を紹介する amtools のサブコマンド idxstats は reference sequence のエントリー毎にマップされたリード数を集計する 今回は各シークエンスエントリーが各トランスクリプトに相当するので これを利用すると transcript ごとのカウント情報が得られる $ samtools idxstats out.sorted.bam ( やや難 ) 最もカウント数が多いのはどの遺伝子だろうか sort コマンドで手っ取り早く確認することが出来る git2014sopen/ex2.txt Last modified: 2014/03/04 20:10 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 6

7 ex3: Data Import and Visualization arab2.txt は 6 libraries (2 groups x 3 biological replicates) のシロイヌナズナ RNA-seq のデータである すでにマッピング済みで遺伝子毎のリードカウントがタブ区切りテキストとして提供されている この exercise では テーブルの中身を確認する基本テクニックを練習する Data (~/data/ss/ 以下にある ) arab2.txt : count table Inspect table with MS Excel 1) 表計算ソフト MS Excel を使って arab2.txt の中身を確認しよう 2)MS Excel で m1 と m2 の scatter plot( 散布図 ) を書いてみよう このふたつは同一コンディションの biological replicate なので 発現パターンは両者で良く似ているはずである 次に m1 と h1 を比較しよう このふたつはコントロールと実験群の比較なので有る程度の発現パターンの違い ( すくなくとも m1 vs m2 よりも大きい違い ) が期待される ヒント :xy 軸ともに対数をとること コメント : ノーマライズなどを施していない生データでもこれだけ豊富な情報が得られることを認識して欲しい ex-1b: Inspect table with R こんどは R でテーブルの確認と scatter plot を書いてみよう Data import > dat <- read.delim("arab2.txt", row.names=1, head=t) # read tab-delimited text > head(dat) m1 m2 m3 h1 h2 h3 AT1G AT1G AT1G AT1G AT1G AT1G Inspect table > dim(dat) [1] Q1:dim コマンドは何をするものですか? Q2: また その結果得られた と 6 は何を意味しますか? 7

8 Inspect data by column それぞれのライブラリの リードカウント合計は重要な基礎情報である 計算してみよう Q3: それぞれのライブラリのリードカウント合計を求めなさい 例としてm1カラムの合計を計算する > sum(dat$m1) [1] 他のカラムも合計を計算しよう また これらは基礎情報として重要なので記録しておこう Q4 ( やや難 ): 約 2 万 5 千遺伝子にはカウント 0 のものから非常にたくさんのカウントをもつものがある カウントの i) 最大値 最小値 平均値 中央値はいくつか調べよう ii) ヒストグラムを書きなさい m1 as an example: > dim(dat) [1] > sum(dat$m1) [1] > sum(dat$m3) [1] > max(dat$m1) [1] > min(dat$m1) [1] 0 > mean(dat$m1) [1] > median(dat$m1) [1] 9 コメント : ただ計算するだけでなく これらの基礎統計量を見て カウントデータの分布にどのような特徴があるか考えることが大切です > hist(dat$m1) しかし あんまり特徴がつかめないので > hist(log10(dat$m1 + 1), breaks="scott") Scatter plot Q5: m1 vs m2 を scatter plot で比較しよう 8

9 > plot(dat$m1 + 1, dat$m2 + 1, log="xy") それぞれ +1 しているのは log0 は計算できないため +1 して下駄を履かせている Q6: ほかのライブラリどうしも scatter plot を描いて比較しよう コメント :plot などのグラフィックス関数には 様々な引数を与えることによって非常に多くの描画パラメータを変更でき グラフの見栄えを変更することが出来る 余裕があれば plot の色 形 などを変更する練習をしてみると良いだろう git2014sopen/ex3.txt Last modified: 2014/03/04 20:13 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 9

10 ex4: MA plot MA plot 2 RNAseq M = log(intensityb / intensitya) # log of the ratio = A = log(sqrt(intensitya * intensityb)) # intensity average of log intensity = arab2.txt MA plot (ex3 dat ) Q1) m1 vs m2 MA-plot M <- log2(dat$m2 / dat$m1) A <- log2(sqrt(dat$m1 * dat$m2)) plot(a, M) log0 M <- log2(dat$m2 + 1) - log2(dat$m1 + 1) A <- 1/2 * (log2(dat$m2 + 1) + log2(dat$m1 + 1)) plot(a, M, col="gray", pch=16, cex=0.4, ylim=c(-8,8)) edger MAplot RNAseq MA git2014sopen/ex4.txt Last modified: 2014/03/04 20:15 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 10

11 ex5: edger arab2 のデータを使い 2 群間比較を edger で行う edger は複雑なパッケージである 開発者が詳細のユーザーガイドやマニュアルを用意しているので これらを活用して欲しい ( リンクは下記参照 ) Import library library(edger) Import data > dat <- read.delim("arab2.txt", row.names=1) #... dat 中身の確認作業... 2 グループ 各 3 繰り返し実験 という実験デザインを定義する > grp <- c("m", "M", "M", "H", "H", "H") > grp [1] "M" "M" "M" "H" "H" "H" edger の DGEList 関数でカウントデータを読み込む > D <- DGEList(dat, group=grp) > head(d)... Normalization TMM 法で ノーマライズする calcnormfactors を使う > D <-calcnormfactors(d, nethod="tmm") 計算結果の確認 > D$samples group lib.size norm.factors m1 M m2 M m3 M h1 H h2 H h3 H DE testing estimate dispersion > D <- estimatecommondisp(d) > D$common.dispersion 11

12 [1] > D <- estimatetagwisedisp(d) > summary(d$tagwise.dispersion) Min. 1st Qu. Median Mean 3rd Qu. Max DE test > de.tagwise <- exacttest(d, pair=c("m", "H")) Multiple comparison correction and View results > toptags(de.tagwise) Comparison of groups: H-M logfc logcpm PValue FDR AT5G e e-17 AT3G e e-15 AT2G e e-15 AT4G e e-15 AT2G e e-14 AT2G e e-14 AT3G e e-13 AT4G e e-13 AT1G e e-13 AT2G e e-13 Dump the table into a text file > write.table(de.tagwise$table, "de.tagwise.txt", sep="\t", quote=f) or > tmp <- toptags(de.tagwise, n=nrow(de.tagwise$table)) > write.table(tmp$table, "de.tagwise2.txt", sep="\t", quote=f) MA plot edger 提供の plotsmear 関数を使うと便利 plotsmear(d) 有意に発現差のある遺伝子を赤で表示することもできる > de.names <- row.names(dat[decidetestsdge(de.tagwise, p.value=0.05)!=0, ]) > plotsmear(d, de.tags=de.names) 12

13 Inspect DE result example: fold-change > 10 を抽出 カウント detab <- tmp$table ## get fold-change > 10 detab[detab$logfc > log2(10),] nrow(detab[detab$logfc > log2(10),]) example: FC > 5 AND FDR < 0.01 > detab[(detab$logfc > log2(2) & detab$fdr < 0.05), ] edger に組み込まれている decidetestdge 関数も便利 > summary(decidetestsdge(de.tagwise, p.value=0.05)) [,1] dump したタブ区切りテキストを MS Excel で読み込んで フィルタ機能やソート機能を駆使してデータを探索するのも良いだろう Links [ edger edger User's Guide [ /inst/doc/edgerusersguide.pdf] git2014sopen/ex5.txt Last modified: 2014/03/05 20:55 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 13

14 Clustering 問 1 データセット _mutant_group00-04_Pst-aR2_6h_q0.05_ExpRatio_22g.txt を使って ユークリッド距離を使った場合とコサイン係数を使った距離でクラスタリングした時の違いを調べなさい なお コサイン係数での距離 クラスタリングは下記のカスタム関数を用いてよい また heatmap および heatmap.2(gregmisc ライブラリー ) では引数に Rowv=as.dendrogram( 行のクラスタリング結果 ), Colv=as.dendrogram( 列のクラスタリング結果 ) と指定することで任意のクラスタリング結果でヒートマップを描くことができる # コサイン係数 ( ベクトルの角度 ) でクラスタリング # コサイン係数は関数が無いので自作する cosine.coef <- function(x,y) { a <- sum(na.omit(x * y)) / sqrt( sum(na.omit(x)^2) * sum(na.omit(y)^2) ) return(a) } # making a distance table between columns using uncentered Pearson correlation cosine.table <- function(x) { numberofpoints <- ncol(x) columnnames <- colnames(x) distancetable <- matrix(data = NA, nrow = numberofpoints, ncol = numberofpoints, dimnames = list( columnnames, columnnames ) ) for ( i in 1:(numberOfPoints-1) ) { for ( j in (i+1):numberofpoints ) { v1 <- x[, i] v2 <- x[, j] d <- 1 - cosine.coef(v1, v2) distancetable[i, j] <- d distancetable[j, i] <- d } } } for ( i in 1:numberOfPoints ) { distancetable[i, i] <- 1 } # fill the diagonal return(distancetable) # コサイン係数の距離行列 # cosinedistancetable <- as.dist(cosine.table(as.matrix((dat)))) # 行のクラスタリング rowclusters <- hclust(as.dist(cosine.table(as.matrix((t(dat)))))) # 列のクラスタリング colclusters <- hclust(as.dist(cosine.table(as.matrix((dat))))) # 問 1 解法例 dat <- read.delim(file= /Users/nibb2/Desktop/080106_mutant_group00-04_Pst-aR2_6h_q0.05_ExpRatio_22g.txt, header=true, row.name=1) library(gregmisc) # ユークリッド距離 ( ベクトル間の距離 ) でクラスタリング png(filename=paste("080106_mutant_group00-04_pst-ar2_6h_q0.05_expratio_22g", "_Euclidian.png", sep="")) heatmap.2(as.matrix(dat), trace="none") dev.off() png(filename=paste("080106_mutant_group00-04_pst-ar2_6h_q0.05_expratio_22g", "_cosine.png", sep="")) heatmap.2(as.matrix(dat), Rowv=as.dendrogram(rowClusters), Colv=as.dendrogram(colClusters), trace="none") dev.off() 問 2 データセット _mutant_group00-04_Pst-aR2_6h_q0.05_ExpRatio_22g.txt を使って ユークリッド距離を使って得られたクラスタリング結果がどれだけ頑健な結果であるか leave-one out 法を使って調べなさい 今回は for 関数などを使って計 21 個の leave-one-out 検証した結果のヒートマップを書き その結果を比べなさい # 問 2 解法例 14

15 for (i in 1:ncol(dat)){ LOOdata <- dat[,-i] png(filename=paste("080106_mutant_group00-04_pst-ar2_6h_q0.05_expratio_22g", "_Euclid_", colnames(dat)[i], "-LOO.png", sep=""), width=480*2, height=480*2) heatmap.2(as.matrix(loodata),, trace="none") dev.off() } 注 : ファイルのパスは環境にあわせて変更すること git2014sopen/ex6.txt Last modified: 2014/03/04 20:18 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 15

16 Genome-based RNA-Seq pipeline (Arabidopsis thaliana) RNA-seq 2D sample (2days dark condition ) 2D2L sample ( 2days light condition sampling duplicate paired-end 101bp pre-processing Arabidopsis thaliana TopHat splice-aware Data Input reads ( ~/data/ky/tophat/ ) condition Dark, rep#1: 2D_1_R1.fastq, 2D_1_R2.fastq condition Dark, rep#2: 2D_2_R1.fastq, 2D_2_R2.fastq condition Dark, rep#3: 2D_3_R1.fastq, 2D_3_R2.fastq condition Light, rep#1: 2D2L_1_R1.fastq, 2D2L_1_R2.fastq condition Light, rep#2: 2D2L_2_R1.fastq, 2D2L_2_R2.fastq condition Light, rep#3: 2D2L_3_R1.fastq, 2D2L_3_R2.fastq Reference Arabidopsis thaliana genome and annotation (Ensembl) igenomes ( /igenomes.html [ ftp://ussd-ftp.illumina.com/arabidopsis_thaliana/ensembl/tair10 /Arabidopsis_thaliana_Ensembl_TAIR10.tar.gz [ftp://ussd-ftp.illumina.com/arabidopsis_thaliana /Ensembl/TAIR10/Arabidopsis_thaliana_Ensembl_TAIR10.tar.gz] Chr4 15.6% genome (genome.fa) (genes.gtf) bowtie2 index (genome.fa.*.bt2) A C G T N a c g t n other Sum_ACGT Sum_acgt Count_All cg_ratio Chr Chr Chr Chr Chr Mt Pt total Software tophat (installed) cufflinks (installed) bowtie2 (installed) samtools (installed) Setup 16

17 Setup environment top_cuff $ mkdir top_cuff $ cd top_cuff Sequence reads less 2D_1_R1.fastq Pre-processing Run tophat TopHat 2D_1_R1.fastq 2D_1_R2.fastq $ tophat -p 4 -G genes.gtf -o 2D_1 genome.fa 2D_1_R1.fastq 2D_1_R2.fastq -p CPU core transcriptome-index bowtie2 index 2 paired-end single read Inspect Results $ ls -l C1_tophat_out/ $ $ ls -la 2D_1 total rw-r--r-- 1 kyamaguc staff :14 accepted_hits.bam -rw-r--r-- 1 kyamaguc staff :14 align_summary.txt -rw-r--r-- 1 kyamaguc staff :14 deletions.bed -rw-r--r-- 1 kyamaguc staff :14 insertions.bed -rw-r--r-- 1 kyamaguc staff :14 junctions.bed drwxr-xr-x 30 kyamaguc staff :14 logs -rw-r--r-- 1 kyamaguc staff :12 prep_reads.info -rw-r--r-- 1 kyamaguc staff :14 unmapped.bam prep_reads.info align_summary.txt less accepted_hits.bam samtools $ samtools view 2D_1/accepted_hits.bam less IGV IGV IGV bam sort indexing 17

18 $ samtools sort accepted_hits.bam accepted_hits.sorted # => accepted_hits.sorted.bam $ samtools index accepted_hits.sorted.bam # => accepted_hits.sorted.bam.bai 1. IGV 2. A.thaliana(TAIR10) 3. File > Load from File accepted_hits.sorted.bam 4. X:1.14kb Statistics ( ) samtools Run cufflinks $ cufflinks -o 2D_1 -G genes.gtf accepted_hits.bam * tophat less -rw-r--r-- 1 kyamaguc staff :14 accepted_hits.bam -rw-r--r-- 1 kyamaguc staff :14 align_summary.txt -rw-r--r-- 1 kyamaguc staff :14 deletions.bed -rw-r--r-- 1 kyamaguc staff :24 genes.fpkm_tracking -rw-r--r-- 1 kyamaguc staff :14 insertions.bed -rw-r--r-- 1 kyamaguc staff :24 isoforms.fpkm_tracking -rw-r--r-- 1 kyamaguc staff :14 junctions.bed drwxr-xr-x 30 kyamaguc staff :14 logs -rw-r--r-- 1 kyamaguc staff :12 prep_reads.info -rw-r--r-- 1 kyamaguc staff :24 skipped.gtf -rw-r--r-- 1 kyamaguc staff :24 transcripts.gtf -rw-r--r-- 1 kyamaguc staff :14 unmapped.bam genges.fpkm_tracking, isoforms.fpkm_tracking 2D_2, 2D_3, 2D2L_1, 2D2L_2, 2D2L_3 6sample Run cuffmerge 18

19 merge gtf assemble.txt ~/top_cuff/2d_1/transcripts.gtf ~/top_cuff/2d_2/transcripts.gtf ~/top_cuff/2d_3/transcripts.gtf ~/top_cuff/2d2l_1/transcripts.gtf ~/top_cuff/2d2l_2/transcripts.gtf ~/top_cuff/2d2l_3/transcripts.gtf cuffmerge $ cuffmerge -p 4 -s genome.fa -g genes.gtf assemblies.txt *genome.fa, genes.gtf merged_asm merged.gtf less Run cuffdiff GTF Run cufflinks, Run cuffmerge cuffdiff -p 4 merged.gtf -o 2D_vs_2D2L \ ~/top_cuff/2d_1/accepted_hits.bam,~/top_cuff/2d_2/accepted_hits.bam,~/top_cuff/2d_3/accepted_hits.bam \ ~/top_cuff/2d2l_1/accepted_hits.bam,~/top_cuff/2d2l_2/accepted_hits.bam,~/top_cuff/2d2l_3/accepted_hits.bam 2D_vs_2D2L Explore the results gene level gene_exp.diff genes.fpkm_tracking tab Excel Excel Q: How many genes are differentially expressed? Q: Scatter plot MA plot Links [ TopHat [ CuffLinks 19

20 Notes Trapnell, C. et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat Protoc 7, (2012). git2014sopen/prac_genome_based.txt Last modified: 2014/03/05 14:49 by kyamaguc Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 20

21 de novo RNA-seq pipeline genome sequence に依存しない transcript base の RNA-seq 解析のパイプラインを学ぶ シロイヌナズナを明条件 (L) と暗条件 (D) で育て それぞれ 3 個体から RNA を抽出して 標準的な方法で RNAseq ライブラリを作製し イルミナシーケンサーでシーケンスした ( 片側 76base シーケンス ) 明暗の条件の差で発現の異なる遺伝子を同定したい モデル植物シロイヌナズナはゲノムシーケンスは既知であるが ここではあえてゲノム情報は使わず de novo RNA-seq のアプローチで解析する Data Input reads ( ファイルは ~/data/data/ky/tophat/ にある ) condition Light, rep#1: 2D2L_1_R1.fastq condition Light, rep#2; 2D2L_2_R1.fastq condition Light, rep#3; 2D2L_3_R1.fastq condition Dark, rep#1; 2D_1_R1.fastq condition Dark, rep#2; 2D_2_R1.fastq condition Dark, rep#3; 2D_3_R1.fastq 本来は read quality check and cleaning を行なうべきであるが 上記シーケンスデータは処理済み Overview 戦略 1. de novo assembly to build transcriptome reference tool: Trinity 2. mapping reads to transcriptome reference tool: bowtie2 3. abundance estimation tool: express 4. differential expression analysis tool: edger 5. annotation of reference sequences tool: blastx Setup practice_denovo ディレクトリを作製し 以降の解析はそのディレクトリの下で作業しよう $ mkdir practice_denovo $ cd practice_denovo Sequence reads 解析に使うシーケンスデータをカレントディレクトリにコピーする オリジナルは ~/data/ky 21

22 /tophat/ にある $ cp ~/data/ky/tophat/*_r1.fastq./ Tops: 6 つのファイルをひとつひとつコピーしても良いが ワイルドカードを使うと便利 Read QC and pre-precessing 本来は read quality check and cleaning を行なうべきであるが 上記シーケンスデータは処理済み ( 参考 ) QC のためのソフトウェア : FastQC, Low quality base trimming, adaptor trimming を行なうためのソフトウェア : cutadapt, de novo assembly Trinity で de novo assembly を行なう ただ この実習では行なわない (Trinity は Mac をサポートしていないこと ハイスペックのマシンを要すること 時間がかかること やや高度なインフォマティクススキルを要すること が理由 ) ( 参考 ) Trinity を実行する例 input read の準備 $cat 2D2L_1_R1.fastq \ 2D2L_2_R1.fastq \ 2D2L_3_R1.fastq \ 2D_1_R1.fastq \ 2D_2_R1.fastq \ 2D_3_R1.fastq \ > seq_all.fq 実行ファイル run_trinity.sh の作製 run_trinity.sh!/bin/sh #=== configu === SEQ=seq_all.fq OUT=trinity_out MIN_KMER_COV=1 NCPU=24 JM=256G #=== TRINITY_BASE=~/bio/Applications/trinityrnaseq_r ulimit -s unlimited 22

23 $TRINITY_BASE/Trinity.pl \ --JM $JM \ --seqtype fq \ --min_kmer_cov $MIN_KMER_COV \ --single $SEQ --CPU $NCPU \ --output $OUT \ コマンドラインから実行 $ sh run_trinity.sh 今回は transcripts.fa を de novo assembly の結果得られたコンティグシーケンスセットとして解析を進める transcripts.fa は以下からダウンロードしてください [ /git2014s/transcripts.fa.gz] Mapping bowtie2 を使ってリードを transcripts.fa にマッピングする まずは reference を indexing. $ bowtie2-index transcripts.fa transcripts マッピング ( 例 ) $ bowtie2 -x transcripts -U 2D_3_R1.fastq -p 8 -a -S 2D_3_R1.sam point: -a オプション express で mutihit を考慮した abundance estimation を行なうために必須 もしくは -k オプションを使う ここでは 2D_3_R1.fastq を mapping して その結果を D3.sam に保存している 6 つのファイルすべてで同様の処理を行なう 結果ファイルは自分なりにルールを決めて規則正しく命名するとよい 今回は 2D_3_R1.fastq => 2D_3_R1.sam 2D2L_1_R1.fastq => 2D2L_1_R1.sam... のルールで sam ファイルを生成しよう 2D2L_1_R1.sam 2D2L_2_R1.sam 2D2L_3_R1.sam 2D_1_R1.sam 2D_2_R1.sam 2D_3_R1.sam の 6 つのファイルができるはず Abundance estimation express を使って abundance estimation をおこなう ( 例 ) 23

24 $express transcripts.fa -o 2D2L_2_R1 2D2L_2_R1.sam 上の場合 2D2L_2_R1.sam の解析結果が 2D2L_2_R1 ディレクトリ以下に保存される その中の results.xprs にカウントデータが格納されている results.xprs の中身をみてみよう results.xprs の est_counts カラムを以下のedgeR 解析に使う 各 results.xprsのest_countsのカラムだけ抽出してひとつのテーブルにまとめたい そのためには簡単なプログラミングが必要である 今回は 以下のRuby scriptで処理してください download merge_express_result.rb [ /merge_express_result.rb] (show code) ( 使い方 ) $ruby merge_express_result.rb directory1 directory2 directory3... ( 例 ) $ruby merge_express_result.rb 2D2L_1_R1 2D2L_2_R1 2D2L_3_R1 2D_1_R1 2D_2_R1 2D_3_R1 > expr_est_count_ 上の例では マージしたテーブルを シェルのリダイレクトの機能を使って expr_est_count_merged.txt に保存している 中身は以下のとおり #=== express Summary Table === # # source: # 2D_1_R1/express_out/results.xprs # 2D_2_R1/express_out/results.xprs # 2D_3_R1/express_out/results.xprs # 2D2L_1_R1/express_out/results.xprs # 2D2L_2_R1/express_out/results.xprs # 2D2L_3_R1/express_out/results.xprs # target column: 6 # script: merge_express_result.rb # date: Tue Mar 04 14:06: # # id 2D_1_R1 2D_2_R1 2D_3_R1 2D2L_1_R1 2D2L_2_R1 2D2L_3_R Differential expression analysis 複雑な統計計算で発現変動解析をあれこれ行なう前に 得られたカウントデータの概要を把握しておくことが大事 エクセルにインポートしてデータをながめてみよう R にインポートしてデータをながめてみよう data import > dat <- read.delim("expr_est_count_merged.txt", comment="#", head=f, row.name=1) > libs <- c("d1", "D2", "D3", "L1", "L2", "L3") > colnames(x) <- libs > dim(d) [1] > colsums(d) D1 D2 D3 L1 L2 L3 24

25 scatter plot > plot(x$d1+1, x$d2+1, log="xy") > pairs(x+1, log="xy") MA plot 同一 condition 内のサンプルのばらつきに比べて Dark vs Light 間のデータのばらつきほうが大きいことが確認できるだろう edger による differential expression analysis > library(edger) >group <- c("d", "D", "D", "L", "L", "L") > D <- DGEList(dat, group=group) # import table into edger > D <- calcnormfactors(d, method="tmm") # TMM normalization > D$samples group lib.size norm.factors D1 D D2 D D3 D L1 L L2 L L3 L >D <- estimatecommondisp(d) # estimate common dispersion > D$common.dispersion [1] >D <- estimatetagwisedisp(d) # estimate tagwise dispersion > summary(d$tagwise.dispersion) Min. 1st Qu. Median Mean 3rd Qu. Max >de <- exacttest(d, pair=c("d", "L")) >toptags(de) # significance test to find differentially expressed genes # view the most significant genes edger 解析結果のファイルへの書き出し # dump normalized count data > D.cpm.tmm <- cpm(d, normalized.lib.size=t) > write.table(d.cpm.tmm, file="cpm.tmm.txt", sep="\t", quote=f) # dump DE analysis result > tmp <- toptags(de, n=nrow(de$table)) > write.table(tmp$table, "de.txt", sep="\t", quote=f) このコードで normalized countデータ cpm.tmm.txt DE significance de.txt に保存される ( 補足 :edgerに含まれる便利なコマンド) plotsmear: edgerに含まれるma 描画ツール 25

26 de.names <- row.names(d[decidetestsdge(de, p.value=0.01)!=0, ]) plotsmear(d, de.tags=de.names) plotmds: MDS plot を行なうと ライブラリ間の発現パターンの類似性をおおざっぱにとらえることができる plotmds(d) DE 解析結果の吟味 de.txt を MS Excel や R を使って 吟味しよう Q1: differentially expressed genes は何個あるか? q-valueを0.01, 0.05の閾値に設定したときで数値はどうかわるか? Q2: Q1 のうちDarkで有意に上がっている遺伝子 Lightで有意に上がっている遺伝子にわけるとそれぞれ何個ずつか? Q3: 上位の遺伝子はどのような遺伝子か 現時点ではIDと配列しかわからないので BLASTサーチをしてみよう ( 参考 ) Q2に答えるためには edger command decidetestsdgeも便利 > summary(decidetestsdge(de.tagwise, p.value=0.05)) [,1] Quick annotation using BLAST transcripts.fa は ID とシーケンス情報しかないので それぞれがどのような遺伝子をコードしているかは不明であり アノテーションを行なう必要がある BLAST による相同性検索はおおまかなアノテーションを行なうのに便利な手法である ここでは シロイヌナズナのタンパク質データベースを検索することにより 各コンティグがシロイヌナズナのどのタンパク質に対応するかを調べる 今回は シロイヌナズナのシーケンスが query となるので シロイヌナズナのタンパク質データベースに対して検索をかけるとほぼ 100% ヒットする 非モデル生物の de novo RNAseq では de novo アセンブリで得られたコンティグを query に モデル生物のタンパク質データベースや nr データベースに対して検索をかけることになる シロイヌナズナのタンパク質アミノ酸配列セットを取得する ftp://ftp.arabidopsis.org/home/tair/sequences/blast_datasets/tair10_blastsets /TAIR10_pep_ _updated [ftp://ftp.arabidopsis.org/home/tair/sequences/blast_datasets /TAIR10_blastsets/TAIR10_pep_ _updated] $ makeblastdb -in TAIR10_pep_ _updated -dbtype prot -parse_seqids # build blastdb ( 検索例 ) blastx -query transcripts.fa -db TAIR10_pep_ _updated -num_threads 8 -max_target_seqs 1 \ -evalue 1.0e-8 -outfmt 6 > transcripts.blastx.tair10.txt 上の例では トップヒットだけをテーブル形式で出力している これで transcripts.fa の ID と coding gene の対応がとれた 26

27 Compile results model 生物の場合 大半の遺伝子に詳細なアノテーションがついているので それらの情報と紐づけするとさらに利便性は上がる シロイヌナズナの場合 各遺伝子の functional annotation は以下のファイルにまとめられており TAIR のウェブサイトからダウンロードすることができる ftp://ftp.arabidopsis.org/home/tair/genes/tair10_genome_release /TAIR10_functional_descriptions [ftp://ftp.arabidopsis.org/home/tair/genes /TAIR10_genome_release/TAIR10_functional_descriptions] これらの DE analysis, annotation data, をひとつのテーブルにまとめると 見やすく またさらなる下流解析を行なうのにも便利である その処理には簡単なプログラミングが必要である 今回は compile_results.rb を使って下さい 使い方 download compile_results.rb [ (view source) $ruby compile_results.rb > result_merged.txt 結果を MS Excel で吟味しよう Dark vs Light でどのような遺伝子が変動するか biological interpretation が可能になったはず git2014sopen/prac_denovo.txt Last modified: 2014/03/05 21:06 by shige Except where otherwise noted, content on this wiki is licensed under the following license:cc Attribution-Share Alike 3.0 Unported [ 27

NGSデータ解析入門Webセミナー

NGSデータ解析入門Webセミナー NGS データ解析入門 Web セミナー : RNA-Seq 解析編 1 RNA-Seq データ解析の手順 遺伝子発現量測定 シークエンス マッピング サンプル間比較 機能解析など 2 CLC Genomics Workbench 使用ツール シークエンスデータ メタデータのインポート NGS data import Import Metadata クオリティチェック Create Sequencing

More information

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会 シーケンサー利用技術講習会 第 10 回サンプル QC RNAseq ライブ ラリー作製 / データ解析実習講習会 理化学研究所ライフサイエンス技術基盤研究センターゲノムネットワーク解析支援施設田上道平 次世代シーケンサー Sequencer File Format Output(Max) Read length Illumina Hiseq2500 Fastq 600 Gb 100 bp Life

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション V1 次世代シークエンサ実習 II 本講義の内容 Reseq 解析 RNA-seq 解析 公開データ取得 クオリティコントロール マッピング 変異検出 公開データ取得 クオリティコントロール マッピング 発現定量 FPKM を算出します 2 R N A - s e q とは メッセンジャー RNA(mRNA) をキャプチャして次世代シーケンサーでシーケンシングする手法 リファレンスがある生物種の場合

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション バイオインフォマティクス 講習会 V 事前準備 が完了されている方は コンテナの起動 ファイルのコピー (Windows) まで 進めておいてください メニュー 1. 環境構築の確認 2. 基本的なLinuxコマンド 3. ツールのインストール 4. NGSデータの基礎知識と前処理 5. トランスクリプトのアッセンブル 6. RNA-seqのリファレンスcDNAマッピングとFPKM 算出 7. RNA-seqのリファレンスゲノムマッピングとFPKM

More information

GWB

GWB NGS データ解析入門 Web セミナー : De Novo シークエンス解析編 1 NGS 新規ゲノム配列解析の手順 シークエンス 遺伝子領域の検出 アセンブル データベース検索 2 解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 前処理 コンティグ配列の作成 CLC Genomics Workbench 遺伝子領域の検出 Blast2GO PRO データベース検索

More information

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science IonTorrent RNA-Seq 解析概要 2017-03 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science 資料概要 この資料は IonTorrent シーケンサーで RNA-Seq (WholeTranscriptome mrna ampliseqrna mirna) 解析を実施されるユーザー様向けの内容となっています

More information

GWB_RNA-Seq_

GWB_RNA-Seq_ CLC Genomics Workbench ウェブトレーニングセミナー : RNA-Seq 編 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 Advanced RNA-Seq プラグイン CLC Genomics Workbench 9.0 / Biomedical Genomics Workbench 3.0 以降で使用可能な無償プラグイン RNA-Seq

More information

Qlucore_seminar_slide_180604

Qlucore_seminar_slide_180604 シングルセル RNA-Seq のための 情報解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 シングルセル RNA-Seq シングルセル RNA-Seq のデータ解析では 通常の RNA-Seq データの解析手法に加え データセット内の各細胞の遺伝子発現プロファイルの違いを俯瞰できるような 強力な情報解析アルゴリズムと データのビジュアライズ機能を利用する必要がある

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション V1 次世代シークエンサ実習 II 本講義にあたって 代表的な解析の流れを紹介します 論文でよく使用されているツールを使用します コマンドを沢山実行します スペルミスが心配な方は コマンド例がありますのでコピーして実行してください /home/admin1409/amelieff/ngs/reseq_command.txt マークのコマンドは実行してください 実行が遅れてもあせらずに 応用や課題の間に追い付いてください

More information

2016_RNAseq解析_修正版

2016_RNAseq解析_修正版 平成 28 年度 NGS ハンズオン講習会 RNA-seq 解析 2016 年 7 27 本講義にあたって n 代表的な解析の流れを紹介します 論 でよく使 されているツールを使 します n コマンドを沢 実 します タイプミスが 配な は コマンド例がありますのでコピーして実 してください 実 が遅れてもあせらずに 課題や休憩の間に追い付いてください Amelieff Corporation All

More information

nagasaki_GMT2015_key09

nagasaki_GMT2015_key09 Workflow Variant Calling 03 長崎は遺伝研 大量遺伝情報研究室の所属です 国立遺伝学研究所 生命情報研究センター 3F 2F 欧州EBIと米国NCBIと密接に協力しながら DDBJ/EMBL/GenBank国際塩基配列データ ベースを構築しています 私たちは 塩基配列登録を支援するシステムづくり 登録データを活用するシステムづくり 高速シーケンス配列の情報解析 を行なっています

More information

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編

CLC Genomics Workbench ウェブトレーニングセミナー: 変異解析編 CLC Genomics Workbench ウェブトレーニングセミナー : 遺伝子発現解析編 12 th Feb., 2016 フィルジェン株式会社バイオサイエンス部 biosupport@filgen.jp Feb., 2016_V2 1 遺伝子発現解析概要 本日のセミナーにおける解析の流れ及び使用するツール名 ( 図中赤枠部分 ) Case Control インポート インポート インポート

More information

リード・ゲノム・アノテーションインポート

リード・ゲノム・アノテーションインポート リード ゲノム アノテーションインポート 1 Location と Folder ロケーション フォルダ Genomics Workbenchではデータを以下のような階層構造で保存可能です フォルダの一番上位の階層を Location と呼び その下の階層を Folder と呼びます データの保存場所はロケーション毎に設定可能です たとえばあるデータは C ドライブに保存し あるデータは D ドライブに保存するといった事が可能です

More information

RNA-seq

RNA-seq RNA-seq 1 RNA-seq 解析フロー RNA-seq インポート クオリティチェック RNA-seq 発現差解析 この資料では RNA-seq からの説明となりますが インポート クオリティチェックについては サポート資料のページより内容をご確認いただけます 2 データ 発現解析用デモデータは 以下よりダウンロードいただけます ES 細胞 (ESC) と神経前駆細胞 (NPC) の発現解析を小さなデモデータで行えます

More information

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View(  でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー KaPPA-Average 1.0 マニュアル 第 1.0 版 制作者 : かずさ DNA 研究所櫻井望 制作日 : 2010 年 1 月 12 日 目次 1. はじめに 2 1-1. KaPPA-Average とは 2 1-2. 動作環境 3 1-3. インストールと起動 3 2. 操作説明 4 2-1. メイン機能 - Calc. Average 4 2-1-1. データの準備 4 2-1-2.

More information

PrimerArray® Analysis Tool Ver.2.2

PrimerArray® Analysis Tool Ver.2.2 研究用 PrimerArray Analysis Tool Ver.2.2 説明書 v201801 PrimerArray Analysis Tool Ver.2.2 は PrimerArray( 製品コード PH001 ~ PH007 PH009 ~ PH015 PN001 ~ PN015) で得られたデータを解析するためのツールで コントロールサンプルと 1 種類の未知サンプル間の比較が可能です

More information

ChIP-seq

ChIP-seq ChIP-seq 1 ChIP-seq 解析原理 ChIP サンプルのフラグメントでは タンパク質結合部位付近にそれぞれ Forward と Reverse のリードがマップされることが予想される ChIP のサンプルでは Forward と Reverse のリードを 3 側へシフトさせ ChIP のピークを算出する コントロールサンプルでは ChIP のサンプルとは異なり 特定の場所に多くマップされないため

More information

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved. V1 ゲノム R e s e q 変異解析 本講義にあたって 代表的な解析の流れを紹介します 論文でよく使用されているツールを使用します コマンドを沢山実行します スペルミスが心配な方は コマンド例がありますのでコピーし て実行してください マークのコマンドは実行してください 実行が遅れてもあせらずに 応用や課題の間に追い付いてくだ さい 2 本講義の内容 Reseq解析 RNA-seq解析 公開データ取得

More information

GWB

GWB NGS データ解析入門 Web セミナー : 変異解析編 1 NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2 CLC Genomics Workbench 使用ツール シークエンスデータのインポート NGS data import クオリティチェック QC for Sequencing Reads Trim Reads 参照ゲノム配列へのマッピング 再アライメント

More information

_unix_text_command.pptx

_unix_text_command.pptx Unix によるテキストファイル処理 2015/07/30 作業場所 以降の作業は 以下のディレクトリで行います ~/unix15/text/ cd コマンドを用いてディレクトリを移動し pwd コマンドを利用して カレントディレクトリが上記になっていることを確認してください 実習で使用するデータ 講習で使用するデータは以下のフォルダ内 ファイルがあることを確認してください ~/unix15/text/

More information

PowerPoint Presentation

PowerPoint Presentation エピジェノミクス解析編 2016/08/10 Filgen ChIP-seq (Transfactor & Histone), Bisulfite webex seminar 株式会社キアゲンアプライドアドバンストゲノミクス宮本真理, PhD 1 アジェンダ ChIP-seq 解析 Transcription Factor ChIP-seq Histone ChIP-seq Bisulfite-seq

More information

AJACS18_ ppt

AJACS18_ ppt 1, 1, 1, 1, 1, 1,2, 1,2, 1 1 DDBJ 2 AJACS3 2010 6 414:20-15:20 2231 DDBJ DDBJ DDBJ DDBJ NCBI (GenBank) DDBJ EBI (EMBL-Bank) GEO DDBJ Omics ARchive(DOR) ArrayExpress DTA (DDBJ Trace Archive) DRA (DDBJ

More information

141025mishima

141025mishima NGS (RNAseq) »NGS Now Generation Sequencer»NGS»» 4 NGS(Next Generation Sequencer) Now Generation Sequencer http://www.youtube.com/watch?v=womkfikwlxm http://www.youtube.com/watch?v=mxkya9xcvbq http://www.youtube.com/watch?v=nhcj8ptycfc

More information

RNA-seq

RNA-seq CLC Genomics Workbench ハンズオントレーニング RNA-seq 株式会社 CLCバイオジャパンシニアフィールドバイオインフォマティクスサイエンティスト宮本真理 Ph.D. mmiyamoto@clcbio.co.jp 1 support@clcbio.co.jp 2 アジェンダ Genomics Workbench 概要 今日のデータ RNA-seq 解析 データインポート QC

More information

直接 Reports & Statistics タブへの移動も可能です A. Publication Finder の統計を取得する Publication Finder Reports 1 Publication Finder タブが選択されていることをご確認下さい 2 下記項目を入力して下さい

直接 Reports & Statistics タブへの移動も可能です A. Publication Finder の統計を取得する Publication Finder Reports 1 Publication Finder タブが選択されていることをご確認下さい 2 下記項目を入力して下さい 利用統計を取得する 様々な側面からユーザーの利用状況を把握することができますここでは 基本的な利用統計レポートの作成方法をご説明します ( この項目は日本語表示に対応しておりません ) 1. Overview[ 概要 ] Quick Actions [ クィックアクション ] カテゴリ内にある Full Text Finder Reports[Full Text Finder レポート ] を選択して下さい

More information

GWB

GWB NGS データ解析入門 Web セミナー : 変異解析編 1 NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2 解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 参照ゲノム配列へのマッピング 再アライメント 変異検出 CLC Genomics Workbench または Biomedical Genomics Workbench

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) RNA-Seqデータ解析における正規化法の選択 :RPKM 値でサンプル間比較は危険?! 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 よりよい正規化法とは? その正規化法によって得られたデータを用いて発現変動の度合いでランキングしたときに

More information

ゲノム情報解析基礎 ~ Rで塩基配列解析 ~

ゲノム情報解析基礎 ~ Rで塩基配列解析 ~ ネット接続できないヒトも ダブルクリックでローカルに r_seq.html を起動可能です 実習は デスクトップ上にある hoge フォルダの中身が以下の状態を想定して行います (R で ) 塩基配列解析の利用法 : GC 含量計算から発現変動解析まで東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究プログラム門田幸二 ( かどたこうじ ) kadota@iu.a.u-tokyo.ac.jp

More information

ThermoFisher

ThermoFisher Thermo Fisher Connect Relative Quantification 操作簡易資料 http://www.thermofisher.com/cloud 使用には事前登録が必要になります 画面は予告なく変わることがあります The world leader in serving science Thermo Fisher Connect とは? キャピラリシーケンサ リアルタイム

More information

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用 EBSCOadmin 利用統計設定方法 EBSCOadmin 内の Report & Statistics 機能をご利用頂くことで セッション別 発信元の IP アドレス別 デー タベース別 最も多く検索された雑誌タイトルなどに限定して ユーザーのデータベース利用頻度を把握すること ができます ここでは 基本的なデータベースの利用統計レポートの作成方法をご説明します 利用統計を設定する (=Standard

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション データベースシステム入門 7. 集計, 集約 1 リレーショナルデータベースシステム コンピュータ リレーショナルデータベース管理システム 記憶装置 リレーショナルデータベース あわせてリレーショナルデータベースシステム データの種類ごとに分かれた たくさんのテーブルが格納される 2 SQL をマスターするには SQL のキーワード create table テーブル定義 select 射影など from

More information

k_seminar_hands_on_for_linux_beginner.pptx

k_seminar_hands_on_for_linux_beginner.pptx 京 初級者向けハンズオン Linux 初心者向け資料 一般財団法人高度情報科学技術研究機構神戸センター 2017 年 5 月 16 日 2 Linux 初心者の方へ ハンズオン講習会では RIST FX10(OSはLinuxベース ) を使って 実習して頂きます Linuxに不慣れであまり自信がない方は 必須となる以下に示すコマンドについて 機能と使用方法を事前にご確認下さい cat cd cp ls

More information

Maser - User Operation Manual

Maser - User Operation Manual Maser 3 Cell Innovation User Operation Manual 2013.4.1 1 目次 1. はじめに... 3 1.1. 推奨動作環境... 3 2. データの登録... 4 2.1. プロジェクトの作成... 4 2.2. Projectへのデータのアップロード... 8 2.2.1. HTTPSでのアップロード... 8 2.2.2. SFTPでのアップロード...

More information

win版8日目

win版8日目 8 日目 : 項目のチェック (2) 1 日 30 分くらい,30 日で何とか R をそこそこ使えるようになるための練習帳 :Win 版 昨日は, 平均値などの基礎統計量を計算する試行錯誤へご招待しましたが (?), 今日は簡 単にやってみます そのためには,psych というパッケージが必要となりますが, パッケー ジのインストール & 読み込みの詳しい方法は, 後で説明します 以下の説明は,psych

More information

Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool

Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool for developing software for embedded systems that

More information

KEGG.ppt

KEGG.ppt 1 2 3 4 KEGG: Kyoto Encyclopedia of Genes and Genomes http://www.genome.jp/kegg/kegg2.html http://www.genome.jp/kegg/kegg_ja.html 5 KEGG PATHWAY 生体内(外)の分子間ネットワーク図 代謝系 12カテゴリ 中間代謝 二次代謝 薬の 代謝 全体像 制御系 20カテゴリ

More information

2015アレイ解析プロトコル

2015アレイ解析プロトコル マイクロアレイデータ 解 析 (4 日 目 5 日 目 6 日 目 ) アレイデータのファイルや 実 習 の 連 絡 事 項 を 共 有 できる wiki を 用 意 しました http://bit.ly/microarray2015 4 日 目 ⅰ) Excel によるデータ 解 析 1. 全 サンプルのデータを 1 つのワークシートにまとめる 行 番 号 とプローブ 番 号 の 対 応 関 係

More information

プレゼンテーション2.ppt

プレゼンテーション2.ppt ryamasi@hgc.jp BLAST Genome browser InterProScan PSORT DBTSS Seqlogo JASPAR Melina II Panther Babelomics +@ >cdna_test CCCCTGCCCTCAACAAGATGTTTTGCCAACTGGCCAAGACCTGCCCTGTGCAGCTGTGGGTTGATTCCAC ACCCCCGCCCGGCACCCGCGTCCGCGCCATGGCCATCTACAAGCAGTCACAGCACATGACGGAGGTTGTG

More information

NGSハンズオン講習会

NGSハンズオン講習会 207.08.08 版 プラスアルファの内容です NGS 解析 ( 初 ~ 中級 ) ゲノムアセンブリ後の各種解析の補足資料 ( プラスアルファ ) 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究プログラム寺田朋子 門田幸二 Aug 29-30 207 Contents Gepard でドットプロット 連載第 8 回 W5-3 で最も長い sequence 同士のドットプロットを実行できなかったが

More information

特論I

特論I 講義室後ろにある USB メモリ中の hoge フォルダをデスクトップにコピーしておいてください 農学生命情報科学特論 I 第 4 回 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 kadota@iu.a.u-tokyo.ac.jp 1 前回の課題と正答 アダプター配列除去前後の small RNA-seq データをカイコゲノムにマップし マップ率 ( マップされたリード数

More information

PowerPoint Presentation

PowerPoint Presentation CLC Microbial Genomics Module 株式会社キアゲングローバルインフォマティクスソリューションズ & サポートアプライドアドバンストゲノミクス宮本真理 Ph.D. Filgen WebEx seminar, 2015/07/16 (2015/07/30) 1 Agenda メタゲノミクス解析 製品概要 機能紹介 デモ Filgen WebEx seminar, 2015/07/16

More information

バクテリアゲノム解析

バクテリアゲノム解析 GCCGTAGCTACCTTTACAATA GCCGTAGCT AGCTACC GCTACCTTT CCTTTAC CTTTACAATA GCCG CCGT CGTA GTAG TAGC AGCT AGCT GCTA CTAC TACC GCTA CTAC TACC ACCT CCTT CTTT CCTT CTTT TTTA TTAC CTTT TTTA TTAC TACA ACAA CAAT AATA

More information

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 yamamoto@sraoss.co.jp Sylph-Searcher とは Sylpheed 向け電子メール全文検索アプリケーション PostgreSQL 8.2の全文検索機能を利用 Linux/Unix Windows 2000

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

データ分析のまとめ方

データ分析のまとめ方 R ではさまざまなデータを分析することができる R のデータセットを使う 外部ファイルを使う 作業ディレクトリの確認と変更 データの探し方 作業ディレクトリ (working directory) の確認と変更 Windows や mac では作業ディレクトリを変更できる 作業ディレクトリを自分の PC の デスクトップ に設定すると操作しやすい メニューでは : Windows の場合 : ファイル

More information

1 I EViews View Proc Freeze

1 I EViews View Proc Freeze EViews 2017 9 6 1 I EViews 4 1 5 2 10 3 13 4 16 4.1 View.......................................... 17 4.2 Proc.......................................... 22 4.3 Freeze & Name....................................

More information

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ モンテカルロ法による分子進化の分岐図作成 のための最適化法 石井一夫 1 松田朋子 2 古崎利紀 1 後藤哲雄 2 1 東京農工大学 2 茨城大学 2013 9 9 2013 1 我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標

More information

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成 アノテーション フィルタリング用パイプラインと クリニカルレポートの作成 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 クリニカルシーケンス解析パイプライン 1. リファレンスゲノム配列へのアライメント / マッピング 2. 変異の検出 3. アノテーション付けとフィルタリング 4. レポートの作成 2 臨床現場で活用する場合は シンプルな操作性で 高度な専門知識がなくても使用できる

More information

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co

~~~~~~~~~~~~~~~~~~ wait Call CPU time 1, latch: library cache 7, latch: library cache lock 4, job scheduler co 072 DB Magazine 2007 September ~~~~~~~~~~~~~~~~~~ wait Call CPU time 1,055 34.7 latch: library cache 7,278 750 103 24.7 latch: library cache lock 4,194 465 111 15.3 job scheduler coordinator slave wait

More information

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太 ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : 095739 K 氏名 : 當銘孔太 1. UNIX における正規表現とは何か, 使い方の例を挙げて説明しなさい. 1.1 正規表現とは? 正規表現 ( 正則表現ともいう ) とは ある規則に基づいて文字列 ( 記号列 ) の集合を表す方法の 1 つです ファイル名表示で使うワイルドカードも正規表現の兄弟みたいなもの

More information

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E MEGA 5 を用いた塩基配列解析法および分子系統樹作成法 Ver.1 Update: 2012.04.01 ウイルス 疫学研究領域井関博 < 内容 > 1. MEGA 5 をインストールする 1.1 ダウンロード手順 2. 塩基配列を決定する 2.1 Alignment Explorer の起動 2.2 シークエンスデータの入力 2.2.1 テキストファイルから読み込む場合 2.2.2 波形データから読み込む場合

More information

講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2

講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2 N G S 解析基礎 講義内容 ファイル形式 データの可視化 データのクオリティチェック マッピング アセンブル 資料の見方 $ pwd 実際に入力するコマンドを黄色い四角の中に示します 2 ファイル形式 NGS 解析でよく使われるファイル形式 ファイル形式 fastq bam/sam vcf bed fasta サンプルデータの場所 /home/ ユーザ名 /Desktop/amelieff/1K_ERR038793_1.fastq

More information

Nakamura

Nakamura FASTA, BLAST, PSI-BLAST, HMMPFAM 4-1 4-2 4-3 MEDSI (2003) 4-4 DOROTHYCROWFOOTHODGKIN DOROTHY--------HODGKIN MEDSI (2003) 4-5 4-6 !Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990)!

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 準備編 CUI とはコマンドの基本知識 * Graphical User Interface マウスで操作 * Command User Interface キーボードによるコマンド入力 CUI の特長 コンピュータはもともとキーボードだけで使える 今でも GUI でなく CUI で使う ( しか使えない ) アプリがある コマンド ( 命令 ) を打ちさえすればやってくれる 明快 コマンドを勉強すればするほど熟練者になれる

More information

How to use Keysight B2900A Quick I/V Measurement Software

How to use Keysight B2900A Quick I/V Measurement Software Keysight B2900A Quick I/V メジャメントソフトウエアの使い方 Keysight Technologies 28 th of Sep, 2015 Keysight B2900A Quick I/V メジャメントソフトウエア PC 向けの無償ソフトウエアです 本体と PC 間は GPIB, USB あるいは LAN で接続できます 最大 4 チャンネルの SMU や Power

More information

バイオインフォマティクスⅠ

バイオインフォマティクスⅠ バイオインフォマティクス ( 第 5 回 ) 慶應義塾大学生命情報学科 榊原康文 多重アライメントの解 0 2 3 4 5 6 7 j Q T S Y T R Y Q T - Y T R K 0 0-9 -20-44 -52-63 -72-90 Q -6 2 0-6 -4-25 -34-52 2 S -32 5 30 4 6-5 -4-32 3 Y -48-4 2 38 27 8 0 4 P -64-27

More information

Agilent 1色法 2条件比較 繰り返し実験なし

Agilent 1色法 2条件比較 繰り返し実験なし GeneSpring GX11.0.2 ビギナーズガイド Agilent 1 色法 2 条件の比較繰り返し実験あり 適用 薬剤非投与と投与の解析 Wild type と Knock out の解析 正常細胞と病態細胞の解析 など ビギナーズガイドは 様々なマイクロアレイの実験デザインがあるなかで 実験デザインの種類ごとに適切なデータ解析の流れを 実例とともに紹介するガイドブックです ご自分の実験デザインに適合したガイドをお使いください

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) RNA-Seq データ解析リテラシー 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 2009 年ごろの私 次世代シーケンサー (NGS) 解析についての認識 単に短い塩基配列が沢山あるだけでしょ 得られる配列データって

More information

NGS速習コース

NGS速習コース バイオインフォマティクス人材育成カリキュラム ( 次世代シークエンサ ) 速習コース 3. データ解析基礎 3-3. R 各種パッケージ 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) kadota@iu.a.u-tokyo.ac.jp http://www.iu.a.u-tokyo.ac.jp/~kadota/ 1 Contents

More information

作図コマンド : pscoast -R125/148/30/46 -JM15c -B5g5 -Di -W5 -S235 -X6c -Y4c > test.ps 作図例 : 2 分布図の作成 2.1 点を描く 地点の分布を作図するときは たとえば以下のように行います > pscoast -R125/1

作図コマンド : pscoast -R125/148/30/46 -JM15c -B5g5 -Di -W5 -S235 -X6c -Y4c > test.ps 作図例 : 2 分布図の作成 2.1 点を描く 地点の分布を作図するときは たとえば以下のように行います > pscoast -R125/1 GMT の使い方 GMT(Generic Mapping Tools) は おもに 気象データなどのデータを地図上に作図するために使われるアプリケーションです 気象学の中では メソ気象のような小さめのスケールの気象を扱う分野で広く使われています GMT は Linux Windows Mac で使うことができ 個人の Windows PC にもインストール可能です また ウェブページの検索によって詳しい使い方を調べることもできます

More information

次世代シークエンサーを用いたがんクリニカルシークエンス解析

次世代シークエンサーを用いたがんクリニカルシークエンス解析 次世代シークエンサーを用いた がんクリニカルシークエンス解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 がん遺伝子パネル がん関連遺伝子のターゲットシークエンス用のアッセイキット コストの低減や 研究プログラムの簡素化に有用 網羅的シークエンス解析の場合に比べて 1 遺伝子あたりのシークエンス量が増えるため より高感度な変異の検出が可能 2 変異データ解析パイプライン

More information

Chromeleon 6 for Chromeleon 6.8 SR15 Build: --- 新しいシーケンスの作成に使用できるワークリストファイル (.wle) Doc. Nr: CM6_68150_0020 Doc. Ver.: Doc. Type: Guide

Chromeleon 6 for Chromeleon 6.8 SR15 Build: --- 新しいシーケンスの作成に使用できるワークリストファイル (.wle) Doc. Nr: CM6_68150_0020 Doc. Ver.: Doc. Type: Guide for.8 SR15 Build: --- LIMS ワークリストの書式 はじめに Chromeleon における LIMS データ ( シーケンス ) 読取りフォーマットをワークリスト (WLE ファイル ) といいます ワークリストファイル形式で LIMS から情報を出力して頂ければ Chromeleon でインポートできます そのため LIMS からワークリスト形式で出力できるように LIMS

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション ファイルシステム 各自自分のファイルシステムは 各自しっかり把握し 整備は自分で行う * 自分のファイルシステムで迷子になる (1) どこにどのファイルがあるのか分からなくなる (2) 今自分はどこで作業しているのか ( つまりカレントディレクトリはどこか ) 分からなくなるのが 実習がうまくできない主な原因のひとつです 迷子になったら Finder で自分のファイルシステムを確認するのが良いでしょう

More information

<4D F736F F F696E74202D D D E C815B836A F B83582E >

<4D F736F F F696E74202D D D E C815B836A F B83582E > 2012.03.22 マッピングデータの基本フォーマットと基本ツール 次世代シーケンサーに良く用いられるファイル形式 Samtools Integrative Genomics Viewer(IGV) 基礎生物学研究所 生物機能解析センター 山口勝司 NIBB CORE RESEARCH FACILITIES FUNCTIONAL GENOMICS FACILITY NIBB CORE RESEARCH

More information

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable

> usdata01 と打ち込んでエンター キーを押すと V1 V2 V : : : : のように表示され 読み込まれていることがわかる ここで V1, V2, V3 は R が列のデータに自 動的につけた変数名である ( variable R による回帰分析 ( 最小二乗法 ) この資料では 1. データを読み込む 2. 最小二乗法によってパラメーターを推定する 3. データをプロットし 回帰直線を書き込む 4. いろいろなデータの読み込み方について簡単に説明する 1. データを読み込む 以下では read.table( ) 関数を使ってテキストファイル ( 拡張子が.txt のファイル ) のデー タの読み込み方を説明する 1.1

More information

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx

Microsoft PowerPoint - ●SWIM_ _INET掲載用.pptx シーケンスに基づく検索モデルの検索精度について 東京工芸大学工学部コンピュータ応用学科宇田川佳久 (1/3) (2/3) 要員数 情報システム開発のイメージソースコード検索機能 他人が作ったプログラムを保守する必要がある 実務面での応用 1 バグあるいは脆弱なコードを探す ( 品質の高いシステムを開発する ) 2 プログラム理解を支援する ( 第 3 者が書いたコードを保守する ) 要件定義外部設計内部設計

More information

Agilent Microarray Total Solution 5 5 RNA-Seq 60 mer DNA in situ DNA 5 2 QC 4200 TapeStation 2100 / mirna CGHCGH+SNP ChIP-on-chip 2 mirna QC

Agilent Microarray Total Solution 5 5 RNA-Seq 60 mer DNA in situ DNA 5 2 QC 4200 TapeStation 2100 / mirna CGHCGH+SNP ChIP-on-chip 2 mirna QC Microarray Agilent Microarray Total Solution Agilent Microarray Total Solution 5 5 RNA-Seq 60 mer DNA in situ DNA 5 2 QC 4200 TapeStation 2100 / mirna CGHCGH+SNP ChIP-on-chip 2 mirna QC RNA / mirna total

More information

Taro-cshプログラミングの応用.jt

Taro-cshプログラミングの応用.jt c s h プログラミングの応用 0. 目次 1. 課題 課題 1 : 与えられたパス名からディレクトリ名とファイル名を分離し出力せよ 課題 2 : オプション (-in) の後に続く文字列とオプション (-out) の後に続く文字列をそれぞれまとめる オプションの指定がなく文字列から始まるとき -in を仮定する 課題 3 : 複数のファイルから与えられたパターンとマッチする文字列を含む行を取り出せ

More information

はじめに このドキュメントではftServerに関する障害調査を行う際に 必要となるログ データの取得方法を説明しています ログ データの取得には 初期解析用のデータの取得方法と 詳細な調査を行うときのデータ取得方法があります 特別な理由でOS 側のログが必要となった場合には RHELログの取得につ

はじめに このドキュメントではftServerに関する障害調査を行う際に 必要となるログ データの取得方法を説明しています ログ データの取得には 初期解析用のデータの取得方法と 詳細な調査を行うときのデータ取得方法があります 特別な理由でOS 側のログが必要となった場合には RHELログの取得につ ftserver におけるログ取得手順 (Linux 編 ) Rev 0.5: 2017/06/08 1 はじめに このドキュメントではftServerに関する障害調査を行う際に 必要となるログ データの取得方法を説明しています ログ データの取得には 初期解析用のデータの取得方法と 詳細な調査を行うときのデータ取得方法があります 特別な理由でOS 側のログが必要となった場合には RHELログの取得について

More information

ゲートウェイのファイル形式

ゲートウェイのファイル形式 CHAPTER 47 Cisco Unified Communications Manager 一括管理 (BAT) を使用すると シスコのを Cisco Unified Communications Manager データベースに一括して設定できます 次のトピックでは これらのタスクの情報とについて説明します の検索 の設定 の検索 を検索するは 次のとおりです ステップ 1 [ 一括管理 ]>[

More information

kubostat2015e p.2 how to specify Poisson regression model, a GLM GLM how to specify model, a GLM GLM logistic probability distribution Poisson distrib

kubostat2015e p.2 how to specify Poisson regression model, a GLM GLM how to specify model, a GLM GLM logistic probability distribution Poisson distrib kubostat2015e p.1 I 2015 (e) GLM kubo@ees.hokudai.ac.jp http://goo.gl/76c4i 2015 07 22 2015 07 21 16:26 kubostat2015e (http://goo.gl/76c4i) 2015 (e) 2015 07 22 1 / 42 1 N k 2 binomial distribution logit

More information

Microsoft PowerPoint _webinar_RNAExpress.erikibukawa_配布用.pptx

Microsoft PowerPoint _webinar_RNAExpress.erikibukawa_配布用.pptx 2014 年 10 月 17 日イルミナサポートウェビナー RNA Seq を始めよう! BaseSpace で行う かんたん NGS データ解析 < RNA Express > イルミナ株式会社バイオインフォマティクスサポートサイエンティスト癸生川絵里 (Eri Kibukawa) 2013 2014 Illumina, Inc. All rights reserved. Illumina, 24sure,

More information

Red Hat Enterprise Linux 6 Portable SUSE Linux Enterprise Server 9 Portable SUSE Linux Enterprise Server 10 Portable SUSE Linux Enterprise Server 11 P

Red Hat Enterprise Linux 6 Portable SUSE Linux Enterprise Server 9 Portable SUSE Linux Enterprise Server 10 Portable SUSE Linux Enterprise Server 11 P Dynamic System Analysis (DSA) を使用した稼動システムのインベントリー情報収集について 本文 IBM Dynamic System Analysis (DSA) は サーバーのインベントリ情報を収集し ファイル出力することが可能な診断ツールです 稼動システムのインベントリー情報を収集することで 障害時の問題判別を円滑に実施することができます 以下の IBM の Web サイトから入手することが可能です

More information

「統 計 数 学 3」

「統 計 数 学 3」 関数の使い方 1 関数と引数 関数の構造 関数名 ( 引数 1, 引数 2, 引数 3, ) 例 : マハラノビス距離を求める関数 mahalanobis(data,m,v) 引数名を指定して記述する場合 mahalanobis(x=data, center=m, cov=v) 2 関数についてのヘルプ 基本的な関数のヘルプの呼び出し? 関数名 例 :?mean 例 :?mahalanobis 指定できる引数を確認する関数

More information

Maeda140303

Maeda140303 2014 NGS NIBB - - - - FASTA / FASTQ - BED GFF/GTF WIG - SAM / BAM - SAMtools Web HTML (PC/), OS (Windows/Mac), IE/Chrome/Safari NGS Wet - - NGS - FASTA, FASTQ, csfastq, FASTA/qual, SRA, - BED, GFF/GTF,

More information

160420c_unix.pptx

160420c_unix.pptx 出席の確認のため pi にログインして待つこと ちなみに演習室外からリモートログインしてもダメ ターミナルは 2 つ開いておくと便利 UNIX の復習 陰山聡計算科学演習 A1 第 2 回講義資料 本資料のオリジナルは関和弘先生 中村匡秀先生 臼井英之先生によって作成されました. 今日やること UNIX の基礎 ディレクトリ コマンド 環境変数 シェルスクリプト 今さら UNIX? という人は まずは今日の課題

More information

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó

¥¤¥ó¥¿¡¼¥Í¥Ã¥È·×¬¤È¥Ç¡¼¥¿²òÀÏ Âè2²ó 2 2015 4 20 1 (4/13) : ruby 2 / 49 2 ( ) : gnuplot 3 / 49 1 1 2014 6 IIJ / 4 / 49 1 ( ) / 5 / 49 ( ) 6 / 49 (summary statistics) : (mean) (median) (mode) : (range) (variance) (standard deviation) 7 / 49

More information

CodeGear Developer Camp

CodeGear Developer Camp B4 InterBase テクニカルセッション InterBase セキュリティパワーアップ セキュリティ改善のコツとツール キムラデービー代表木村明治 ( きむらめいじ ) http://kimuradb.com 1 アジェンダ DBセキュリティとは? InterBase 本体が持つセキュリティ機能 通信経路の暗号化 格納データの暗号化 2 DB セキュリティとは? 3 概略全体図 InterBase

More information

レポートでのデータのフィルタ

レポートでのデータのフィルタ フィルタのタイプ, 1 ページ 日付の範囲フィルタの設定, 2 ページ 値リストまたはコレクション フィルタの設定, 3 ページ 詳細フィルタの設定, 5 ページ フィルタのタイプ フィルタのタイプは [基本フィルタ Basic Filters ] と [詳細フィルタ Advanced Filters ] の 2 種類から選択できます [基本フィルタ Basic Filters ] [基本フィルタ

More information

XEN 仮想マシンの移植 Islandcenter.jp 2009/04/14 既に作成済みの XEN 仮想マシンを移植する方法を説明します 仮想マシンイメージは 通常 /var/lib/xen/image/myvmachine に作成されていますが このファイルを tar 圧縮してリムーバブルメデ

XEN 仮想マシンの移植 Islandcenter.jp 2009/04/14 既に作成済みの XEN 仮想マシンを移植する方法を説明します 仮想マシンイメージは 通常 /var/lib/xen/image/myvmachine に作成されていますが このファイルを tar 圧縮してリムーバブルメデ XEN 仮想マシンの移植 2009/04/14 既に作成済みの XEN 仮想マシンを移植する方法を説明します 仮想マシンイメージは 通常 /var/lib/xen/image/myvmachine に作成されていますが このファイルを tar 圧縮してリムーバブルメディアにコピーするなり rsync で他のコンピュータにコピーしたり あるいはバックアップされて今は使われていないイメージを戻して再利用することができます

More information

スライド 1

スライド 1 C# の基本 ~ ファイル読み込み ~ 今回学ぶ事 今回はファイル読み書きに必要 BinaryReader クラスについて記載する ファイル参照ダイアログである OpenFileDialog クラスについても理解を深める また Bitmap クラスを用いた Bitmap ファイルの読み込み方法についても学ぶ フォーム作り まず label picturebox を配置する ツールボックスより左クリックで選択する

More information

EnSight 10.1の新機能

EnSight 10.1の新機能 EnSight の処理の自動化のためのテクニックのご紹介 CEI ソフトウェア株式会社 松野康幸 2016 年 11 月 4 日 本日の予定 EnSight の処理の自動化に向けて EnSight のコマンドでできること EnSight で利用できるコマンドの種類 コマンド ファイルの作り方 Python 形式のコマンドの作り方作成したコマンド ファイルの実行方法ユーザー定義ツールの作り方ユーザー定義ツールの使い方

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) トランスクリプトーム解析の今昔 なぜマイクロアレイ? なぜRNA-Seq? 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 Contents トランスクリプトーム解析の概要 各手法の長所 短所 マイクロアレイ

More information

Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq

Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq NGS Maser 2013/10/17 Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq Maser RNA-seq Genome Resequencing De novo Genome Sequencing Metagenome ChIP-seq CAGE BS-seq

More information

Slide 1

Slide 1 MEGA5 と Perl を用いた 分子進化解析の基礎 野澤昌文 2012 年 1 月 16 日基礎生物学研究所 ハンズオンセミナー 1 分子進化研究における一般的手法 相同な配列の比較 塩基配列 配列名塩基配列 A A T G G T A C A C B A T G A T A C A C C A T G G T A C A T アミノ酸配列 配列名 アミノ酸配列 A Met Val His B

More information

SolarWinds Event Log Forwarder for Windows v

SolarWinds Event Log Forwarder for Windows v SolarWinds Event Log Forwarder for Windows v1.2.0 の説明 2015 年 8 月 5 日 このツールは Windows イベントログを Syslog に変換して転送するフリーツールです Ver.1.2.0 より日本語表示のまま Windows イベントログの転送が可能になり Kiwi Syslog Server v9.4.2 と同時にリリースされました

More information

要旨 : データステップ及び SGPLOT プロシジャにおける POLYGON/TEXT ステートメントを利用した SAS プログラムステップフローチャートを生成する SAS プログラムを紹介する キーワード :SGPLOT, フローチャート, 可視化 2

要旨 : データステップ及び SGPLOT プロシジャにおける POLYGON/TEXT ステートメントを利用した SAS プログラムステップフローチャートを生成する SAS プログラムを紹介する キーワード :SGPLOT, フローチャート, 可視化 2 SAS プログラムの可視化 - SAS プログラムステップフローチャート生成プログラムの紹介 - 福田裕章 1 ( 1 MSD 株式会社 ) Visualization of SAS programs Hiroaki Fukuda MSD K.K. 要旨 : データステップ及び SGPLOT プロシジャにおける POLYGON/TEXT ステートメントを利用した SAS プログラムステップフローチャートを生成する

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

ECCS. ECCS,. ( 2. Mac Do-file Editor. Mac Do-file Editor Windows Do-file Editor Top Do-file e

ECCS. ECCS,. (  2. Mac Do-file Editor. Mac Do-file Editor Windows Do-file Editor Top Do-file e 1 1 2015 4 6 1. ECCS. ECCS,. (https://ras.ecc.u-tokyo.ac.jp/guacamole/) 2. Mac Do-file Editor. Mac Do-file Editor Windows Do-file Editor Top Do-file editor, Do View Do-file Editor Execute(do). 3. Mac System

More information

Java Bridgeを利用した他言語によるデータロード&プロットデモ

Java Bridgeを利用した他言語によるデータロード&プロットデモ Java Bridge を利用した他言語による データロード & プロットデモ 担当 : 阿部 ( 九大 ICSWSE) 2013/08/21 2013 年度データ解析講習会 @NIPR 1 Outline 1. Java bridgeとは 2. JUDASとは 3. Java bridgeを使う Purpose Java bridge とその仕組みを知る 他の言語から Java クラスを呼び出して

More information

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド

Partek Flow リリースノート バージョン : Partek Flow バージョン は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド Partek Flow リリースノート バージョン : 5.0.16.0414 Partek Flow バージョン 5.0.16.0414 は高速化と使い勝手の改善のための新機能やパフォーマンス向上を含んでいます このバージョンへアップグレードするためには Partek Flow インストールガイド内のインストール手順を実行して下さい 改善点を以下に列挙します Partek Flow ホームページ

More information

PrimerArray Analysis Tool Ver.2.1

PrimerArray Analysis Tool Ver.2.1 PrimerArray Analysis Tool Ver.2.1 説 明 書 PrimerArray Analysis Tool Ver.2.1 は PrimerArray ( 製 品 コード PH001 ~ PH010 PN001 ~ PN010) で 得 られたデータを 解 析 するためのツールで コントロールサンプルと 1 種 類 の 未 知 サンプル 間 の 比 較 が 可 能 です リアルタイム

More information

130712AJACS40

130712AJACS40 1 2 2013 Licensed Under CC 2.1 2013 Licensed Under CC 2.1 3 4 2013 Licensed Under CC 2.1 2013 Licensed Under CC 2.1 2013 Licensed Under CC 2.1 5 6 2013 Licensed Under CC 2.1 LOCUS AB091058 2109 bp DNA

More information

農学生命情報科学特論I

農学生命情報科学特論I 2015.07.01 版 USB メモリ中の hoge フォルダをデスクトップにコピーしておいてください 前回 (6/23) の hoge フォルダがデスクトップに残っているかもしれないのでご注意ください 農学生命情報科学 特論 I 第 3 回 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究プログラム門田幸二 ( かどたこうじ ) kadota@iu.a.u-tokyo.ac.jp

More information

最小二乗法とロバスト推定

最小二乗法とロバスト推定 はじめに 最小二乗法とロバスト推定 (M 推定 ) Maplesoft / サイバネットシステム ( 株 ) 最小二乗法は データフィッティングをはじめとしてデータ解析ではもっともよく用いられる手法のひとつです Maple では CurveFitting パッケージの LeastSquares コマンドや Statistics パッケージの Fit コマンド NonlinearFit コマンドなどを用いてデータに適合する数式モデルを求めることが可能です

More information

Vol.7

Vol.7 Microarray Data Analysis Tool データ 解 析 の 進 め 方 Vol.7 - 比 較 データファイルの 作 り 方 - 弊 社 マイクロアレイ 受 託 解 析 サービスで 単 色 法 での 実 験 を 選 択 された 場 合 お 客 様 が 指 定 されたサンプルの 比 較 データを 作 成 して 納 品 しています しかし 納 品 後 にお 客 様 の 方 で 指 定

More information

SpreadSheet Interface

SpreadSheet Interface CHAPTER 11 この章では (SSI) 変換プラグインについて説明します これは ネットワーク設計情報を NMT と Microsoft Excel 互換フォーマット間で変換するものです SSI では Microsoft Excel のバージョン 6.2 以降を使うことを前提にしています この章の内容は次のとおりです NMT から Microsoft Excel への変換 Microsoft

More information

Microsoft PowerPoint - EndNoteWeb-BrainShark_2006Dec07_JPN.ppt

Microsoft PowerPoint - EndNoteWeb-BrainShark_2006Dec07_JPN.ppt EndNote Web In the ISI Web of Knowledge このプレゼンテーションでは Web of Knowledge に新しく搭載された EndNote Web についてご紹介します 1 EndNote Web EndNote Web の概要 Web of Knowledge/EndNote Web のユーザ登録する Web of Knowledge レコードを EndNote

More information

直 接 Reports & Statistics タブへの 移 動 も 可 能 です A. Publication Finder の 統 計 を 取 得 する Publication Finder Reports 1 Publication Finder タブが 選 択 されていることをご 確 認

直 接 Reports & Statistics タブへの 移 動 も 可 能 です A. Publication Finder の 統 計 を 取 得 する Publication Finder Reports 1 Publication Finder タブが 選 択 されていることをご 確 認 利 用 統 計 を 取 得 する 様 々な 側 面 からユーザーの 利 用 状 況 を 把 握 することができますここでは 基 本 的 な 利 用 統 計 レポートの 作 成 方 法 をご 説 明 します( この 項 目 は 日 本 語 表 示 に 対 応 しておりません) 1. Overview[ 概 要 ] Quick Actions [クィックアクション]カテゴリ 内 にある Full Text

More information

ユーザ デバイス プロファイルの ファイル形式

ユーザ デバイス プロファイルの ファイル形式 CHAPTER 34 CSV データファイルの作成にテキストエディタを使用する場合 デバイスフィールドと回線フィールドを CSV データファイル内で識別するファイル形式を使用する必要があります このファイル形式には次のオプションがあります Default User Device Profile: ユーザデバイスプロファイルのデバイスフィールドと回線フィールドの事前決定済みの組み合せを含む Simple

More information