研究報告

Size: px
Start display at page:

Download "研究報告"

Transcription

1 スーパーコンピュータ 京 における 融合遺伝子検出パイプラインの高速化 1 伊東聰, 1 白石友一, 2 島村徹平, 1 千葉健一, 1 宮野悟 sito@hgc.jp 1 東京大学医科学研究所ヒトゲノム解析センター DNA 情報解析分野 2 名古屋大学大学院医学系研究科システム生物学分野 平成 26 年度 京 における高速化ワークショップ 2014 年 12 月 19 日秋葉原 UDX4 階 UDX GALLERY NEXT-2

2 内容 がん,DNAシークエンスとスーパーコンピュータ Genomon-fusion for 京の概要 京コンピュータへの移植 CCLE RNA-seq の全計算 計算時間および解析結果などの概要 blatのopenmp 化 まとめと今後の課題 京 における高速化ワークショップ 2

3 がんと遺伝子異常 がんは遺伝子異常の病気 加齢と共に発症率が増加 = 後天的要素による発症 日々の生活の中で徐々に蓄積 修復機構で治せなかったもの 遺伝子異常の種類 一塩基多型 (SNP) 挿入 / 欠損 コピー数変化 構造変異 融合遺伝子 etc Fig.1 BCR-ABL1 fusion gene ( 9/07/strangeness-of-cancer.html) DNA 情報を読むことで, がんの原因やメカニズムを解き明かせる! 京 における高速化ワークショップ 3

4 セントラルドグマ アニメ ヒト 17 番染色体 タンパク質への翻訳 mrna スエプクソラインシ部ン分グがと切いりう出プさロれセるス RNA DNA Exon 1 Exon 2 Exon 3 RNA への転写メカニズム Exon 23 Exon 24 約 8.1 万文字の DNA 情報 1 DNA の損傷認識と修復を行う遺伝子 遺伝性乳がんとその変異との関係がわかっている 81,189 京 における高速化ワークショップ 4 約 8 万文字の領域にエクソンという部分に蛋白質がコード 東京大学医科学研究所宮野悟教授提供 Fig.2 Central dogma animation

5 DNA シークエンスのコスト推移 Fig.3 Trends of DNA sequencing cost ( 京 における高速化ワークショップ 5

6 DNA シークエンス解析の概要 次世代シークエンサーが出してくれるデータ RNA (20~30GB) < Exome < Whole genome (200~300GB) フォーマットは大体 Fastq リード長 :50bp~100bp DNAは細胞膜を壊して取り出す際に断片化されている bp: base pair= GTGGGGGTGGTGTTAGTACCCCATCTTGTAGGTCTTGAGAGGCTCGGCTACCTCAGTGTGGAAGGTGGGCAGTTCTGGAATGGTGCCCGGGGCCGAGGGGG + GTGCGGGGTGGGCCCAGTGATATCAGCTGCCTGCTGTTCCCCAGATGTGCCAAGTGCATTCTTGTGTGCTTGCATCTCATGGAACGCCATTTCCCCAGACA GGCAGAAGAGGGGCGGGGAGCTGTGTGCCCTAAGATCTCATTGCCTTTTTATGCCGATTAACATGCTTTTAGCCCCTACTGAGCTTATAGTTAACAGAAGT + C@@FFFFFGGGHHFIIIF>?8=A@ACBCCDCCCCCDDDDDADCCDDDDDD@DCCCBDBBBCCDDC:>CCDCDCDD58?BD<:@CCA@CD:>BA((:>ACDC 京 における高速化ワークショップ Fig.4 Sample of Fastq data 6

7 DNA シークエンスとスーパーコンピューティング DNA データの解析 アラインメント ( マッピング ) 各リードが,DNA 鎖のどの部分であるかを探すこと アノテーション / フィルタリング /etc DNA のどこに変異 ( 異常 ) があるかを探す 数千万 ~ 数億リードに対し, そのポジションを同定する作業 ( アラインメント ) が必要であり, その計算コストが非常に大きい. 我々のミッション : がんに関連する DNA 変異を見つける! 遺伝子の不均一性 健常人と患者, 臓器による変化, 人種依存性, 時間変化, 多数検体, 検体内多部位など, 多くのシークエンスデータの統計的検定により得られる知見が重要. 京 における高速化ワークショップ 7

8 Genomon-fusion Whole Transcriptome シークエンスの結果である FASTQ ファイルのマッピング,fusion gene を検出し,fusion gene の候補の一覧を出力するソフトウェアです. より抜粋 オープン / フリーソフトウェアを利用したパイプライン Bowtie Blat CAP3 fasta36 SAMtools Picard bedtools 京 における高速化ワークショップ 8

9 概要と特徴 東京大学医科学研究所白石友一氏提供 シークエンスのアラインメントを丁寧に行う. 丁寧なアラインメントによりスプライシングを高感度に検出することで, スプライシングの検出ミスによるアーティファクトを除く. 2 段階のアラインメント 1. トランスクリプトームの配列に bowtie でアラインメント. ( その後ゲノム配列の座標に変換 ) 既知のスプライシング情報を用いる ( 既知のトランスクリプト配列に張り付ける ) ことで, スプライシングの検出を感度良く行うことができる!! アラインメントされた配列はゲノム配列の座標に変換 でアラインメントされなかったリードを,blat を用いて, ゲノム配列にアラインメントを行う. blat により, データベースに登録のないスプライシングも検出しつつアラインメントを行うことができる. 計算時間はちょっとかかる ( スパコンがないと厳しいか ) 京 における高速化ワークショップ 9

10 Genomon-fusion のフロー ( アラインメント部分 ) 逐次プロセスをグリッドエンジンがまとめて一つのジョブとしてシステムに投入する仕組み. Fastq split fastq.aaa bowtie グリッドエンジン fastq.??? bowtie aligned.sam unaligned. fastq aligned.sam unaligned. fastq blat blat aligned2.sam aligned2.sam merged.sam merged.sam Result.sam 京 における高速化ワークショップ 10

11 京コンピュータへの移植 移植の目的 : 多数検体を同時に処理する Genomon-fusionのHGCスーパーコンピュータでの運用 1 検体のFastqファイルをsplitして並列処理 グリッドエンジン (SGE/UGE) を利用したマルチジョブ投入で実現 京コンピュータでは MPI/OpenMP を用いた並列プログラムのみ受け付け シリアルプログラムは動くが, グリッドエンジンはない 独自のファイルシステム ( ステージング ) への対応 ステージング : ログインノードと計算ノードのディスク間でのファイル授受 京 における高速化ワークショップ 11

12 Genomon-Fusion for 京 ( アラインメント部分 ) GFK の大雑把な流れ Fastq Fastq Fastq Fastq split 前処理 (GFKpre.sh) INPUT.0 bowtie 本処理 (GFKmain.sh) 全体を一つの MPI プロセス化 INPUT.? bowtie aligned.sam unaligned. fastq unaligned. fastq aligned.sam blat blat aligned2.sam aligned2.sam merged.sam merged.sam Result.sam Result.sam Result.sam sam.0 後処理 (GFKpost.sh) 京 における高速化ワークショップ 12

13 CCLE RNA-seq 全計算 CCLE Cancer Cell Line Encyclopedia RNA-seq: 780 検体, 20TByte Calc. Summary: Total core time: 7,027,933,648 sec (976,102 ノード時間 ) 分野 1 課題 4 の 2013 年度割り当て分の 12.7% # of core usage: 499,401 2 core/node, メモリ使用量 (8GB/proc) を確保するため 2 jobs=16 hours 実際には, プリプロセスの都合上,100 検体ずつ 8job で処理 京 における高速化ワークショップ 13

14 blat のプロファイル テストケース :3 ケース Case1: 平均値 (round-robin split) Case2: 最遅 Case3: 最速 Input data: Fasta フォーマット bowtie でマッピングされなかったリード ファイルサイズ ( 行数 ) Case1: 52,222 Case2: 68,922 Case3: 6,776 ー > ケース 3 では, ほとんどのリードが bowtie によりマッピングされている! Fig.7 Sample: CCLE_253J_BV_RNA_08 1File=5,000,000 lines (125k pair-reads) 京 における高速化ワークショップ 14

15 blat のプロファイル Timer start = main(0) Timer start = blat(0) Timer start = blat(part1)(0) Loaded letters in 25 sequences Timer stop = blat(part1)(0) Timer start = blat(part2)(0) Timer start = blat(part2 region1)(0) Timer stop = blat(part2 region1)(0) Timer start = blat(part2 region2)(0) Timer start = blat(part2 region21)(0) Timer stop = blat(part2 region21)(0) Timer start = blat(part2 region22)(0) Timer stop = blat(part2 region22)(0) Timer start = blat(part2 region23)(0) Timer stop = blat(part2 region23)(0) Timer stop = blat(part2 region2)(0) Timer start = blat(part2 region3)(0) Timer start = searchoneindex(1) Timer start = searchoneindex region 4(1) Timer stop = searchoneindex region 4(26111) Searched bases in sequences Timer stop = searchoneindex(1) Timer stop = blat(part2 region3)(0) Timer start = blat(part2 region4)(0) Timer stop = blat(part2 region4)(0) Timer stop = blat(part2)(0) Timer stop = blat(0) Timer stop = main(0) Finished! nest = 0 Fig.8 Calc. time of blat for case1(averaged) Left: Fujitsu FX10, Right Shirokane1 Timer start = main(0) Timer start = blat(0) type = static, mod=0 num_threads = 1 Timer start = blat(part1)(0) Loaded letters in 25 sequences Timer stop = blat(part1)(0) Timer start = blat(part2)(0) Timer start = blat(part2 region1)(0) Timer stop = blat(part2 region1)(0) Timer start = blat(part2 region2)(0) Timer start = blat(part2 region21)(0) Timer stop = blat(part2 region21)(0) Timer start = blat(part2 region22)(0) Timer stop = blat(part2 region22)(0) Timer start = blat(part2 region23)(0) Timer stop = blat(part2 region23)(0) Timer stop = blat(part2 region2)(0) Timer start = blat(part2 region3)(0) Timer start = searchoneindex(1) Timer start = searchoneindex region 4(1) Timer start = searchoneindex region 41(1) Timer stop = searchoneindex region 41(26111) Timer start = searchoneindex region 42(1) Timer stop = searchoneindex region 42(0) Timer stop = searchoneindex region 4(0) Searched bases in sequences Timer stop = searchoneindex(1) Timer stop = blat(part2 region3)(0) Timer start = blat(part2 region4)(0) Timer stop = blat(part2 region4)(0) Timer stop = blat(part2)(0) Timer stop = blat(0) Timer stop = main(0) Finished! nest = 0 京 における高速化ワークショップ 15

16 OpenMP によるスレッド並列化 void searchoneindex(int filecount, char *files[], struct genofind *gf, char *outname, boolean isprot, struct hash *maskhash, FILE *outfile, boolean showstatus) /* Search all sequences in all files against single genofind index. */ int i; char *filename; int count = 0; long long totalsize = 0; gfoutputhead(gvo, outfile); for (i=0; i<filecount; ++i) filename = files[i]; if (nibisfile(filename)) struct dnaseq *seq; if (isprot) errabort("%s: Can't use.nib files with -prot or d=prot option n", filename); seq = nibloadallmasked(nib_mask_mixed, filename); freez(&seq->name); Region 1 seq->name = clonestring(filename); searchonemasktrim(seq, isprot, gf, outfile, maskhash, &totalsize, &count); freednaseq(&seq); } else if (twobitisspec(filename)) struct twobitspec *tbs = twobitspecnew(filename); struct twobitfile *tbf = twobitopen(tbs->filename); if (isprot) errabort("%s is a two bit file, which doesn't work for proteins.", filename); if (tbs->seqs!= NULL) struct twobitseqspec *ss = NULL; for (ss = tbs->seqs; ss!= NULL; ss = ss->next) struct dnaseq *seq = twobitreadseqfrag(tbf, ss->name, ss->start, ss->end); searchonemasktrim(seq, isprot, gf, outfile, Region maskhash, &totalsize, 2 &count); dnaseqfree(&seq); } } else struct twobitindex *index = NULL; for (index = tbf->indexlist; index!= NULL; index = index->next) struct dnaseq *seq = twobitreadseqfrag(tbf, index->name, 0, 0); searchonemasktrim(seq, Region isprot, gf, 3outFile, maskhash, &totalsize, &count); dnaseqfree(&seq); } } twobitclose(&tbf); } else static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } Region 4 linefileclose(&lf); } } carefulclose(&outfile); if (showstatus) printf("searched %lld bases in %d sequences n", totalsize, count); } Fig.9 Source code of searchoneindex (blat/blat.c) Target block is region4! 京 における高速化ワークショップ 16

17 OpenMP によるスレッド並列化 famixedspeedreadnext タイプ : 読み込み 内容 インプットファイルからのリード (k-mer) 読み込み searchonemasktrim タイプ : メイン計算 内容 リード (k-mer) のアラインメント, 最も重い部分 linefileclose タイプ : ファイル書き込み 内容 アラインメント結果をファイルに書き出す static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } linefileclose(&lf); Fig.10 Source code of region 4 京 における高速化ワークショップ 17

18 OpenMP によるスレッド並列化 searchonemasktrim の OpenMP 化 static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } linefileclose(&lf); while -> for ループ #pragma omp parallel private(i, ii, thread_num) thread_num = omp_get_thread_num(); #pragma omp for // Mail loop for( ii = 0; ii < lcount; ii++ ) searchonemasktrim(&seq[ii], isprot, gf, outfile[thread_num], maskhash, &totalsize, &count, thread_num); } // End of for } // End of parallel region Fig.11 Source code of region 4 with OpenMP スレッド数取得 スレッドごとにファイル出力 京 における高速化ワークショップ 18

19 OpenMP によるスレッド並列化 OpenMP 化のポイント インプットファイルの一括読み込み while ループの for ループ化のために必要 アウトプットファイルの分割 gvo スレッド処理の独立性を担保するため. 全処理終了後にファイルをマージする. cat blat.psl.* > blat.psl 行ごとにデータが独立しているので, 順番を問わない点を活用. ファイル出力に関するグローバル変数 関数 (searchoneindex) 内での変更がないので, 全スレッドでコピーを持たせる メモリ確保 関連する配列のメモリはスレッドごとに確保 解放する. 京 における高速化ワークショップ 19

20 Time (sec) OpenMP によるスレッド並列化 Calculation time of blat on FX Case1 Case2 Case3 # of threads Elapse time Time (main) Speed-up (main) Fig.12 Result of OpenMP blat 京 における高速化ワークショップ 20

21 まとめ がん,DNAシークエンスとスーパーコンピューティング Genomon-fusion for 京の概要 CCLE RNA-seq 全計算 約 800 検体をおよそ97 万ノード時間で計算終了. アラインメント部分 (blat) が非常に計算コストがかかっていた. blat の OpenMP 化 メモリ使用量の関係から遊んでいたコアの有効活用. 4コアで2.5 倍程度の高速化を実現した. 今後の課題 実用上の問題として, データマネジメントが見えてきた. Sparc64VIIIfxの整数演算性能について ポスト京への期待 京 における高速化ワークショップ 21

22 謝辞 HPCI 戦略プログラム分野 1 予測する生命科学 医療および創薬基盤 課題 4 大規模生命データ解析 (hp140230) 東京大学医科学研究所ヒトゲノム解析センタースーパーコンピュータ ( 財 ) 高度情報科学技術研究機構山本秀喜様, 野口孝明様 京 における高速化ワークショップ 22

nagasaki_GMT2015_key09

nagasaki_GMT2015_key09 Workflow Variant Calling 03 長崎は遺伝研 大量遺伝情報研究室の所属です 国立遺伝学研究所 生命情報研究センター 3F 2F 欧州EBIと米国NCBIと密接に協力しながら DDBJ/EMBL/GenBank国際塩基配列データ ベースを構築しています 私たちは 塩基配列登録を支援するシステムづくり 登録データを活用するシステムづくり 高速シーケンス配列の情報解析 を行なっています

More information

NGSデータ解析入門Webセミナー

NGSデータ解析入門Webセミナー NGS データ解析入門 Web セミナー : RNA-Seq 解析編 1 RNA-Seq データ解析の手順 遺伝子発現量測定 シークエンス マッピング サンプル間比較 機能解析など 2 CLC Genomics Workbench 使用ツール シークエンスデータ メタデータのインポート NGS data import Import Metadata クオリティチェック Create Sequencing

More information

次世代シークエンサーを用いたがんクリニカルシークエンス解析

次世代シークエンサーを用いたがんクリニカルシークエンス解析 次世代シークエンサーを用いた がんクリニカルシークエンス解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 がん遺伝子パネル がん関連遺伝子のターゲットシークエンス用のアッセイキット コストの低減や 研究プログラムの簡素化に有用 網羅的シークエンス解析の場合に比べて 1 遺伝子あたりのシークエンス量が増えるため より高感度な変異の検出が可能 2 変異データ解析パイプライン

More information

演習1: 演習準備

演習1: 演習準備 演習 1: 演習準備 2013 年 8 月 6 日神戸大学大学院システム情報学研究科森下浩二 1 演習 1 の内容 神戸大 X10(π-omputer) について システム概要 ログイン方法 コンパイルとジョブ実行方法 OpenMP の演習 ( 入門編 ) 1. parallel 構文 実行時ライブラリ関数 2. ループ構文 3. shared 節 private 節 4. reduction 節

More information

GWB

GWB NGS データ解析入門 Web セミナー : 変異解析編 1 NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2 CLC Genomics Workbench 使用ツール シークエンスデータのインポート NGS data import クオリティチェック QC for Sequencing Reads Trim Reads 参照ゲノム配列へのマッピング 再アライメント

More information

GWB

GWB NGS データ解析入門 Web セミナー : De Novo シークエンス解析編 1 NGS 新規ゲノム配列解析の手順 シークエンス 遺伝子領域の検出 アセンブル データベース検索 2 解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 前処理 コンティグ配列の作成 CLC Genomics Workbench 遺伝子領域の検出 Blast2GO PRO データベース検索

More information

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会 シーケンサー利用技術講習会 第 10 回サンプル QC RNAseq ライブ ラリー作製 / データ解析実習講習会 理化学研究所ライフサイエンス技術基盤研究センターゲノムネットワーク解析支援施設田上道平 次世代シーケンサー Sequencer File Format Output(Max) Read length Illumina Hiseq2500 Fastq 600 Gb 100 bp Life

More information

Microsoft PowerPoint - OpenMP入門.pptx

Microsoft PowerPoint - OpenMP入門.pptx OpenMP 入門 須田礼仁 2009/10/30 初版 OpenMP 共有メモリ並列処理の標準化 API http://openmp.org/ 最新版は 30 3.0 バージョンによる違いはあまり大きくない サポートしているバージョンはともかく csp で動きます gcc も対応しています やっぱり SPMD Single Program Multiple Data プログラム #pragma omp

More information

Taro-ファイル処理(公開版).jtd

Taro-ファイル処理(公開版).jtd ファイル処理 0. 目次 1. はじめに 2. ファイル内容の表示 3. ファイル内容の複写 3. 1 文字単位 3. 2 行単位 4. 書式付き入出力 5. 文字配列への入出力 6. 課題 6. 1 課題 1 ( ファイル圧縮 復元 ) - 1 - 1. はじめに ファイル処理プログラムの形は次のようになる #include main() { FILE *fp1,*fp2; ファイルポインタの宣言

More information

I I / 47

I I / 47 1 2013.07.18 1 I 2013 3 I 2013.07.18 1 / 47 A Flat MPI B 1 2 C: 2 I 2013.07.18 2 / 47 I 2013.07.18 3 / 47 #PJM -L "rscgrp=small" π-computer small: 12 large: 84 school: 24 84 16 = 1344 small school small

More information

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析 論文題目 腸管分化に関わる microrna の探索とその発現制御解析 氏名日野公洋 1. 序論 microrna(mirna) とは細胞内在性の 21 塩基程度の機能性 RNA のことであり 部分的相補的な塩基認識を介して標的 RNA の翻訳抑制や不安定化を引き起こすことが知られている mirna は細胞分化や増殖 ガン化やアポトーシスなどに関与していることが報告されており これら以外にも様々な細胞諸現象に関与していると考えられている

More information

Microsoft PowerPoint - 演習1:並列化と評価.pptx

Microsoft PowerPoint - 演習1:並列化と評価.pptx 講義 2& 演習 1 プログラム並列化と性能評価 神戸大学大学院システム情報学研究科横川三津夫 yokokawa@port.kobe-u.ac.jp 2014/3/5 RIKEN AICS HPC Spring School 2014: プログラム並列化と性能評価 1 2014/3/5 RIKEN AICS HPC Spring School 2014: プログラム並列化と性能評価 2 2 次元温度分布の計算

More information

Microsoft PowerPoint _SINET_cloud

Microsoft PowerPoint _SINET_cloud 塩基配列データベースを中心とした生物学系研究の情報基盤について 国立遺伝学研究所 DDBJセンター助教小笠原理 国立遺伝学研究所 遺伝研スパコン : 目的 1. 国際塩基配列データベース (International Nucleotide Sequence Database : INSD) の構築 2. 大学共同利用機関として 主に生物学医学系研究者への計算機資源の提供 遺伝研スパコン : 構成概略

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション V1 次世代シークエンサ実習 II 本講義の内容 Reseq 解析 RNA-seq 解析 公開データ取得 クオリティコントロール マッピング 変異検出 公開データ取得 クオリティコントロール マッピング 発現定量 FPKM を算出します 2 R N A - s e q とは メッセンジャー RNA(mRNA) をキャプチャして次世代シーケンサーでシーケンシングする手法 リファレンスがある生物種の場合

More information

演習準備

演習準備 演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 演習準備の内容 神戸大 FX10(π-Computer) 利用準備 システム概要 ログイン方法 コンパイルとジョブ実行方法 MPI 復習 1. MPIプログラムの基本構成 2. 並列実行 3. 1 対 1 通信 集団通信 4. データ 処理分割 5. 計算時間計測 2 神戸大 FX10(π-Computer) 利用準備

More information

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx NGS analyzer: 次世代シークエンス解析プログラム 独立行政法人理化学研究所情報基盤センター HPCI 計算生命科学推進プログラム須永泰弘 2013/5/29 次世代シークエンス解析ソフト講習会 1 NGS analyzer とは? 次世代シークエンサー (NGS) からの塩基配列データを用いて マッピング PCR の除去 SNP タイピング 欠失挿入の検出を行う 一連の作業はパイプライン化してある

More information

Microsoft PowerPoint - kougi11.ppt

Microsoft PowerPoint - kougi11.ppt C プログラミング演習 中間まとめ 2 1 ソフトウエア開発の流れ 機能設計 外部仕様 ( プログラムの入力と出力の取り決め ) 構成設計 詳細設計 論理試験 内部データ構造や関数呼び出し方法などに関する取り決めソースプログラムの記述正しい入力データから正しい結果が得られるかテスト関数単位からテストをおこなう 耐性試験 異常な入力データに対して, 異常を検出できるかテスト異常終了することはないかテスト

More information

slide5.pptx

slide5.pptx ソフトウェア工学入門 第 5 回コマンド作成 1 head コマンド作成 1 早速ですが 次のプログラムを head.c という名前で作成してください #include #include static void do_head(file *f, long nlines); int main(int argc, char *argv[]) { if (argc!=

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション バイオインフォマティクス 講習会 V 事前準備 が完了されている方は コンテナの起動 ファイルのコピー (Windows) まで 進めておいてください メニュー 1. 環境構築の確認 2. 基本的なLinuxコマンド 3. ツールのインストール 4. NGSデータの基礎知識と前処理 5. トランスクリプトのアッセンブル 6. RNA-seqのリファレンスcDNAマッピングとFPKM 算出 7. RNA-seqのリファレンスゲノムマッピングとFPKM

More information

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析 並列配列相同性検索プログラム GHOST-MP 講習会 ( 講義編 ) 2015 年 3 月 20 日 東京工業大学大学院情報理工学研究科 角田将典 石田貴士 秋山泰 1 講師紹介 角田将典かくたまさのり 石田貴士いしだたかし 秋山泰あきやまゆたか 東京工業大学大学院情報理工学研究科計算工学専攻 2 本日の予定 13:00-13:05 ごあいさつ 13:05-13:50 GHOST-MP 講習 13:50-14:00

More information

openmp1_Yaguchi_version_170530

openmp1_Yaguchi_version_170530 並列計算とは /OpenMP の初歩 (1) 今 の内容 なぜ並列計算が必要か? スーパーコンピュータの性能動向 1ExaFLOPS 次世代スハ コン 京 1PFLOPS 性能 1TFLOPS 1GFLOPS スカラー機ベクトル機ベクトル並列機並列機 X-MP ncube2 CRAY-1 S-810 SR8000 VPP500 CM-5 ASCI-5 ASCI-4 S3800 T3E-900 SR2201

More information

Taro-リストⅠ(公開版).jtd

Taro-リストⅠ(公開版).jtd 0. 目次 1. 再帰的なデータ構造によるリストの表現 1. 1 リストの作成と表示 1. 1. 1 リストの先頭に追加する方法 1. 1. 2 リストの末尾に追加する方法 1. 1. 3 昇順を保存してリストに追加する方法 1. 2 問題 問題 1 問題 2-1 - 1. 再帰的なデータ構造によるリストの表現 リストは データの一部に次のデータの記憶場所を示す情報 ( ポインタという ) を持つ構造をいう

More information

1/8 ページ Java 基礎文法最速マスター Java Javaの文法一覧です 他の言語をある程度知っている人はこれを読めばJavaの基礎をマスターしてJavaを書くことができるようになっています 簡易リファレンスとしても利用できると思いますので これは足りないと思うものがあれば教えてください 1. 基礎 class の作成プログラムはclassに記述します たとえばSampleという名前のclassを作る場合

More information

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.

V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved. V1 ゲノム R e s e q 変異解析 本講義にあたって 代表的な解析の流れを紹介します 論文でよく使用されているツールを使用します コマンドを沢山実行します スペルミスが心配な方は コマンド例がありますのでコピーし て実行してください マークのコマンドは実行してください 実行が遅れてもあせらずに 応用や課題の間に追い付いてくだ さい 2 本講義の内容 Reseq解析 RNA-seq解析 公開データ取得

More information

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science IonTorrent RNA-Seq 解析概要 2017-03 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science 資料概要 この資料は IonTorrent シーケンサーで RNA-Seq (WholeTranscriptome mrna ampliseqrna mirna) 解析を実施されるユーザー様向けの内容となっています

More information

Microsoft PowerPoint - 3. 資料2 がんゲノム情報管理センターの進捗状況

Microsoft PowerPoint - 3. 資料2 がんゲノム情報管理センターの進捗状況 第 1 回がんゲノム医療推進コンソーシアム運営会議平成 30 年 8 月 1 日 資料 2 がんゲノム情報管理センターの進捗状況 間野博行がんゲノム情報管理センター長 1 がんゲノム情報管理センターの設置 厚生労働省の がんゲノム医療推進コンソーシアム懇談会報告書 ( 平成 29 年 6 月 27 日とりまとめ ) には がんゲノム医療実用化に向けた工程として がんゲノム医療 研究のマスターデータベースである

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 平成 29 年 6 月 23 日市民公開講座文京シビックセンター がん遺伝子とがん免疫との関係 講師 : 東京医科歯科大学難治疾患研究所ゲノム病理学分野石川俊平 はじめに用語解説 : 遺伝子 ゲノム DNA の関係 ゲノム : 細胞に含まれるすべての遺伝する DNA の情報全体でヒトでは約 30 億塩基 (30 億文字 ) の DNA よりなる 細胞 ゲノム 染色体 : ゲノムの DNA が分割されて折りたたまれた構造で

More information

gengo1-12

gengo1-12 外部変数 関数の外で定義される変数を外部変数 ( 大域変数 ) と呼ぶ 外部変数のスコープは広域的 ( プログラム全体 ) 全ての関数で参照可能 int a=10; double x=3.14159; printf( a = %d\n, a); sample(); printf( %f\n, x); void sample(void) printf( %f\n, x); x += 1.0; 外部変数

More information

ChIP-seq

ChIP-seq ChIP-seq 1 ChIP-seq 解析原理 ChIP サンプルのフラグメントでは タンパク質結合部位付近にそれぞれ Forward と Reverse のリードがマップされることが予想される ChIP のサンプルでは Forward と Reverse のリードを 3 側へシフトさせ ChIP のピークを算出する コントロールサンプルでは ChIP のサンプルとは異なり 特定の場所に多くマップされないため

More information

Microsoft Word - no15.docx

Microsoft Word - no15.docx 7. ファイルいままでは プログラムを実行したとき その結果を画面で確認していました 簡単なものならそれでもいいのですか 複雑な結果は画面で見るだけでなく ファイルに保存できればよいでしょう ここでは このファイルについて説明します 使う関数のプロトタイプは次のとおりです FILE *fopen(const char *filename, const char *mode); ファイルを読み書きできるようにする

More information

リード・ゲノム・アノテーションインポート

リード・ゲノム・アノテーションインポート リード ゲノム アノテーションインポート 1 Location と Folder ロケーション フォルダ Genomics Workbenchではデータを以下のような階層構造で保存可能です フォルダの一番上位の階層を Location と呼び その下の階層を Folder と呼びます データの保存場所はロケーション毎に設定可能です たとえばあるデータは C ドライブに保存し あるデータは D ドライブに保存するといった事が可能です

More information

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015 ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ 本セッションの目的 本セッションでは ERDAS IMAGINEにおける処理速度向上を目的として機器 (SSD 等 ) 及び並列処理の比較 検討を行った 1.SSD 及び RAMDISK を利用した処理速度の検証 2.Condorによる複数 PCを用いた並列処理 2.1 分散並列処理による高速化試験 (ERDAS IMAGINEのCondorを使用した試験

More information

GWB

GWB NGS データ解析入門 Web セミナー : 変異解析編 1 NGS 変異データ解析の手順 シークエンス 変異検出 マッピング データの精査 解釈 2 解析ワークフローと使用ソフトウェア シークエンスデータのインポート クオリティチェック 参照ゲノム配列へのマッピング 再アライメント 変異検出 CLC Genomics Workbench または Biomedical Genomics Workbench

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション V1 次世代シークエンサ実習 II 本講義にあたって 代表的な解析の流れを紹介します 論文でよく使用されているツールを使用します コマンドを沢山実行します スペルミスが心配な方は コマンド例がありますのでコピーして実行してください /home/admin1409/amelieff/ngs/reseq_command.txt マークのコマンドは実行してください 実行が遅れてもあせらずに 応用や課題の間に追い付いてください

More information

gengo1-12

gengo1-12 外部変数 関数の外で定義される変数を外部変数 ( 大域変数 ) と呼ぶ 外部変数のスコープは広域的 ( プログラム全体 ) 全ての関数で参照可能 int a=10; double x=3.14159; printf( a = %d\n, a); sample(); printf( %f\n, x); void sample(void) printf( %f\n, x); x += 1.0; 外部変数

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション Computer simulations create the future 2015 年度第 1 回 AICS 公開ソフト講習会 K MapReduce ハンズオン 滝澤真一朗松田元彦丸山直也 理化学研究所計算科学研究機構プログラム構成モデル研究チーム 1 RIKEN ADVANCED INSTITUTE FOR COMPUTATIONAL SCIENCE KMR の導入方法を学ぶ 目的 KMRRUN

More information

計算機プログラミング

計算機プログラミング プログラミング言語 C 第 8 講 システム標準関数 ( 入出力関数 ) システム標準関数 システムに備え付けの関数 例 ) printf( ); scanf( ); 標準出力関数 標準入力関数 A. 入出力用の関数 高水準入出力関数 高水準言語 (OS に依存しない ) 低水準入出力関数 機械語レベル (OS に依存 ) B. それ以外の関数 引数と関数の型 ( 戻り値 ) に注目しましょう 例

More information

Easy Sep

Easy Sep utype v7.1 簡易マニュアル 注 : この説明書は 英文添付文書の簡易訳です 製品に添付されている英文マニュアルも必ずご確認ください 1. システム要件 ソフトウェアをインストールするドライブは最低 1GB の空き容量が必要です Windows XP 及び Windows 7 で動作が確認されております 2. シークエンスファイル utype ではシークエンスの際に下記のルールでサンプル名を入力する必要があります

More information

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを 報道発表資料 2002 年 12 月 5 日 独立行政法人理化学研究所 遺伝子の機能解析を飛躍的に進める世界最大規模の遺伝子情報を公開 - 遺伝子として認知されていなかった部分が転写されていることを実証 - 理化学研究所 ( 小林俊一理事長 ) は マウスの完全長 cdna 160,770 クローンの塩基配列および機能アノテーション ( 機能注釈 ) 情報を公開します これは 現在までに人類が収得している遺伝子の約

More information

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments 計算機アーキテクチャ第 11 回 マルチプロセッサ 本資料は授業用です 無断で転載することを禁じます 名古屋大学 大学院情報科学研究科 准教授加藤真平 デスクトップ ジョブレベル並列性 スーパーコンピュータ 並列処理プログラム プログラムの並列化 for (i = 0; i < N; i++) { x[i] = a[i] + b[i]; } プログラムの並列化 x[0] = a[0] + b[0];

More information

RNA-seq

RNA-seq RNA-seq 1 RNA-seq 解析フロー RNA-seq インポート クオリティチェック RNA-seq 発現差解析 この資料では RNA-seq からの説明となりますが インポート クオリティチェックについては サポート資料のページより内容をご確認いただけます 2 データ 発現解析用デモデータは 以下よりダウンロードいただけます ES 細胞 (ESC) と神経前駆細胞 (NPC) の発現解析を小さなデモデータで行えます

More information

Taro-リストⅢ(公開版).jtd

Taro-リストⅢ(公開版).jtd リスト Ⅲ 0. 目次 2. 基本的な操作 2. 1 リストから要素の削除 2. 2 リストの複写 2. 3 リストの連結 2. 4 問題 問題 1 問題 2-1 - 2. 基本的な操作 2. 1 リストから要素の削除 まず 一般的な処理を書き つぎに 特別な処理を書く 一般的な処理は 処理 1 : リスト中に 削除するデータを見つけ 削除する場合への対応 特別な処理は 処理 2 : 先頭のデータを削除する場合への対応

More information

Microsoft Word - Cプログラミング演習(10)

Microsoft Word - Cプログラミング演習(10) 第 10 回 (6/25) 3. ファイルとその応用 (3) ファイルの更新 シーケンシャルファイルの更新 シーケンシャルファイルでは, 各レコードが可変長で連続して格納されており, その中の特定のレコードを変更することができない そこで一般的には, マスタファイルからデータを取り出し, 更新処理を行ったあとに新マスタファイルに書き込む 注 ) マスタファイル : 主ファイル, 基本ファイルと呼ばれるファイルで内容は比較的固定的であり,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション シミュレーション基礎 (8) 第 6 章ファイル入出力 7.2 テキストファイルの読み書き ファイルに書き込む : EX70201: X=1:10;Y=[X;X.^2]; Fid=fopen('datal.txt', wt'); fprintf(fid,'%2d%5d n',y); C 言語と同じ手順 : ファイルをオープンするファイルに変数の値を書き込む ( 整数 2 桁, 整数 5 桁, 改行

More information

JavaプログラミングⅠ

JavaプログラミングⅠ Java プログラミング Ⅰ 12 回目クラス 今日の講義で学ぶ内容 クラスとは クラスの宣言と利用 クラスの応用 クラス クラスとは 異なる複数の型の変数を内部にもつ型です 直観的に表現すると int 型や double 型は 1 1 つの値を管理できます int 型の変数 配列型は 2 5 8 6 3 7 同じ型の複数の変数を管理できます 配列型の変数 ( 配列変数 ) クラスは double

More information

K227 Java 2

K227 Java 2 1 K227 Java 2 3 4 5 6 Java 7 class Sample1 { public static void main (String args[]) { System.out.println( Java! ); } } 8 > javac Sample1.java 9 10 > java Sample1 Java 11 12 13 http://java.sun.com/j2se/1.5.0/ja/download.html

More information

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear インフルエンザウイルスの遺伝の仕組みを解明 1. 発表者 : 河岡義裕 ( 東京大学医科学研究所感染 免疫部門ウイルス感染分野教授 ) 野田岳志 ( 京都大学ウイルス 再生医科学研究所微細構造ウイルス学教授 ) 2. 発表のポイント : インフルエンザウイルスが子孫ウイルスにゲノム ( 遺伝情報 ) を伝える仕組みを解明した 子孫ウイルスにゲノムを伝えるとき 8 本のウイルス RNAを 1+7 という特徴的な配置

More information

デジタル表現論・第6回

デジタル表現論・第6回 デジタル表現論 第 6 回 劉雪峰 ( リュウシュウフォン ) 2016 年 5 月 16 日 劉 雪峰 ( リュウシュウフォン ) デジタル表現論 第 6 回 2016 年 5 月 16 日 1 / 16 本日の目標 Java プログラミングの基礎配列 ( 復習 関数の値を配列に格納する ) 文字列ファイルの書き込み 劉 雪峰 ( リュウシュウフォン ) デジタル表現論 第 6 回 2016 年

More information

TFTP serverの実装

TFTP serverの実装 TFTP サーバーの実装 デジタルビジョンソリューション 佐藤史明 1 1 プレゼンのテーマ組み込みソフトのファイル転送を容易に 2 3 4 5 基礎知識 TFTP とは 実践 1 実際に作ってみよう 実践 2 組み込みソフトでの実装案 最後におさらい 2 プレゼンのテーマ 組み込みソフトのファイル転送を容易に テーマ選択の理由 現在従事しているプロジェクトで お客様からファームウェアなどのファイル転送を独自方式からTFTPに変更したいと要望があった

More information

PowerPoint Template

PowerPoint Template プログラミング演習 Ⅲ Linked List P. Ravindra S. De Silva e-mail: ravi@cs.tut.ac.jp, Room F-413 URL: www.icd.cs.tut.ac.jp/~ravi/prog3/index_j.html 連結リストとは? 一つひとつの要素がその前後の要素との参照関係をもつデータ構造 A B C D 連結リストを使用する利点 - 通常の配列はサイズが固定されている

More information

UCSC ゲノムブラウザチュートリアル UCSC ゲノムブラウザはゲノム解読がなされている真核生物を対象として自動アノテーションを行い その結果をデータベースとして公開している UCSC が進めているプロジェクトです NCBI MapViewer のようにゲノムベースでその上にアノテーションされている遺伝子などの情報を閲覧すると共に ホモロジー検索や必要なデータのダウンロードなどの機能を提供しています

More information

Java講座

Java講座 ~ 第 1 回 ~ 情報科学部コンピュータ科学科 2 年竹中優 プログラムを書く上で Hello world 基礎事項 演算子 構文 2 コメントアウト (//, /* */, /** */) をしよう! インデントをしよう! 変数などにはわかりやすい名前をつけよう! 要するに 他人が見て理解しやすいコードを書こうということです 3 1. Eclipse を起動 2. ファイル 新規 javaプロジェクト

More information

NUMAの構成

NUMAの構成 共有メモリを使ったデータ交換と同期 慶應義塾大学理工学部 天野英晴 hunga@am.ics.keio.ac.jp 同期の必要性 あるプロセッサが共有メモリに書いても 別のプロセッサにはそのことが分からない 同時に同じ共有変数に書き込みすると 結果がどうなるか分からない そもそも共有メモリって結構危険な代物 多くのプロセッサが並列に動くには何かの制御機構が要る 不可分命令 同期用メモリ バリア同期機構

More information

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム 2014 年 4 月 4 日 東北大学大学院医学系研究科 染色体転座 逆位による白血病の発症機構を解明 染色体異常に起因する疾病の病因解明に向けた新たな解析手法の確立 東北大学大学院医学系研究科の鈴木未来子講師 ( ラジオアイソトープセンター ) 山㟢博未博士 ( 医化学分野 ) 清水律子教授 ( 分子血液学分野 ) 山本雅之教授 ( 医化学分野 東北メディカル メガバンク機構機構長 ) らは 3

More information

XcalableMP入門

XcalableMP入門 XcalableMP 1 HPC-Phys@, 2018 8 22 XcalableMP XMP XMP Lattice QCD!2 XMP MPI MPI!3 XMP 1/2 PCXMP MPI Fortran CCoarray C++ MPIMPI XMP OpenMP http://xcalablemp.org!4 XMP 2/2 SPMD (Single Program Multiple Data)

More information

GenBank クイックスタート GenBank は NLM/NCBI にて維持管理されている核酸配列データベースです また GenBank は EMBL, DDBJ と三極間で連携しながら国際核酸配列データベースを共同で構築しています これら三機関はデータを日々交換し続けており その規模は 160000 種にも及ぶ生物種の塩基配列から成り立つまでになっています この GenBank クイックスタートでは

More information

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E MEGA 5 を用いた塩基配列解析法および分子系統樹作成法 Ver.1 Update: 2012.04.01 ウイルス 疫学研究領域井関博 < 内容 > 1. MEGA 5 をインストールする 1.1 ダウンロード手順 2. 塩基配列を決定する 2.1 Alignment Explorer の起動 2.2 シークエンスデータの入力 2.2.1 テキストファイルから読み込む場合 2.2.2 波形データから読み込む場合

More information

gengo1-12

gengo1-12 外部変数 関数の外で定義される変数を外部変数 ( 大域変数 ) と呼ぶ 外部変数のスコープは広域的 ( プログラム全体 ) 全ての関数で参照可能 int a=10; double x=3.14159; printf( a = %d\n, a); sample(); printf( %f\n, x); void sample(void) printf( %f\n, x); x += 1.0; 外部変数

More information

基礎プログラミング2015

基礎プログラミング2015 応用プログラミング 第 5 回 テキスト入力処理 2017 年 10 月 18 日 ( 水 ) 第 7 章 テキスト入力処理 1 文字ずつの処理 (P.58) char 型などに入力する cin >> x や fin >> x はホワイトスペースが読み飛ばされる仕様 ホワイトスペース : スペース ( 空白 ), Tab( タブ ), 改行 // sample.cpp char ch; while(cin

More information

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン 計画研究 2005 2009 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシング時代のゲノム科学研究では 多因子性 遺伝性疾患の関連解析による原因遺伝子探索が最重要課題であ 1.

More information

Javaセキュアコーディングセミナー東京 第3回 入出力(File, Stream)と例外時の動作 演習解説

Javaセキュアコーディングセミナー東京 第3回 入出力(File, Stream)と例外時の動作 演習解説 Java セキュアコーディングセミナー東京第 3 回入出力と例外時の動作 演習解説 2012 年 11 月 11 日 ( 日 ) JPCERT コーディネーションセンター脆弱性解析チーム戸田洋三 1 Hands-on Exercises コンパイルエラーに対処しよう ファイルからのデータ入力を実装しよう 2 Hands-on Exercise(1) サンプルコードの コンパイルエラーに対処しよう 3

More information

Microsoft PowerPoint - 計算機言語 第7回.ppt

Microsoft PowerPoint - 計算機言語 第7回.ppt 計算機言語第 7 回 長宗高樹 目的 関数について理解する. 入力 X 関数 f 出力 Y Y=f(X) 関数の例 関数の型 #include int tasu(int a, int b); main(void) int x1, x2, y; x1 = 2; x2 = 3; y = tasu(x1,x2); 実引数 printf( %d + %d = %d, x1, x2, y);

More information

ソフト活用事例③自動Rawデータ管理システム

ソフト活用事例③自動Rawデータ管理システム ソフト活用事例 3 自動 Raw データ管理システム ACD/Labs NMR 無料講習会 & セミナー 2014 於 )2014.7.29 東京 /2014.7.31 大阪 富士通株式会社テクニカルコンピューティング ソリューション事業本部 HPC アプリケーション統括部 ACD/Spectrus をご選択頂いた理由 (NMR 領域 ) パワフルな解 析機能 ベンダーニュートラルな解析環境 直感的なインターフェース

More information

小児の難治性白血病を引き起こす MEF2D-BCL9 融合遺伝子を発見 ポイント 小児がんのなかでも 最も頻度が高い急性リンパ性白血病を起こす新たな原因として MEF2D-BCL9 融合遺伝子を発見しました MEF2D-BCL9 融合遺伝子は 治療中に再発する難治性の白血病を引き起こしますが 新しい

小児の難治性白血病を引き起こす MEF2D-BCL9 融合遺伝子を発見 ポイント 小児がんのなかでも 最も頻度が高い急性リンパ性白血病を起こす新たな原因として MEF2D-BCL9 融合遺伝子を発見しました MEF2D-BCL9 融合遺伝子は 治療中に再発する難治性の白血病を引き起こしますが 新しい 平成 28 年 8 月 9 日 小児の難治性白血病を引き起こす MEF2D-BCL9 融合遺伝子を発見 名古屋大学大学院医学系研究科 ( 研究科長 髙橋雅英 ) 小児科学の小島勢二 ( こじませいじ ) 名誉教授 村松秀城 ( むらまつひでき ) 助教 鈴木喬悟 ( すずききょうご ) 大学院生 名古屋大学医学部附属病院先端医療 臨床研究支援センターの奥野友介 ( おくのゆうすけ ) 特任講師らの研究グループは

More information

double float

double float 2015 3 13 1 2 2 3 2.1.......................... 3 2.2............................. 3 3 4 3.1............................... 4 3.2 double float......................... 5 3.3 main.......................

More information

PostgreSQL SQL チューニング入門 ~ Explaining Explain より ~ 2012 年 11 月 30 日 株式会社アシスト 田中健一朗

PostgreSQL SQL チューニング入門 ~ Explaining Explain より ~ 2012 年 11 月 30 日 株式会社アシスト 田中健一朗 PostgreSQL SQL チューニング入門 ~ Explaining Explain より ~ 2012 年 11 月 30 日 株式会社アシスト 田中健一朗 アジェンダ 1.EXPLAIN とは 2. 表アクセスの基本 3. 結合の基本 4. 統計情報とは 5.EXPLAIN コマンド 6. 問題解決例 7. まとめ 2 1.EXPLAIN とは 実行計画とは - 目的地は 1 つでもアクセス方法は複数

More information

Microsoft PowerPoint - 14Chap17.ppt

Microsoft PowerPoint - 14Chap17.ppt 17.1 do-while 文 p.161 例 17.1.1 p.22 例 5.1.1 第 17 章その他の制御文 17.1 do-while 文 17.2 goto 文とラベル 17.3 break 文による繰返し制御 17.4 continue 文による繰返し制御 /* ex17_1_1.c */ do while (i < 10); 条件を満たさなくても 1 回は実行 i = 10; とすると違いがわかる

More information

情報処理Ⅰ

情報処理Ⅰ Java フローチャート -1- フローチャート ( 流れ図 ) プログラムの処理手順 ( アルゴリズム ) を図示したもの 記号の種類は下記のとおり 端子記号 ( 開始 終了 ) 処理記号計算, 代入等 条件の判定 条件 No ループ処理 LOOP start Yes データの入力 出力 print など 定義済み処理処理名 end サンプルグログラム ( 大文字 小文字変換 ) 大文字を入力して下さい

More information

ファイル入出力

ファイル入出力 C プログラミング Ⅱ の基礎 とは ファイルへデータを書き込んだり ( 出力 ), ファイルからデータを読み込んだり ( 入力 ) する C 言語では キーボードからの入力 画面への出力と同じようなコードで 処理を実現できる プログラム 入力 出力 ファイル 出力 入力 2 入出力の基本 ストリーム プログラム上で様々な装置への入出力を行う機構様々な入出力装置を統一的な方法で扱うことができる ハードディスクなどではファイルデータによって入出力が行われる

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) トランスクリプトーム解析の今昔 なぜマイクロアレイ? なぜRNA-Seq? 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 Contents トランスクリプトーム解析の概要 各手法の長所 短所 マイクロアレイ

More information

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx)

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx) AICS 村井均 RIKEN AICS HPC Summer School 2012 8/7/2012 1 背景 OpenMP とは OpenMP の基本 OpenMP プログラミングにおける注意点 やや高度な話題 2 共有メモリマルチプロセッサシステムの普及 共有メモリマルチプロセッサシステムのための並列化指示文を共通化する必要性 各社で仕様が異なり 移植性がない そして いまやマルチコア プロセッサが主流となり

More information

Microsoft PowerPoint - lec10.ppt

Microsoft PowerPoint - lec10.ppt 今日の内容, とポインタの組み合わせ, 例題 1. 住所録例題 2. と関数とは. を扱う関数. 例題 3. のリスト とポインタの組み合わせ 今日の到達目標 自分で を定義する 自分で定義したについて, 配列やポインタを作成する データ型 基本データ型 char 文字 (1 文字 ) int 整数 double 浮動小数など その他のデータ型配列 データの並び ( 文字列も, 文字の並び ) ポインタ

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション ようこそ COBOL へ! 2018/08/17 伊東 輝 COBOL とは? 1959 年に事務処理用に開発された手続き型言語であり ソースコードの記述内容を上から順番に実行する言語である 約 60 年前から存在する言語でありながら 未だに基本情報処理技術者の午後試験に出題され 金融系システム等のレガシーシステムでは現在も COBOL のプログラムが稼働している 今回は COBOL のコーディングの基礎を発表する

More information

Microsoft Word - 計算科学演習第1回3.doc

Microsoft Word - 計算科学演習第1回3.doc スーパーコンピュータの基本的操作方法 2009 年 9 月 10 日高橋康人 1. スーパーコンピュータへのログイン方法 本演習では,X 端末ソフト Exceed on Demand を使用するが, 必要に応じて SSH クライアント putty,ftp クライアント WinSCP や FileZilla を使用して構わない Exceed on Demand を起動し, 以下のとおり設定 ( 各自のユーザ

More information

Microsoft PowerPoint - 第3回目.ppt [互換モード]

Microsoft PowerPoint - 第3回目.ppt [互換モード] 第 3 回プログラミング応用 目的ファイル入出力 1. ファイルの概念 2. ファイルの読み込み 3. ファイルの書き込み CPU 演算 判断 ファイルの概念 内部記憶装置 OS 機械語プログラム 入力装置 キーボード 出力装置 ディスプレイ ファイル 外部記憶装置ハードディスク CD-ROM CPU が外部とデータをやり取りするための媒介 printf 関数や scanf 関数でもうすでにファイルのやり取りの基本は学んでいる

More information

RX ファミリ用 C/C++ コンパイラ V.1.00 Release 02 ご使用上のお願い RX ファミリ用 C/C++ コンパイラの使用上の注意事項 4 件を連絡します #pragma option 使用時の 1 または 2 バイトの整数型の関数戻り値に関する注意事項 (RXC#012) 共用

RX ファミリ用 C/C++ コンパイラ V.1.00 Release 02 ご使用上のお願い RX ファミリ用 C/C++ コンパイラの使用上の注意事項 4 件を連絡します #pragma option 使用時の 1 または 2 バイトの整数型の関数戻り値に関する注意事項 (RXC#012) 共用 RX ファミリ用 C/C++ コンパイラ V.1.00 Release 02 ご使用上のお願い RX ファミリ用 C/C++ コンパイラの使用上の注意事項 4 件を連絡します #pragma option 使用時の 1 または 2 バイトの整数型の関数戻り値に関する注意事項 (RXC#012) 共用体型のローカル変数を文字列操作関数で操作する場合の注意事項 (RXC#013) 配列型構造体または共用体の配列型メンバから読み出した値を動的初期化に用いる場合の注意事項

More information

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5 演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 演習準備の内容 神戸大 FX10(π-Computer) 利用準備 システム概要 ログイン方法 コンパイルとジョブ実行方法 MPI 復習 1. MPIプログラムの基本構成 2. 並列実行 3. 1 対 1 通信 集団通信 4. データ 処理分割 5. 計算時間計測 2 神戸大 FX10(π-Computer) 利用準備

More information

データ構造

データ構造 アルゴリズム及び実習 7 馬青 1 表探索 定義表探索とは 表の形で格納されているデータの中から条件に合ったデータを取り出してくる操作である 但し 表は配列 ( 連結 ) リストなどで実現できるので 以降 表 の代わりに直接 配列 や リスト などの表現を用いる場合が多い 表探索をただ 探索 と呼ぶ場合が多い 用語レコード : 表の中にある個々のデータをレコード (record) と呼ぶ フィールド

More information

検体採取 患者の検査前準備 検体採取のタイミング 記号 添加物 ( キャップ色等 ) 採取材料 採取量 測定材料 P EDTA-2Na( 薄紫 ) 血液 7 ml RNA 検体ラベル ( 単項目オーダー時 ) ホンハ ンテスト 注 外 N60 氷 MINテイリョウ. 採取容器について 0

検体採取 患者の検査前準備 検体採取のタイミング 記号 添加物 ( キャップ色等 ) 採取材料 採取量 測定材料 P EDTA-2Na( 薄紫 ) 血液 7 ml RNA 検体ラベル ( 単項目オーダー時 ) ホンハ ンテスト 注 外 N60 氷 MINテイリョウ. 採取容器について 0 0868010 8. その他の検体検査 >> 8C. 遺伝子関連検査 >> minor bcr-abl, mrna quantitative 連絡先 : 3664 基本情報 8C127 minor bcr-abl 分析物 JLAC10 診療報酬 識別 9962 mrna 定量 材料 019 全血 ( 添加物入り ) 測定法 875 リアルタイムRT-PCR 法 結果識別 第 2 章 特掲診療料 D006-2

More information

プログラミングI第10回

プログラミングI第10回 プログラミング 1 第 10 回 構造体 (3) 応用 リスト操作 この資料にあるサンプルプログラムは /home/course/prog1/public_html/2007/hw/lec/sources/ 下に置いてありますから 各自自分のディレクトリにコピーして コンパイル 実行してみてください Prog1 2007 Lec 101 Programming1 Group 19992007 データ構造

More information

Microsoft Word - no205.docx

Microsoft Word - no205.docx 3 応用 3.1 連結リスト 前回 先頭に追加する例を扱いました しかし start が指す node を変更することから 関数 の戻り値として作成しました 今回は ポインタ変数 start の値を関数で変更できるように ポイ ンタ変数へのポインタを利用します 先頭を削除するものと 最後を削除する関数を追加します ex25.c /* リストの追加と削除 */ typedef struct node

More information

Microsoft PowerPoint - CproNt02.ppt [互換モード]

Microsoft PowerPoint - CproNt02.ppt [互換モード] 第 2 章 C プログラムの書き方 CPro:02-01 概要 C プログラムの構成要素は関数 ( プログラム = 関数の集まり ) 関数は, ヘッダと本体からなる 使用する関数は, プログラムの先頭 ( 厳密には, 使用場所より前 ) で型宣言 ( プロトタイプ宣言 ) する 関数は仮引数を用いることができる ( なくてもよい ) 関数には戻り値がある ( なくてもよい void 型 ) コメント

More information

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日 生物情報工学 BioInforma*cs 3 遺伝子データベース 16/06/09 1 国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日本 DNA データバンクが運営

More information

Microsoft Word - openmp-txt.doc

Microsoft Word - openmp-txt.doc ( 付録 A) OpenMP チュートリアル OepnMP は 共有メモリマルチプロセッサ上のマルチスレッドプログラミングのための API です 本稿では OpenMP の簡単な解説とともにプログラム例をつかって説明します 詳しくは OpenMP の規約を決めている OpenMP ARB の http://www.openmp.org/ にある仕様書を参照してください 日本語訳は http://www.hpcc.jp/omni/spec.ja/

More information

Microsoft PowerPoint - KHPCSS pptx

Microsoft PowerPoint - KHPCSS pptx KOBE HPC サマースクール 2018( 初級 ) 9. 1 対 1 通信関数, 集団通信関数 2018/8/8 KOBE HPC サマースクール 2018 1 2018/8/8 KOBE HPC サマースクール 2018 2 MPI プログラム (M-2):1 対 1 通信関数 問題 1 から 100 までの整数の和を 2 並列で求めなさい. プログラムの方針 プロセス0: 1から50までの和を求める.

More information

コードのチューニング

コードのチューニング OpenMP による並列化実装 八木学 ( 理化学研究所計算科学研究センター ) KOBE HPC Spring School 2019 2019 年 3 月 14 日 スレッド並列とプロセス並列 スレッド並列 OpenMP 自動並列化 プロセス並列 MPI プロセス プロセス プロセス スレッドスレッドスレッドスレッド メモリ メモリ プロセス間通信 Private Private Private

More information

memo

memo 数理情報工学演習第一 C プログラミング演習 ( 第 5 回 ) 2015/05/11 DEPARTMENT OF MATHEMATICAL INFORMATICS 1 今日の内容 : プロトタイプ宣言 ヘッダーファイル, プログラムの分割 課題 : 疎行列 2 プロトタイプ宣言 3 C 言語では, 関数や変数は使用する前 ( ソースの上のほう ) に定義されている必要がある. double sub(int

More information

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18 OpenMP* 4.x における拡張 OpenMP 4.0 と 4.5 の機能拡張 内容 OpenMP* 3.1 から 4.0 への拡張 OpenMP* 4.0 から 4.5 への拡張 2 追加された機能 (3.1 -> 4.0) C/C++ 配列シンタックスの拡張 SIMD と SIMD 対応関数 デバイスオフロード task 構 の依存性 taskgroup 構 cancel 句と cancellation

More information

Microsoft Word - all_ jp.docx

Microsoft Word - all_ jp.docx 平成 28 年 11 月 18 日 小児急性リンパ性白血病における超高感度な微小残存病変の検査法を確立 名古屋大学大学院医学系研究科 ( 研究科長 髙橋雅英 ) 小児科学の小島勢二 ( こじませいじ ) 名誉教授 村松秀城 ( むらまつひでき ) 助教 関屋由子 ( せきやゆうこ ) 大学院生らの研究グループは 小児急性リンパ性白血病 (acute lymphoblastic leukemia; ALL)

More information

スパコンに通じる並列プログラミングの基礎

スパコンに通じる並列プログラミングの基礎 2018.06.04 2018.06.04 1 / 62 2018.06.04 2 / 62 Windows, Mac Unix 0444-J 2018.06.04 3 / 62 Part I Unix GUI CUI: Unix, Windows, Mac OS Part II 2018.06.04 4 / 62 0444-J ( : ) 6 4 ( ) 6 5 * 6 19 SX-ACE * 6

More information

文字列操作と正規表現

文字列操作と正規表現 文字列操作と正規表現 オブジェクト指向プログラミング特論 2018 年度只木進一 : 工学系研究科 2 文字列と文字列クラス 0 個以上の長さの文字の列 Java では String クラス 操作 文字列を作る 連結する 文字列中に文字列を探す 文字列中の文字列を置き換える 部分文字列を得る 3 String クラス 文字列を保持するクラス 文字列は定数であることに注意 比較に注意 == : オブジェクトとしての同等性

More information

RT-PCR プロトコール.PDF

RT-PCR プロトコール.PDF Real -Time RT-PCR icycler iq Bio Rad RT-PCR RT-PCR 1 icycler iq Bio Rad icycler iq 30 2 Ready-To-Go T-Primed First-Strand Kit (amersham pharmacia biotech) Ready-To-Go T-Primed First-Strand Kit QuantiTect

More information

Exam : 1z1-809-JPN Title : Java SE 8 Programmer II Vendor : Oracle Version : DEMO Get Latest & Valid 1z1-809-JPN Exam's Question and Answers 1 from Ac

Exam : 1z1-809-JPN Title : Java SE 8 Programmer II Vendor : Oracle Version : DEMO Get Latest & Valid 1z1-809-JPN Exam's Question and Answers 1 from Ac Actual4Test http://www.actual4test.com Actual4test - actual test exam dumps-pass for IT exams Exam : 1z1-809-JPN Title : Java SE 8 Programmer II Vendor : Oracle Version : DEMO Get Latest & Valid 1z1-809-JPN

More information

オブジェクト指向プログラミング・同演習 5月21日演習課題

オブジェクト指向プログラミング・同演習 5月21日演習課題 オブジェクト指向プログラミング 同演習 5 月 21 日演習課題 問題 1 配列の例外処理例外が発生する可能性のある処理を try で囲み その後に catch で例外を捕捉します 例外処理の終了処理として finally が行われます これは書かなくて自動的に行われます 提出課題 1 (Kadai052301.java) 以下のプログラムは例外処理をしていない ArrayIndexOutOfBoundsException

More information

C のコード例 (Z80 と同機能 ) int main(void) { int i,sum=0; for (i=1; i<=10; i++) sum=sum + i; printf ("sum=%d n",sum); 2

C のコード例 (Z80 と同機能 ) int main(void) { int i,sum=0; for (i=1; i<=10; i++) sum=sum + i; printf (sum=%d n,sum); 2 アセンブラ (Z80) の例 ORG 100H LD B,10 SUB A LOOP: ADD A,B DEC B JR NZ,LOOP LD (SUM),A HALT ORG 200H SUM: DEFS 1 END 1 C のコード例 (Z80 と同機能 ) int main(void) { int i,sum=0; for (i=1; i

More information

第4回バイオインフォマティクスアルゴリズム実習

第4回バイオインフォマティクスアルゴリズム実習 第 5 回バイオインフォマティクスアルゴリズム アラインメントアルゴリズム (3) 慶應義塾大学先端生命科学研究所 アラインメント 置換 挿入 欠損を考慮して塩基配列あるいは アミノ酸配列の似た部分をそろえることギャップ - を挿入する CAAGACATTTTAC CATACACTTTAC CA-AGACATTTTAC CATACAC--TTTAC ** * ** ***** アラインメントはグラフで表現できる

More information

連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 分子 ( 粒子 ) セル 系の状態 ステップ 18

連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 分子 ( 粒子 ) セル 系の状態 ステップ 18 連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 17 2.1 分子 ( 粒子 ) 17 2.2 セル 17 2.3 系の状態 18 2.4 1ステップ 18 2.5 力の計算 19 2.6 速度と位置の更新 20 2.7 セル間の分子の移動 21 3 OpenMP

More information

program7app.ppt

program7app.ppt プログラム理論と言語第 7 回 ポインタと配列, 高階関数, まとめ 有村博紀 吉岡真治 公開スライド PDF( 情報知識ネットワーク研 HP/ 授業 ) http://www-ikn.ist.hokudai.ac.jp/~arim/pub/proriron/ 本スライドは,2015 北海道大学吉岡真治 プログラム理論と言語, に基づいて, 現著者の承諾のもとに, 改訂者 ( 有村 ) が加筆修正しています.

More information

Quick Sort 計算機アルゴリズム特論 :2017 年度 只木進一

Quick Sort 計算機アルゴリズム特論 :2017 年度 只木進一 Quick Sort 計算機アルゴリズム特論 :2017 年度 只木進一 2 基本的考え方 リスト ( あるいは配列 )SS の中の ある要素 xx(pivot) を選択 xx より小さい要素からなる部分リスト SS 1 xx より大きい要素からなる部分リスト SS 2 xx は SS 1 または SS 2 に含まれる 長さが 1 になるまで繰り返す pivot xx の選び方として 中央の要素を選択すると効率が良い

More information

ファイル入出力

ファイル入出力 C プログラミング Ⅱ の基礎 とは ファイルへデータを書き込んだり ( 出力 ), ファイルからデータを読み込んだり ( 入力 ) する C 言語では キーボードからの入力 画面への出力と同じようなコードで 処理を実現できる プログラム 入力 出力 ファイル 出力 入力 2 入出力の基本 ストリーム プログラム上で様々な装置への入出力を行う機構様々な入出力装置を統一的な方法で扱うことができる ハードディスクなどではファイルデータによって入出力が行われる

More information