研究報告

Similar documents
nagasaki_GMT2015_key09

NGSデータ解析入門Webセミナー

次世代シークエンサーを用いたがんクリニカルシークエンス解析

演習1: 演習準備

GWB

GWB

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

Microsoft PowerPoint - OpenMP入門.pptx

Taro-ファイル処理(公開版).jtd

I I / 47

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

Microsoft PowerPoint - 演習1:並列化と評価.pptx

Microsoft PowerPoint _SINET_cloud

PowerPoint プレゼンテーション

演習準備

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx

Microsoft PowerPoint - kougi11.ppt

slide5.pptx

PowerPoint プレゼンテーション

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

openmp1_Yaguchi_version_170530

Taro-リストⅠ(公開版).jtd


V1 ゲノム R e s e q 変異解析 Copyright Amelieff Corporation All Rights Reserved.

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

Microsoft PowerPoint - 3. 資料2 がんゲノム情報管理センターの進捗状況

PowerPoint プレゼンテーション

gengo1-12

ChIP-seq

Microsoft Word - no15.docx

リード・ゲノム・アノテーションインポート

ERDAS IMAGINE における処理速度の向上 株式会社ベストシステムズ PASCO CORPORATION 2015

GWB

PowerPoint プレゼンテーション

gengo1-12

PowerPoint プレゼンテーション

計算機プログラミング

Easy Sep

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

Slides: TimeGraph: GPU Scheduling for Real-Time Multi-Tasking Environments

RNA-seq

Taro-リストⅢ(公開版).jtd

Microsoft Word - Cプログラミング演習(10)

PowerPoint プレゼンテーション

JavaプログラミングⅠ

K227 Java 2

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear

デジタル表現論・第6回

TFTP serverの実装

PowerPoint Template


Java講座

NUMAの構成

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム

XcalableMP入門


1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

gengo1-12

基礎プログラミング2015

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

Javaセキュアコーディングセミナー東京 第3回 入出力(File, Stream)と例外時の動作 演習解説

Microsoft PowerPoint - 計算機言語 第7回.ppt

ソフト活用事例③自動Rawデータ管理システム

小児の難治性白血病を引き起こす MEF2D-BCL9 融合遺伝子を発見 ポイント 小児がんのなかでも 最も頻度が高い急性リンパ性白血病を起こす新たな原因として MEF2D-BCL9 融合遺伝子を発見しました MEF2D-BCL9 融合遺伝子は 治療中に再発する難治性の白血病を引き起こしますが 新しい

double float

PostgreSQL SQL チューニング入門 ~ Explaining Explain より ~ 2012 年 11 月 30 日 株式会社アシスト 田中健一朗

Microsoft PowerPoint - 14Chap17.ppt

情報処理Ⅰ

ファイル入出力

機能ゲノム学(第6回)

(Microsoft PowerPoint \215u\213`4\201i\221\272\210\344\201j.pptx)

Microsoft PowerPoint - lec10.ppt

PowerPoint プレゼンテーション

Microsoft Word - 計算科学演習第1回3.doc

Microsoft PowerPoint - 第3回目.ppt [互換モード]

RX ファミリ用 C/C++ コンパイラ V.1.00 Release 02 ご使用上のお願い RX ファミリ用 C/C++ コンパイラの使用上の注意事項 4 件を連絡します #pragma option 使用時の 1 または 2 バイトの整数型の関数戻り値に関する注意事項 (RXC#012) 共用

演習準備 2014 年 3 月 5 日神戸大学大学院システム情報学研究科森下浩二 1 RIKEN AICS HPC Spring School /3/5

データ構造

検体採取 患者の検査前準備 検体採取のタイミング 記号 添加物 ( キャップ色等 ) 採取材料 採取量 測定材料 P EDTA-2Na( 薄紫 ) 血液 7 ml RNA 検体ラベル ( 単項目オーダー時 ) ホンハ ンテスト 注 外 N60 氷 MINテイリョウ. 採取容器について 0

プログラミングI第10回

Microsoft Word - no205.docx

Microsoft PowerPoint - CproNt02.ppt [互換モード]

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

Microsoft Word - openmp-txt.doc

Microsoft PowerPoint - KHPCSS pptx

コードのチューニング

memo

Microsoft PowerPoint - 03_What is OpenMP 4.0 other_Jan18

Microsoft Word - all_ jp.docx

スパコンに通じる並列プログラミングの基礎

文字列操作と正規表現

RT-PCR プロトコール.PDF

Exam : 1z1-809-JPN Title : Java SE 8 Programmer II Vendor : Oracle Version : DEMO Get Latest & Valid 1z1-809-JPN Exam's Question and Answers 1 from Ac

オブジェクト指向プログラミング・同演習 5月21日演習課題

C のコード例 (Z80 と同機能 ) int main(void) { int i,sum=0; for (i=1; i<=10; i++) sum=sum + i; printf ("sum=%d n",sum); 2

第4回バイオインフォマティクスアルゴリズム実習

連載講座 : 高生産並列言語を使いこなす (5) 分子動力学シミュレーション 田浦健次朗 東京大学大学院情報理工学系研究科, 情報基盤センター 目次 1 問題の定義 17 2 逐次プログラム 分子 ( 粒子 ) セル 系の状態 ステップ 18

program7app.ppt

Quick Sort 計算機アルゴリズム特論 :2017 年度 只木進一

ファイル入出力

Transcription:

スーパーコンピュータ 京 における 融合遺伝子検出パイプラインの高速化 1 伊東聰, 1 白石友一, 2 島村徹平, 1 千葉健一, 1 宮野悟 sito@hgc.jp 1 東京大学医科学研究所ヒトゲノム解析センター DNA 情報解析分野 2 名古屋大学大学院医学系研究科システム生物学分野 平成 26 年度 京 における高速化ワークショップ 2014 年 12 月 19 日秋葉原 UDX4 階 UDX GALLERY NEXT-2

内容 がん,DNAシークエンスとスーパーコンピュータ Genomon-fusion for 京の概要 京コンピュータへの移植 CCLE RNA-seq の全計算 計算時間および解析結果などの概要 blatのopenmp 化 まとめと今後の課題 京 における高速化ワークショップ 2

がんと遺伝子異常 がんは遺伝子異常の病気 加齢と共に発症率が増加 = 後天的要素による発症 日々の生活の中で徐々に蓄積 修復機構で治せなかったもの 遺伝子異常の種類 一塩基多型 (SNP) 挿入 / 欠損 コピー数変化 構造変異 融合遺伝子 etc Fig.1 BCR-ABL1 fusion gene (http://watchingtheworldwakeup.blogspot.jp/200 9/07/strangeness-of-cancer.html) DNA 情報を読むことで, がんの原因やメカニズムを解き明かせる! 京 における高速化ワークショップ 3

セントラルドグマ アニメ ヒト 17 番染色体 タンパク質への翻訳 mrna スエプクソラインシ部ン分グがと切いりう出プさロれセるス RNA DNA Exon 1 Exon 2 Exon 3 RNA への転写メカニズム Exon 23 Exon 24 約 8.1 万文字の DNA 情報 1 DNA の損傷認識と修復を行う遺伝子 遺伝性乳がんとその変異との関係がわかっている 81,189 京 における高速化ワークショップ 4 約 8 万文字の領域にエクソンという部分に蛋白質がコード 東京大学医科学研究所宮野悟教授提供 Fig.2 Central dogma animation

DNA シークエンスのコスト推移 Fig.3 Trends of DNA sequencing cost (http://www.genome.gov/sequencingcosts/) 京 における高速化ワークショップ 5

DNA シークエンス解析の概要 次世代シークエンサーが出してくれるデータ RNA (20~30GB) < Exome < Whole genome (200~300GB) フォーマットは大体 Fastq リード長 :50bp~100bp DNAは細胞膜を壊して取り出す際に断片化されている bp: base pair= 塩基対,ATGCで表される文字一つ分のこと @CCLE_253J_BV_RNA_08.CELL_1/1 CGGGGCTAAGAGACAGCAAATACACATGAACAGAAAGAAGAGGTCAAAGAAAAGGCTGACGGCAAGTTAACAAAAAGAAAAATGGAAAATAATACCCGTCC + @??DDDDDB?3AAEAGGF;AA9<2:::FDGB@??F??DGFFI=0/?DFFICB;8((..67;E89,5;>ADCA:?B5'5<5<<9@################# @CCLE_253J_BV_RNA_08.CELL_614/1 GTGGGGGTGGTGTTAGTACCCCATCTTGTAGGTCTTGAGAGGCTCGGCTACCTCAGTGTGGAAGGTGGGCAGTTCTGGAATGGTGCCCGGGGCCGAGGGGG + CCCFFFFAFHFHHIJJIJJJJJJJJJJJIJJJEHIJIIJJJJIJJ6A?=?AE@@;A;@;@?5@>@,:?B################################ @CCLE_253J_BV_RNA_08.CELL_1227/1 GTGCGGGGTGGGCCCAGTGATATCAGCTGCCTGCTGTTCCCCAGATGTGCCAAGTGCATTCTTGTGTGCTTGCATCTCATGGAACGCCATTTCCCCAGACA +??=?DDDDHHA?BGADDHICGBGIGIHIIBFFEH97..7?ACC?B;C;ACAC>,>C;(;;55>:>C9A5;>@A4::+>:@C@:@9@99&8>>C:A?##### @CCLE_253J_BV_RNA_08.CELL_1840/1 GGCAGAAGAGGGGCGGGGAGCTGTGTGCCCTAAGATCTCATTGCCTTTTTATGCCGATTAACATGCTTTTAGCCCCTACTGAGCTTATAGTTAACAGAAGT + C@@FFFFFGGGHHFIIIF>?8=A@ACBCCDCCCCCDDDDDADCCDDDDDD@DCCCBDBBBCCDDC:>CCDCDCDD58?BD<:@CCA@CD:>BA((:>ACDC 京 における高速化ワークショップ Fig.4 Sample of Fastq data 6

DNA シークエンスとスーパーコンピューティング DNA データの解析 アラインメント ( マッピング ) 各リードが,DNA 鎖のどの部分であるかを探すこと アノテーション / フィルタリング /etc DNA のどこに変異 ( 異常 ) があるかを探す 数千万 ~ 数億リードに対し, そのポジションを同定する作業 ( アラインメント ) が必要であり, その計算コストが非常に大きい. 我々のミッション : がんに関連する DNA 変異を見つける! 遺伝子の不均一性 健常人と患者, 臓器による変化, 人種依存性, 時間変化, 多数検体, 検体内多部位など, 多くのシークエンスデータの統計的検定により得られる知見が重要. 京 における高速化ワークショップ 7

Genomon-fusion Whole Transcriptome シークエンスの結果である FASTQ ファイルのマッピング,fusion gene を検出し,fusion gene の候補の一覧を出力するソフトウェアです. http://genomon.hgc.jp/rna/ より抜粋 オープン / フリーソフトウェアを利用したパイプライン Bowtie Blat CAP3 fasta36 SAMtools Picard bedtools 京 における高速化ワークショップ 8

概要と特徴 東京大学医科学研究所白石友一氏提供 シークエンスのアラインメントを丁寧に行う. 丁寧なアラインメントによりスプライシングを高感度に検出することで, スプライシングの検出ミスによるアーティファクトを除く. 2 段階のアラインメント 1. トランスクリプトームの配列に bowtie でアラインメント. ( その後ゲノム配列の座標に変換 ) 既知のスプライシング情報を用いる ( 既知のトランスクリプト配列に張り付ける ) ことで, スプライシングの検出を感度良く行うことができる!! アラインメントされた配列はゲノム配列の座標に変換. 2. 1 でアラインメントされなかったリードを,blat を用いて, ゲノム配列にアラインメントを行う. blat により, データベースに登録のないスプライシングも検出しつつアラインメントを行うことができる. 計算時間はちょっとかかる ( スパコンがないと厳しいか ) 京 における高速化ワークショップ 9

Genomon-fusion のフロー ( アラインメント部分 ) 逐次プロセスをグリッドエンジンがまとめて一つのジョブとしてシステムに投入する仕組み. Fastq split fastq.aaa bowtie グリッドエンジン fastq.??? bowtie aligned.sam unaligned. fastq aligned.sam unaligned. fastq blat blat aligned2.sam aligned2.sam merged.sam merged.sam Result.sam 京 における高速化ワークショップ 10

京コンピュータへの移植 移植の目的 : 多数検体を同時に処理する Genomon-fusionのHGCスーパーコンピュータでの運用 1 検体のFastqファイルをsplitして並列処理 グリッドエンジン (SGE/UGE) を利用したマルチジョブ投入で実現 京コンピュータでは MPI/OpenMP を用いた並列プログラムのみ受け付け シリアルプログラムは動くが, グリッドエンジンはない 独自のファイルシステム ( ステージング ) への対応 ステージング : ログインノードと計算ノードのディスク間でのファイル授受 京 における高速化ワークショップ 11

Genomon-Fusion for 京 ( アラインメント部分 ) GFK の大雑把な流れ Fastq Fastq Fastq Fastq split 前処理 (GFKpre.sh) INPUT.0 bowtie 本処理 (GFKmain.sh) 全体を一つの MPI プロセス化 INPUT.? bowtie aligned.sam unaligned. fastq unaligned. fastq aligned.sam blat blat aligned2.sam aligned2.sam merged.sam merged.sam Result.sam Result.sam Result.sam sam.0 後処理 (GFKpost.sh) 京 における高速化ワークショップ 12

CCLE RNA-seq 全計算 CCLE Cancer Cell Line Encyclopedia http://www.broadinstitute.org/ccle/home RNA-seq: 780 検体, 20TByte Calc. Summary: Total core time: 7,027,933,648 sec (976,102 ノード時間 ) 分野 1 課題 4 の 2013 年度割り当て分の 12.7% # of core usage: 499,401 2 core/node, メモリ使用量 (8GB/proc) を確保するため 2 jobs=16 hours 実際には, プリプロセスの都合上,100 検体ずつ 8job で処理 京 における高速化ワークショップ 13

blat のプロファイル テストケース :3 ケース Case1: 平均値 (round-robin split) Case2: 最遅 Case3: 最速 Input data: Fasta フォーマット bowtie でマッピングされなかったリード ファイルサイズ ( 行数 ) Case1: 52,222 Case2: 68,922 Case3: 6,776 ー > ケース 3 では, ほとんどのリードが bowtie によりマッピングされている! Fig.7 Sample: CCLE_253J_BV_RNA_08 1File=5,000,000 lines (125k pair-reads) 京 における高速化ワークショップ 14

blat のプロファイル Timer start = main(0) Timer start = blat(0) Timer start = blat(part1)(0) Loaded 3095693983 letters in 25 sequences Timer stop = blat(part1)(0) 76.049922 Timer start = blat(part2)(0) Timer start = blat(part2 region1)(0) Timer stop = blat(part2 region1)(0) 0.000524 Timer start = blat(part2 region2)(0) Timer start = blat(part2 region21)(0) Timer stop = blat(part2 region21)(0) 9.632589 Timer start = blat(part2 region22)(0) Timer stop = blat(part2 region22)(0) 262.455965 Timer start = blat(part2 region23)(0) Timer stop = blat(part2 region23)(0) 0.000766 Timer stop = blat(part2 region2)(0) 272.296611 Timer start = blat(part2 region3)(0) Timer start = searchoneindex(1) Timer start = searchoneindex region 4(1) Timer stop = searchoneindex region 4(26111) 6213.238720 Searched 2637211 bases in 26111 sequences Timer stop = searchoneindex(1) 6213.241863 Timer stop = blat(part2 region3)(0) 6213.243220 Timer start = blat(part2 region4)(0) Timer stop = blat(part2 region4)(0) 0.000504 Timer stop = blat(part2)(0) 6485.543722 Timer stop = blat(0) 6561.628977 Timer stop = main(0) 6561.679652 Finished! nest = 0 Fig.8 Calc. time of blat for case1(averaged) Left: Fujitsu FX10, Right Shirokane1 Timer start = main(0) Timer start = blat(0) type = static, mod=0 num_threads = 1 Timer start = blat(part1)(0) Loaded 3095693983 letters in 25 sequences Timer stop = blat(part1)(0) 11.941816 Timer start = blat(part2)(0) Timer start = blat(part2 region1)(0) Timer stop = blat(part2 region1)(0) 0.000003 Timer start = blat(part2 region2)(0) Timer start = blat(part2 region21)(0) Timer stop = blat(part2 region21)(0) 3.424628 Timer start = blat(part2 region22)(0) Timer stop = blat(part2 region22)(0) 252.706811 Timer start = blat(part2 region23)(0) Timer stop = blat(part2 region23)(0) 0.000004 Timer stop = blat(part2 region2)(0) 256.131548 Timer start = blat(part2 region3)(0) Timer start = searchoneindex(1) Timer start = searchoneindex region 4(1) Timer start = searchoneindex region 41(1) Timer stop = searchoneindex region 41(26111) 0.036332 Timer start = searchoneindex region 42(1) Timer stop = searchoneindex region 42(0) 1651.952223 Timer stop = searchoneindex region 4(0) 1651.988864 Searched 2637211 bases in 26111 sequences Timer stop = searchoneindex(1) 1651.992685 Timer stop = blat(part2 region3)(0) 1651.992701 Timer start = blat(part2 region4)(0) Timer stop = blat(part2 region4)(0) 0.000002 Timer stop = blat(part2)(0) 1908.124283 Timer stop = blat(0) 1920.315536 Timer stop = main(0) 1920.316067 Finished! nest = 0 京 における高速化ワークショップ 15

OpenMP によるスレッド並列化 void searchoneindex(int filecount, char *files[], struct genofind *gf, char *outname, boolean isprot, struct hash *maskhash, FILE *outfile, boolean showstatus) /* Search all sequences in all files against single genofind index. */ int i; char *filename; int count = 0; long long totalsize = 0; gfoutputhead(gvo, outfile); for (i=0; i<filecount; ++i) filename = files[i]; if (nibisfile(filename)) struct dnaseq *seq; if (isprot) errabort("%s: Can't use.nib files with -prot or d=prot option n", filename); seq = nibloadallmasked(nib_mask_mixed, filename); freez(&seq->name); Region 1 seq->name = clonestring(filename); searchonemasktrim(seq, isprot, gf, outfile, maskhash, &totalsize, &count); freednaseq(&seq); } else if (twobitisspec(filename)) struct twobitspec *tbs = twobitspecnew(filename); struct twobitfile *tbf = twobitopen(tbs->filename); if (isprot) errabort("%s is a two bit file, which doesn't work for proteins.", filename); if (tbs->seqs!= NULL) struct twobitseqspec *ss = NULL; for (ss = tbs->seqs; ss!= NULL; ss = ss->next) struct dnaseq *seq = twobitreadseqfrag(tbf, ss->name, ss->start, ss->end); searchonemasktrim(seq, isprot, gf, outfile, Region maskhash, &totalsize, 2 &count); dnaseqfree(&seq); } } else struct twobitindex *index = NULL; for (index = tbf->indexlist; index!= NULL; index = index->next) struct dnaseq *seq = twobitreadseqfrag(tbf, index->name, 0, 0); searchonemasktrim(seq, Region isprot, gf, 3outFile, maskhash, &totalsize, &count); dnaseqfree(&seq); } } twobitclose(&tbf); } else static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } Region 4 linefileclose(&lf); } } carefulclose(&outfile); if (showstatus) printf("searched %lld bases in %d sequences n", totalsize, count); } Fig.9 Source code of searchoneindex (blat/blat.c) Target block is region4! 京 における高速化ワークショップ 16

OpenMP によるスレッド並列化 famixedspeedreadnext タイプ : 読み込み 内容 インプットファイルからのリード (k-mer) 読み込み searchonemasktrim タイプ : メイン計算 内容 リード (k-mer) のアラインメント, 最も重い部分 linefileclose タイプ : ファイル書き込み 内容 アラインメント結果をファイルに書き出す static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } linefileclose(&lf); Fig.10 Source code of region 4 京 における高速化ワークショップ 17

OpenMP によるスレッド並列化 searchonemasktrim の OpenMP 化 static struct dnaseq seq; struct linefile *lf = linefileopen(filename, TRUE); while (famixedspeedreadnext(lf, &seq.dna, &seq.size, &seq.name)) searchonemasktrim(&seq, isprot, gf, outfile, maskhash, &totalsize, &count); } linefileclose(&lf); while -> for ループ #pragma omp parallel private(i, ii, thread_num) thread_num = omp_get_thread_num(); #pragma omp for // Mail loop for( ii = 0; ii < lcount; ii++ ) searchonemasktrim(&seq[ii], isprot, gf, outfile[thread_num], maskhash, &totalsize, &count, thread_num); } // End of for } // End of parallel region Fig.11 Source code of region 4 with OpenMP スレッド数取得 スレッドごとにファイル出力 京 における高速化ワークショップ 18

OpenMP によるスレッド並列化 OpenMP 化のポイント インプットファイルの一括読み込み while ループの for ループ化のために必要 アウトプットファイルの分割 gvo スレッド処理の独立性を担保するため. 全処理終了後にファイルをマージする. cat blat.psl.* > blat.psl 行ごとにデータが独立しているので, 順番を問わない点を活用. ファイル出力に関するグローバル変数 関数 (searchoneindex) 内での変更がないので, 全スレッドでコピーを持たせる メモリ確保 関連する配列のメモリはスレッドごとに確保 解放する. 京 における高速化ワークショップ 19

Time (sec) OpenMP によるスレッド並列化 18000 Calculation time of blat on FX10 16000 14000 12000 10000 8000 6000 4000 2000 0 Case1 Case2 Case3 # of threads 1 2 4 1 2 4 1 2 4 Elapse time 6811.76 4719.19 2923.65 17137.47 9459.88 6788.9 495.67 386.66 387.09 Time (main) 6380.9 4375.55 2491.25 16791.53 9116.41 6441.93 65.27 43.08 40.13 Speed-up (main) 1 1.46 2.56 1 1.84 2.6 1 1.51 1.62 Fig.12 Result of OpenMP blat 京 における高速化ワークショップ 20

まとめ がん,DNAシークエンスとスーパーコンピューティング Genomon-fusion for 京の概要 CCLE RNA-seq 全計算 約 800 検体をおよそ97 万ノード時間で計算終了. アラインメント部分 (blat) が非常に計算コストがかかっていた. blat の OpenMP 化 メモリ使用量の関係から遊んでいたコアの有効活用. 4コアで2.5 倍程度の高速化を実現した. 今後の課題 実用上の問題として, データマネジメントが見えてきた. Sparc64VIIIfxの整数演算性能について ポスト京への期待 京 における高速化ワークショップ 21

謝辞 HPCI 戦略プログラム分野 1 予測する生命科学 医療および創薬基盤 課題 4 大規模生命データ解析 (hp140230) 東京大学医科学研究所ヒトゲノム解析センタースーパーコンピュータ ( 財 ) 高度情報科学技術研究機構山本秀喜様, 野口孝明様 京 における高速化ワークショップ 22