PowerPoint プレゼンテーション

Similar documents
AJACS_komachi.key

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

GWB

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]



分子系統解析における様々な問題について 田辺晶史

Microsoft Word - CygwinでPython.docx

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

KEGG.ppt


我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

NGSデータ解析入門Webセミナー

研究成果報告書

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

7-1(DNA配列から遺伝子を探す).ppt

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

基本的な利用法

核内受容体遺伝子の分子生物学

A Constructive Approach to Gene Expression Dynamics

Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

プログラミング実習I

NGS速習コース

Slide 1

数はファイル内のどの関数からでも参照できるので便利ではありますが 変数の衝突が起こったり ファイル内のどこで値が書き換えられたかわかりづらくなったりなどの欠点があります 複数の関数で変数を共有する時は出来るだけ引数を使うようにし グローバル変数は プログラムの全体の状態を表すものなど最低限のものに留

nagasaki_GMT2015_key09


GWB

分割コンパイル (2018 年度 ) 担当 : 笹倉 佐藤 分割コンパイルとは 一つのプログラムのソースを複数のソースファイルに分けてコンパイルすること ある程度大きなプログラムの場合ソースファイルをいくつかに分割して開発するのが普通 1

生命情報学

研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2

人工知能補足_池村

2 概要 市場で不具合が発生にした時 修正箇所は正常に動作するようにしたけど将来のことを考えるとメンテナンス性を向上させたいと考えた リファクタリングを実施して改善しようと考えた レガシーコードなのでどこから手をつけて良いものかわからない メトリクスを使ってリファクタリング対象を自動抽出する仕組みを

DNAFORM Clone Search Engine ユーザーズガイド

(Microsoft PowerPoint - HP\227pWASABI\217\320\211\356\216\221\227\277.ppt)

別添 2 SQL インジェクション ぜい弱性診断で最低限行うべき項目 1 ( ' ( 検索キー )''-- ( 検索キー ) and 'a'='a ( 検索キー ) and 1=1 は最低限 行うこと ) OS コマンドインジェクション 2 (../../../../../../../bin/sle

Microsoft PowerPoint - 阿部貴志.ppt

ファイルのアップロード. 上メニューから [ アップロード ] を選択します. [ アップロード ] 画面に移行しますので, 以下の手順で操作を行います アップロードするファイルを選択し, 指定場所へ [ ドラッグ & ドロップ ] します ドラッグ & ドロップ ファイルがリストアップされたことを

サイトの運用 Webサイトは生き物です 必要な情報が適切な時期にちゃんと表示され るようにしなければ 折角作ったサイトなのに十分に価値が発揮されな いことになってしまいます 今回は SOY CMSを使ったサイトの更新について制作者ではなく運用者 の視点から解説していきます ページと記事 SOY CM

Microsoft PowerPoint ppt

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

Microsoft PowerPoint - sousa pptx

プログラミングA

PowerPoint プレゼンテーション

分子系統解析における様々な問題について 田辺晶史


このうち ツールバーが表示されていないときは メニューバーから [ 表示 (V)] [ ツールバー (T)] の [ 標準のボタン (S)] [ アドレスバー (A)] と [ ツールバーを固定する (B)] をクリックしてチェックを付けておくとよい また ツールバーはユーザ ( 利用者 ) が変更

Microsoft PowerPoint ppt

プログラミングA

第2章 生物有機化学実験及び実験法

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル


プレゼンテーション3

情報システム運用・管理規程

1. 開発ツールの概要 1.1 OSS の開発ツール本書では OSS( オープンソースソフトウェア ) の開発ツールを使用します 一般に OSS は営利企業ではない特定のグループが開発するソフトウェアで ソースコードが公開されており無償で使用できます OSS は誰でも開発に参加できますが 大規模な

プレゼンテーション2.ppt

スライド 1

スライド 1

Microsoft Word - t30_西_修正__ doc

共起関係解析によるタンパク質の機能モジュール探索法の開発

memo

Si 知識情報処理

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

Bioinformatics2

Using VectorCAST/C++ with Test Driven Development

memo

kiso2-03.key

Qlucore_seminar_slide_180604

第4回バイオインフォマティクスアルゴリズム実習

5-3- 応統合開発環境に関する知識 1 独立行政法人情報処理推進機構


ソフト活用事例③自動Rawデータ管理システム

Microsoft Word doc

生物物理夏学・計算ハンズオン.docx

Microsoft PowerPoint - 簡易マニュアル_ver1.1.ppt [互換モード]

Microsoft PowerPoint - 3_TS-705(TaqMan_GeneExpressionAssays_製品情報及び検索方法修整10.pptx

基本的な利用法


Microsoft PowerPoint - sakurada3.pptx

フィルタとは

UMLプロファイル 機能ガイド

ChIP-seq

Microsoft PowerPoint - 12.ppt [互換モード]

Microsoft Word - VBA基礎(6).docx

WWWを用いた情報検索

ZipTheRipper のページへ移動したら ダウンロードの文字をクリックして下さい 使用許諾書を確認の上 同意チェックを入力し ダウンロードボタンを押して下さい サブウィンドウが表示されたら 保存 を選択して下さい ダウンロードが開始されます ダウンロードフォルダの中にある ZipTheRipp

計算機生命科学の基礎II_

Microsoft PowerPoint - T05_田畑先生【CC-BY】.pptx

JavaプログラミングⅠ

JACi400のご紹介~RPGとHTMLで簡単Web化~

バイオインフォマティクスⅠ

部品ライブラリシステム

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

NGS_KAPA RNA HyperPrep Kit

PowerPoint Presentation

インテル(R) Visual Fortran コンパイラ 10.0

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

Transcription:

機能アノテーションパイプライン ( 仮 ) 理化学研究所発生 再生科学総合研究センター (CDB) 機能ゲノミクスサブユニット粕川雄也 1

発表の概要 機能アノテーションってなに? 機能アノテーションはどうやってつけるの? パイプライン化 & ハイスループット化するには? 2

発表の概要 機能アノテーションってなに? 機能アノテーションはどうやってつけるの? パイプライン化 & ハイスループット化するには? 3

機能アノテーションとは? DNA:DNA 配列, ゲノム中の領域 RNA: 転写配列,mRNA 配列,non-coding RNA 配列 タンパク質 : アミノ酸配列 DNA Chip/Microarray 上の probe などなどの種々の 配列情報 に対する 機能についての情報ならばどんなものでも 例えば 遺伝子名 機能記述 定義 Gene Ontology 機能している時間 場所などなどなど 4

機能アノテーションがなぜ必要なの? 配列を決めること 簡単 ( ルーチン化されている ) 安い たくさん手に入れられる 機能を決めること 難しい ( ルーチン化されていない ) 高い 少しずつしか手に入らないだから, 配列が先に決められる 配列を手がかりに機能情報の収集 研究の流れ 5

発表の概要 機能アノテーションってなに? 機能アノテーションはどうやってつけるの? パイプライン化 & ハイスループット化するには? 6

どうするか? 機能アノテーションをつけよう 機能アノテーションをつけられる人間とか研究室を探し出してきておしつける 一番楽な方法だが, そう簡単には見つからないし, 後で揉めるかもしれない 適当に面白そうな機能をつけてしまう あとで諸々の問題になるのでやめたほうがいい 他のところから機能情報を いただく 最も正しい方法 配列情報をキーに公共データベースから機能情報を抽出 7

今回は, 今回の注意 マウスのmRNA 配列に対して, 遺伝子記述 ( 遺伝子定義 ) を与える ことを考える >gi 60551214 gb BC091645.1 GCCGAAACGGCAAGCGGATGGAGGGCGCTCGAACGGCCAGGTGTCGTGATTAAATTAGTCAGCCCTCAGA GACAGGCGTCCTACCTCCTTTATCCAGACCTCAAAAGCCCCGTTGTGCACCCGTGGTGGCTTCTTCACCT TCCCTGTTTCGTCCTCCACTGTATGGCCCAGACATGAGTGGTCCCCTAGAAGGGGCCGATGGGGGAGGAG ACCCCAGGCCCGGAGAACCTTTTTGTCCTGGAGGAGTCCCATCCCCTGGGGCCCCGCAGCACCGGCCTTG TCCAGGCCCCAGCCTGGCTGATGACACTGATGCAAACAGCAATGGCTCAAGTGGCAATGAGTCCAACGGA CCCGAGTCCAGGGGCGCATCTCAGCGGAGTTCTCATAGTTCCTCTTCTGGCAATGGCAAGGACTCAGCTC TGCTGGAGACCACTGAGAGCAGCAAGAGTACAAACTCACAGAGCCCATCCCCACCCAGCAGCTCCATTGC CTACAGCCTCCTGAGTGCGAGCTCAGAGCAGGACAACCCATCTACCAGTGGCTGCAGCAGTGAACAGTCA GCTCGAGCCAGGACCCAGAAAGAACTCATGACTGCACTTCGGGAGCTCAAACTTCGACTGCCACCAGAGC GTCGGGGCAAGGGCCGCTCTGGGACCTTGGCCACACTGCAGTACGCTCTGGCCTGTGTCAAGCAGGTTCA GGCTAACCAGGAATATTACCAGCAGTGGAGTCTGGAGGAGGGTGAGCCTTGTGCCATGGACATGTCTACT TACACCCTGGAGGAATTGGAGCATATCACATCCGAATACACACTTCGAAACCAGGACACCTTCTCTGTGG 8

問題 機能情報が与えられていな い配列があったときに, まず最初に行うことは,BLASTやFASTAなどの配列類似性検索である か か? 9

正解 10

正解 まず最初に, その配列自体の ( 機能 ) 情報がないかどうかを公共データベースから探す 配列が公開されていたら, たいてい親切な誰かが機能情報をつけてくれていることが多い 11

一般的な機能アノテーションの流れ 1. 公共データベースから, その配列自身の機能情報を直接検索 2. それがだめなら, 同じ配列を配列類似性検索 3. それもだめなら, アミノ酸配列の似ているタンパク質を配列類似性検索 4. それもだめなら, タンパク質ファミリー特異的なタンパク質ドメインをドメイン探索 5. それもだめなら,ncRNA か機能未知なのでしょう 12

1. データベースを直接検索 公開配列であれば,ID がついている その ID をキーにデータベースを検索し, その ID に付与されている機能情報を いただく 使えるデータベースには, たとえば, Mouse の配列なら MGI (Mouse Genome Informatics) http://www.informatics.jax.org/ ftp://ftp.informatics.jax.org/pub/ Human とか代表的な生物の配列なら Entrez Gene http://www.ncbi.nlm.gov/entrez/query.fcgi?db=gene ftp://ftp.ncbi.nih.gov/gene/ タンパク質なら UniProt (http://www.uniprot.org/) Affymetrix GeneChip の probeset なら http://www.affymetrix.com/analysis/index.affx ( 要登録 ) 13

1. データベースを直接検索 >gi 60551214 gb BC091645.1 GCCGAAACGGCAAGCGGATGGAGGGCGCTCGAACGGCCAGGTGTCGTGATTAAATTAGTCAGCCCTCAGA GACAGGCGTCCTACCTCCTTTATCCAGACCTCAAAAGCCCCGTTGTGCACCCGTGGTGGCTTCTTCACCT TCCCTGTTTCGTCCTCCACTGTATGGCCCAGACATGAGTGGTCCCCTAGAAGGGGCCGATGGGGGAGGAG ACCCCAGGCCCGGAGAACCTTTTTGTCCTGGAGGAGTCCCATCCCCTGGGGCCCCGCAGCACCGGCCTTG TCCAGGCCCCAGCCTGGCTGATGACACTGATGCAAACAGCAATGGCTCAAGTGGCAATGAGTCCAACGGA CCCGAGTCCAGGGGCGCATCTCAGCGGAGTTCTCATAGTTCCTCTTCTGGCAATGGCAAGGACTCAGCTC TGCTGGAGACCACTGAGAGCAGCAAGAGTACAAACTCACAGAGCCCATCCCCACCCAGCAGCTCCATTGC CTACAGCCTCCTGAGTGCGAGCTCAGAGCAGGACAACCCATCTACCAGTGGCTGCAGCAGTGAACAGTCA GCTCGAGCCAGGACCCAGAAAGAACTCATGACTGCACTTCGGGAGCTCAAACTTCGACTGCCACCAGAGC GTCGGGGCAAGGGCCGCTCTGGGACCTTGGCCACACTGCAGTACGCTCTGGCCTGTGTCAAGCAGGTTCA GGCTAACCAGGAATATTACCAGCAGTGGAGTCTGGAGGAGGGTGAGCCTTGTGCCATGGACATGTCTACT TACACCCTGGAGGAATTGGAGCATATCACATCCGAATACACACTTCGAAACCAGGACACCTTCTCTGTGG 14

流れ 1. データベースを直接検索 基本的にデータベースごとに個別対応 1 個ずつ手動でがんばる場合 WWW で検索 結果を手で抽出 まとめて処理する場合 データダウンロードサイトからファイルを取得 データ抽出 データ結合 もしくはMySQL 等で自分用のデータベースを構築して, 処理 15

1. データベースを直接検索 ftp://ftp.informatics.jax.org/pub/reports/mrk_sequence.rpt MGI:1098283 Per1 O Gene period homolog 1 (Drosophila) syntenic 11 AB002108 AB030818 AF022992 AK081813 AK148202 AK154900 AK172958 AK182563 AL645527 BC039768 BC091645 7373 NM_011065 MGI:1195265 Per2 O Gene period homolog 2 (Drosophila) syntenic 1 AA272850 AF035830 AF036893 AK044658 AK122253 AK159847 AK165556 BC055933 218141 NM_011066 16

同じ配列 同じ機能 なので, 2. 同じ配列を探す 同じ配列が公共データベースに存在し, その配列に機能情報があれば, その配列の機能情報を いただく いただいた 機能情報は そのまま使う いただいた元の情報 ( 場所 データベース名 ID) はつける 17

2. 同じ配列を探す 18

探す相手 探し方 2. 同じ配列を探す 1. データベースを直接検索 のデータベースの配列を使う 配列類似性検索プログラムで,DNA 同士もしくはアミノ酸配列同士の検索を行う プログラム BLASTN( 塩基同士 ) BLASTP( アミノ酸同士 ) FASTA( どちらでも ) など プログラムはいくつかあるが 同じ配列 を探すときは基本的に大差なし 許されるギャップの長さがかなり異なる ( 要注意 :alternative splicing) 19

3. 似た配列を探す 似た配列 似た機能 なので, 似た配列が公共データベースに存在し, その配列に機能情報があれば, その配列の機能情報を いただく いただいた 機能情報は ~~に似ている という情報にする いただいた元の情報はもちろんつける 20

3. 似た配列を探す 21

3. 似た配列を探す 探す相手 UniProt 配列を使うのがおすすめ 探し方 配列類似性検索プログラムで, アミノ酸配列への検索を行う 翻訳されるアミノ酸配列が分かる BLASTP,FASTA を使う DNA 配列だけしかわからない BLASTX,FASTX/FASTY を使う どのプログラムを使うかで, 計算時間, ギャップの入れ方が違うのでよく検討して選択する 例えば,fasty はどこにでもギャップが入るが, 非常に遅い 22

4. タンパク質ファミリーを探す タンパク質ドメインがある タンパク質ファミリーに属する そのファミリー共通の機能をもつ タンパク質ドメインの例 : NAD(P)H dehydrogenase family タンパク質 ACPD_BACSU (O35022) Putative acyl carrier protein phosphodiesterase (EC 3.1.4.14) (ACPphosphodiesterase). Q97DQ1 ACYL CARRIER PROTEIN PHOSPHODIESTERASE Q9K5P5 NAD(P)H DEHYDROGENASE (QUINONE) マルチプルアライメント YA05_SCHPO/1-192 MKILLINGAQEFA...HSQGKFNKTLHNVAKDT..LIQLGHTVQETVVDEGYD...ENT.EVEKIL Q9PMC4/2-192 KNILLLNGAKEFG...NSKGQLNLTLHNHALEI..LKTLGYEVDQTHIDQGYD...PKE.EIQKFI O25347/2-193 KKVLIINGAKAFG...SSGGKLNETLTDHAKKT..LESLGLEVDTTIVDKGYE...HAQ.EVEKVF MDAB_HAEIN/1-192 MNILLLDGGKAFG...HSHGELNHTLHKKAKEV..LTALGHNVKETVIDAGYD...VEA.EIEKFL Q9I0Q6/2-193 KNILLLNGGKRFA...HSDGRLNQTLHETALAH..LDRRGFDLRQTFIDGGYD...IPT.EVDKFL MDAB_ECOLI/2-193 SNILIINGAKKFA...HSNGQLNDTLTEVADGT..LRDLGHDVRIVRADSDYD...VKA.EVQNFL 23

なので, 4. タンパク質ファミリーを探す 似た既知タンパク質ドメインがあれば, そのタンパク質ドメイン ( ファミリー ) の機能情報を いただく いただいた 機能情報は ~( ドメイン名 )~というドメインを持つ という情報にする いただいた元の情報はもちろん記録 24

4. タンパク質ファミリーを探す 25

4. タンパク質ファミリーを探す 探す相手 Pfam (http://pfam.wustl.edu/) InterPro (http://www.ebi.ac.uk/interpro/) 方針 DNA 配列だけしかわからない Wise2 パッケージの estwisedb (http://www.ebi.ac.uk/wise2/) を使って, Pfam ドメイン を探す 翻訳されるアミノ酸配列が分かる InterProScan (http://www.ebi.ac.uk/interproscan/) を使って, InterPro ドメイン を探す 計算時間がかかるので注意 かかる時間に対して, それほど情報は増えない human や mouse などゲノム規模でタンパク質情報が収集されているのであれば, とばしてもよい 26

今のところ 5. ncrna 既知 ncrna 配列に対する配列類似性検索 RNAdb (http://research.imb.uq.edu.au/rnadb/) などを使う RNA ファミリー探索 Rfam (http://http://www.sanger.ac.uk/software/rfam/) infernal (http://www.genetics.wustl.edu/eddy/infernal/) がある 今後に期待 27

5. 機能未知 分からなかった場合は 分からなかった という情報をつけておく 宝の入ったゴミの山 ただし, 宝 と ゴミ を区別できるように, きれいなタンパク質に翻訳できそうか タンパク質コード領域予測 EST となら一致するか? dbest などに対する配列類似性検索 も情報としてつけておくと親切 28

発表の概要 機能アノテーションってなに? 機能アノテーションはどうやってつけるの? パイプライン化 & ハイスループット化するには? 29

問題機能アノテーションのように, いくつかの処理をつなげて, 一連の処理としてまとめる手続きのことを, 石油やガスの輸送に例えて, パイプライン化 という か か? 30

正解 31

正解 誰がつけたかは不明だが, パイプライン化という 最近は ワークフロー (workflow) 化 という場合もある 32

ハイスループット化 1 個ずつなら手作業でも十分 でも, たくさんの配列を対象とするのは, 手作業では大変 ではどうするか? 自動 パイプライン 化 人手を必要としないようにする 一連の複数の手続きを連続して一度に行うようにする 33

機能アノテーションパイプライン MGI データベース UniProt データベース Pfam/InterPro データベース MGI 情報抽出プログラム ( パーサ ) UniProt 情報抽出プログラム ( パーサ ) Pfam/InterPro 情報抽出プログラム ( パーサ ) MGI アノテーション MGI 配列 UniProt アノテーション UniProt 配列 Pfam/InterPro アノテーション Pfam/InterPro ドメイン 問合せ配列 直接検索プログラム 同じ配列検索プログラム 似た配列検索プログラム ファミリー検索プログラム 直接検索の結果 同じ配列の検索結果 似た配列の検索結果 ファミリー検索結果 遺伝子名つけプログラム 遺伝子名 34

一般的な方法 自動パイプライン化 パイプラインの各部を実行するプログラムを書く Perl/Ruby などでがしがし書く (bioperl/bioruby などが便利 ) 各部の処理を結合する なんらかの (perl や sh などの ) スクリプト言語で書く make コマンドを利用する 35

make コマンド 本来は, コンピュータプログラムの開発ツール 開発中にソースコードを変更したときに, 変更の影響があった部分だけを再構築して, 新しいプログラムを作り直すことができる ヘッダファイル 1 header1.h ソースファイル 1 src1.c ソースファイル 2 src2.c ソースファイル 3 src3.c ソースファイル 4 src3.c obj ファイル 1 src1.o obj ファイル 2 src2.o obj ファイル 3 src3.o obj ファイル 4 src4.o プログラム program 36

make をパイプラインに応用 MGI データベース UniProt データベース Pfam/InterPro データベース MGI 情報抽出プログラム ( パーサ ) UniProt 情報抽出プログラム ( パーサ ) Pfam/InterPro 情報抽出プログラム ( パーサ ) MGI アノテーション MGI 配列 UniProt アノテーション UniProt 配列 Pfam/InterPro アノテーション Pfam/InterPro ドメイン 問合せ配列 直接検索プログラム 同じ配列検索プログラム 似た配列検索プログラム ファミリー検索プログラム 直接検索の結果 同じ配列の検索結果 似た配列の検索結果 ファミリー検索結果 遺伝子名つけプログラム 遺伝子名 37

Makefile の作成 make コマンドの実行 make の実行方法 38

超簡易版 Makefile テンプレート all: finalfile1 finalfile2... 処理中に作られるファイル finalfile1: sourcefile1.1 sourcefile1.2... 出力ファイル commandfile1 $^ > $@ ファイル生成コマンド 入力ファイル finalfile2: sourcefile2.1 sourcefile2.2... commandfile2 $^ > $@... 39

make を使うとこんないいことが ( 先ほどいいましたが ), 更新の影響のあるところだけ, 計算をやりなおすことが簡単にできる パイプライン開発中は, スクリプト プログラムの変更が頻繁におきるが,make を使うと, その変更の影響があるデータだけを再計算 ( テスト ) させるようにもできる make n とすると, 実際に走らせる前に, どういうことが行われるかわかる make j 2 とするだけで, 並列処理させることもできる 使用方法が, どこどこのディレクトリに移動して,make を実行する だけなので, 仕事の引継ぎがとても楽 40

機能アノテーションとは まとめ 主として配列に 機能情報 を付与すること 機能アノテーションのつけ方 データベース検索 同じ配列の検索 似た配列の検索 ファミリーの検索 機能未知 機能アノテーションパイプラインの構築 make が使えるかも 41

さいごに 皆さんは これから新しい仕事を始めよう としているかと思いますが, その仕事を未来永劫続けるとは限らない 次の仕事が待っているかもしれない 次の職が待っているかもしれない 仕事の切り上げ方も考えておくと, 後で幸せかもしれない (make で楽になるかも ) 以上ご清聴ありがとうございました 42

43

BLAST 実行用 Makefile seq/ の下に FASTA 形式のファイルをおくと, results/ の下に BLAST 計算結果が作られる 一度計算した配列は, 更新されるまで再計算されない SEQFILES=$(wildcard seq/*) RESULTFILES=$(SEQFILES:seq/%=results/%) all: $(RESULTFILES) results/%: seq/% blastall p blastn d refseq_rna $^ > $@ 44