ゲノム解析で活躍するコンピューター

Similar documents
KEGG_PATHWAY.ppt

KEGG.ppt

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

PowerPoint プレゼンテーション

130712AJACS40

PowerPoint プレゼンテーション

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

Microsoft PowerPoint - AJACS38_KEGG-GEnomeNet_tokimatsu v2.ppt [互換モード]

nagasaki_GMT2015_key09

核内受容体遺伝子の分子生物学

yakugaku-kot.ppt

7-1(DNA配列から遺伝子を探す).ppt

Microsoft PowerPoint - 阿部貴志.ppt

研究成果報告書


Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

AJACS_komachi.key

1_alignment.ppt

機能ゲノム学(第6回)



PowerPoint プレゼンテーション

5_motif 公開版.ppt

生命情報学

バイオインフォマティクスⅠ

A Constructive Approach to Gene Expression Dynamics

PowerPoint プレゼンテーション

GWB

報道発表資料 2007 年 8 月 1 日 独立行政法人理化学研究所 マイクロ RNA によるタンパク質合成阻害の仕組みを解明 - mrna の翻訳が抑制される過程を試験管内で再現することに成功 - ポイント マイクロ RNA が翻訳の開始段階を阻害 標的 mrna の尻尾 ポリ A テール を短縮

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

スライド 1

CBRC CBRC DNA

修士論文予稿集の雛型

NGSデータ解析入門Webセミナー

名古屋大学農学部 生物情報工学 II 11 月 29 日

Microsoft Word - Gateway technology_J1.doc

Microsoft PowerPoint - プレゼンテーション1

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Slide 1

Slide 1

第2章 生物有機化学実験及び実験法

Untitled

MB-lecture12.pptx

Microsoft Word doc

別紙

人工知能補足_池村

Bioinformatics2

Microsoft PowerPoint _SINET_cloud

<4D F736F F F696E74202D E838A B83805F D B838093FC96E55F E707074>

PowerPoint プレゼンテーション


スライド 1

みどりの葉緑体で新しいタンパク質合成の分子機構を発見ー遺伝子の中央から合成が始まるー

Microsoft PowerPoint - 4_河邊先生_改.ppt

物学的現象をはっきりと掌握することに成功した論文である との高い評価を得ています 2. 研究成果ブフネラゲノムの全塩基配列の決定に当たっては 全ゲノムショットガンシークエンス法 4 を用いました 今回ゲノム解析に成功したのは エンドウヒゲナガアブラムシ (Acyrthosiphon pisum) の

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

PowerPoint プレゼンテーション

Microsoft PowerPoint - DNA1.ppt [互換モード]

( 図 ) 自閉症患者に見られた異常な CADPS2 の局所的 BDNF 分泌への影響

Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

2. 看護に必要な栄養と代謝について説明できる 栄養素としての糖質 脂質 蛋白質 核酸 ビタミンなどの性質と役割 およびこれらの栄養素に関連する生命活動について具体例を挙げて説明できる 生体内では常に物質が交代していることを説明できる 代謝とは エネルギーを生み出し 生体成分を作り出す反応であること


研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2

Microsoft Word - PRESS_

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

Microsoft PowerPoint - BI_okuno_

分子系統解析における様々な問題について 田辺晶史

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint _生物配列解析基礎_3回目.pptx

国立遺伝学研究所におけるDNAデータバンク:DDBJ

PrimerArray® Analysis Tool Ver.2.2

Hi-level 生物 II( 国公立二次私大対応 ) DNA 1.DNA の構造, 半保存的複製 1.DNA の構造, 半保存的複製 1.DNA の構造 ア.DNA の二重らせんモデル ( ワトソンとクリック,1953 年 ) 塩基 A: アデニン T: チミン G: グアニン C: シトシン U

PowerPoint Presentation

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

Bio-Mirror Project

GWB

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

<4D F736F F D F D F095AA89F082CC82B582AD82DD202E646F63>

PowerPoint Presentation

Microsoft PowerPoint マクロ生物学9

スライド 1

機能ゲノム学(第6回)


Microsoft PowerPoint - ????????????2016_01P.ppt [?????]


今後の展開現在でも 自己免疫疾患の発症機構については不明な点が多くあります 今回の発見により 今後自己免疫疾患の発症機構の理解が大きく前進すると共に 今まで見過ごされてきたイントロン残存の重要性が 生体反応の様々な局面で明らかにされることが期待されます 図 1 Jmjd6 欠損型の胸腺をヌードマウス

Microsoft PowerPoint - LDW.ppt [互換モード]

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

Microsoft PowerPoint - 平成22年度第一回_武田.pptx

<4D F736F F F696E74202D2092B7924A5F835E E8EBF918A8CDD8DEC B835E B835891E3955C934993FC82E88CFB82512E707074>

( 写真 ) 左 : キャッサバ畑 右上 : 全体像 右下 : 収穫した芋

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

CiRA ニュースリリース News Release 2014 年 11 月 20 日京都大学 ips 細胞研究所 (CiRA) 京都大学細胞 物質システム統合拠点 (icems) 科学技術振興機構 (JST) ips 細胞を使った遺伝子修復に成功 デュシェンヌ型筋ジストロフィーの変異遺伝子を修復

Microsoft PowerPoint - 基礎生物学A-6-メンデル遺伝.pptx


■リアルタイムPCR実践編

Transcription:

ゲノム解析で活躍するコンピューター ゲノム情報のためのデータベースと遺伝子機能の解析 京都大学化学研究所バイオインフォマティクスセンター五斗進 科学カフェ京都第 62 回定例会京都大学 2010/4/10 1

本日お話する内容 ゲノムとゲノムプロジェクトについて ゲノムデータとデータベースについて ゲノムデータを使った解析について 遺伝子の機能を調べる 2

ゲノムとは ゲノム (Genome) Gene( 遺伝子 )+ -ome( 全体 ): 遺伝子の総体 Gene( 遺伝子 )+ Chromosome( 染色体 )

ゲノムとは 個体 細胞 DNA の 2 重らせん構造 染色体 atggcgacccgcagccctggcgtcgtgattagtgatgatgaaccaggttatgaccttgat ttattttgcatacctaatcattatgctgaggatttggaaagggtgtttattcctcatgga ctaattatggacaggactgaacgtcttgctcgagatgtgatgaaggagatgggaggccat cacattgtagccctctgtgt... ゲノムの全塩基配列

DNA とタンパク質 ( セントラルドグマ ) 遺伝子 エクソン イントロン ゲノム DNA 転写 ACGT: 塩基配列 mrna スプライシング ACGU: 塩基配列 成熟 mrna 翻訳 タンパク質 折り畳み ACDEF : アミノ酸配列 機能

ゲノム研究の歴史 1900 年前後 1950 年代 1960 年代 遺伝法則の発見 ( メンデル ) ゲノム概念の提唱 ( ヴィンクラー ) DNA2 重らせん構造の発見 ( ワトソン クリック ) 遺伝暗号の解読 ( ニーレンバーグら ) 1970 年代 1980 年代 1990 年代 DNA 塩基配列決定法の開発 ΦX174 ファージゲノム配列決定 ( サンガーら ) PCR 法の開発 ( マリス ) ヒトゲノム計画の提案 ( ダルベッコ ) ヒトゲノム計画がスタート

ゲノム研究の歴史 1995 年 1996 年 1997 年 1998 年 1999 年 2000 年 2001 年 ヘモフィルス菌ゲノムの解読 ( 約 200 万塩基 2000 遺伝子 ) ( 独立生活する生物のゲノム ) 出芽酵母ゲノムの解読 ( 約 1200 万塩基 6000 遺伝子 ) ( 真核生物のゲノム ) 枯草菌ゲノムの解読 ( 約 400 万塩基 4000 遺伝子 ) ( 日本を中心としたグループによる解読 ) 線虫ゲノムの解読 ( 約 9700 万塩基 20000 遺伝子 ) ( 多細胞生物のゲノム ) ヒト 22 番染色体ゲノムの解読 ショウジョウバエ シロイヌナズナゲノムの解読 ヒトゲノムの概要配列発表 ( 約 30 億塩基 )

ポストゲノムプロジェクト トランスクリプトーム (Transcript + -ome) 転写産物 (RNAのこと) の総体 細胞内で実際に mrna として発現している遺伝子 プロテオーム (Protein + -ome) タンパク質の総体 細胞内で実際にタンパク質として働いている遺伝子 メタボローム (Metabolite + -ome) 代謝産物 ( アミノ酸 グルコースなど ) の総体 代謝系で合成されている化合物 8

本日お話する内容 ゲノムとゲノムプロジェクトについて ゲノムデータとデータベースについて ゲノムデータを使った解析について 遺伝子の機能を調べる 9

塩基配列データベース 1970 年代の配列決定技術 サンガー法 マキサム ギルバート法 自動 DNAシーケンサーの開発 大量の塩基配列の産出 PIRタイプから著者によるサブミットへ 三極体制によるデータの収集 日本 :DDBJ (DNA DataBank of Japan) @ 遺伝研 米国 :GenBank @ National Center for Biotechnology Information, National Institute of Health 欧州 :EMBL @ European Molecular Biology Laboratory ゲノムプロジェクト

GenBank の例 LOCUS X00617 1338 bp DNA linear BCT 12-SEP-1993 DEFINITION E.coli triose phosphate isomerase gene (TPI) (EC 5.3.1.1). ACCESSION X00617 VERSION X00617.1 GI:43111 KEYWORDS glycolysis gluconeogenesis; isomerase. SOURCE Escherichia coli ORGANISM Escherichia coli Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia. REFERENCE 1 (bases 1 to 1338) AUTHORS Pichersky,E., Gottlieb,L.D. and Hess,J.F. TITLE Nucleotide sequence of the triose phosphate isomerase gene of Escherichia coli JOURNAL Mol. Gen. Genet. 195 (1-2), 314-320 (1984) PUBMED 6092857 COMMENT Data kindly reviewed (30-MAY-1985) by L.D. Gottlieb.

FEATURES Location/Qualifiers source 1..1338 /organism="escherichia coli" /mol_type="genomic DNA" /db_xref="taxon:562" CDS 220..987 /note="unnamed protein product; isomerase" /codon_start=1 /transl_table=11 /protein_id="caa25253.1" /db_xref="gi:43112" /db_xref="goa:p0a858" /db_xref="pdb:1tmh" /db_xref="pdb:1tre" /db_xref="uniprotkb/swiss-prot:p0a858" /translation="mrhplvmgnwklngsrhmvhelvsnlrkelagvagcavaiappe MYIDMAKREAEGSHIMLGAQNVNLNLSGAFTGETSAAMLKDIGAQYIIIGHSERRTYH KESDELIAKKFAVLKEQGLTPVLCIGETEAENEAGKTEEVCARQIDAVLKTQGAAAFE GAVIAYEPVWAIGTGKSATPAQAQAVHKFIRDHIAKVDANIAEQVIIQYGGSVNASNA AELFAQPDIDGALVGGASLKADAFAVIVKAAEAAKQA" ORIGIN 1 ctgcaggacg cctactaagg cggcggggaa aaacaaacgt tattacaccg agacagaagg 61 tgcactgcgt tatgttgtcg cggacaacgg cgaaaagggg ctgaccttcg ctgttgaacc 121 aattaagttg gcgctatctg antctcatac tgtttcacag acctgctgcc ctgcggcggc 181 caatcttcct ttattcgctt ataagcgtgg agaattaaaa tgcgacatcc tttagtgatg 241 ggtaactgga aactgaacgg cagccgccac atggttcacg agctggtttc taacctgcgt 301 aaagagctgg caggtgttgc tggctgtgcg gttgcaatcg caccaccgga aatgtatatc ( 中略 ) 1021 ttactttcct taactcttcg ccttaacgca aaatctcaca ctgatgatcc tgaatttcct 1081 cggctgaagc acggttaagc gtcagtagat ttcgttgtgt cgccagcaat acaaatgagt 1141 tatcactctg ccgtaccatc gccagcccgt agcgtcccat atgttcccgc gcctcaggta 1201 cttcttctgc cagcatcata aatgggctgc gttgtaccag ttcgctttcc gttacccgac 1261 gcgcaggtat tcatgcccgc gcaaaccacc tggcagtggc aaccagcggc tgctgatgtt 1321 cgccagattg ttatcgag //

塩基配列データベースのサイズ エントリーの数 塩基の数 塩基配列の増加は約 5 年で 10 倍のペース

配列データベースの使われ方 似たものを探す ( ホモロジー検索 ) ある ( 機能未知の ) 遺伝子の塩基配列を実験で決定 その配列をもとにして データベース中に似た配列が登録されていないかを探す 前提 : 同じ機能を持つ遺伝子は似た配列を持つ a 種分岐 a1 a1 種 1 種 2

配列データベースの使われ方 大腸菌のある酵素と同じ機能を持つコレラ菌の酵素をアミノ酸配列で比較した結果 大腸菌コレラ菌

ゲノムプロジェクトが出すデータ 個体 atggcgacccgcagccctggcgtcgtgattagtgatgatgaaccaggttatgaccttgat ttattttgcatacctaatcattatgctgaggatttggaaagggtgtttattcctcatgga ctaattatggacaggactgaacgtcttgctcgagatgtgatgaaggagatgggaggccat cacattgtagccctctgtgt... 細胞 ゲノムの全塩基配列 染色体 全遺伝子のカタログ情報 個々の遺伝子の機能についての情報 ホモロジー検索だけで機能が分かる遺伝子は半分 2/3 程度

パスウェイの情報

パスウェイの情報

パスウェイの情報 酵素 / 遺伝子と化合物のネットワーク ヒトの解糖系 ( 体内に取り込んだ糖を分解して再利用する経路 ) 緑 : ヒトに対応する遺伝子がある酵素 白 : ヒトにない酵素

本日お話する内容 ゲノムとゲノムプロジェクトについて ゲノムデータとデータベースについて ゲノムデータを使った解析について 遺伝子の機能を調べる 20

遺伝子の機能予測とゲノムの機能予測 (A) 遺伝子の機能予測 (B) ゲノムの機能予測 遺伝子の機能 生物の機能 立体構造 DB 発現 DB モチーフ DB 相同性検索立体構造予測 相互作用 DB パスウェイ解析 配列 構造解析 配列 DB パスウェイ DB 遺伝子配列情報 ゲノム情報 ( 遺伝子の集合 ) 21

ゲノムの機能予測をした後は 機能予測の抜けを探す パスウェイ中で途切れているところ 機能未知遺伝子との対応? 様々な情報を比較 種に特徴的な機能は何か? 機能未知遺伝子の機能予測 パスウェイ ( ネットワーク ) のトポロジーを解析 22

機能予測の抜けの例 リジン? グルタリル CoA クエン酸回路 ゲノム情報から再構築された緑膿菌のリジン分解系 23

機能予測の抜けの例 リジン グルタリル CoA 未知の酵素遺伝子 (missing enzyme) クエン酸回路 生化学的な知識による緑膿菌のリジン分解系 24

データ統合による知識抽出 マイクロアレイ遺伝子発現 類似度行列 ( カーネル ) ネットワーク推定 酵母 2 ハイブリッド 細胞内局在情報 系統プロファイル 仮定 : 似たパターンを持つ遺伝子同士は機能的に関係している可能性が高い 25

カーネル N 個のタンパク質 x 1, x2,..., x N を仮定 カーネル K( x, x ) は タンパク質 xとx の類似度 ( 数学的には 特徴ベクトルの内積 ) タンパク質セットの類似度行列 K = K( x, x ) ( i, j 1,2,..., N) ij i j = 26

..., 0.2 0.3 0.3 0.2 ) (, 0.3 0.2 0.4 0.1 ) ( 2 1 = Φ = Φ x x 0.26 0.2 0.3 0.3 0.2 0.3 0.4 0.2 0.1 ) ( ) ( ), ( 2 1 2 1 = + + + = Φ Φ = x x x x K 遺伝子の塩基構成比 x N x x,..., 1, 2 カーネルの例 27

カーネルの例 = = : 0.26 0.26 0.26 0.3 ), ( ), ( ), ( ), ( 2 2 1 2 2 1 1 1 x x x x x x x x K K K K K カーネル行列一種の類似度行列とみなせる一種の遺伝子類似性ネットワーク = 28

多様なデータと表現方法 データ マイクロアレイ遺伝子発現 酵母 2 ハイブリッド ( タンパク質間相互作用 ) 細胞内局在 系統プロファイル 表現方法数値ベクトルグラフビットベクトルビットベクトル 29

多様なデータとデータ型 数値ベクトル間の類似度を求める関数 K( x i, x j ) = exp( x i x j 2 2 / σ ) グラフ上の頂点間の類似度を求める関数 K = exp( L) ここで L はグラフのラプラシアン (Kondor, 2002) 30

31 多様なデータとデータ型 各データにおける遺伝子間の距離をカーネル行列として定義 Kg: ゲノム上での遺伝子間の距離 Ke: 発現パターンの類似度 Kp: 系統プロファイルの類似度 カーネルの和を取る K = Kg + Ke + Kp 統合されたカーネル K を用いて遺伝子間の関係を変換 教師付き学習

教師なしの場合 32

機能予測の抜けの例 リジン グルタリル CoA 未知の酵素遺伝子 (missing enzyme) クエン酸回路 生化学的な知識による緑膿菌のリジン分解系 33

教師付き学習 発現データの類似度行列 タンパク質ネットワーク Unknown pathway 34

教師付き学習 発現データの類似度行列 タンパク質ネットワーク トレーニング トレーニング Unknown pathway 35

教師付き学習 発現データの類似度行列 タンパク質ネットワーク トレーニングテストトレーニングテスト Unknown pathway 36

教師付き学習 元の空間 x 1 x 3 x 2 : トレーニングセット 37

38 教師付き学習 元の空間 x 1 x 2 x 3 : 教師なしで直接予測した結果 : トレーニングセット

39 教師付き学習 元の空間 x 1 x 3 x 2 : 真のネットワーク : トレーニングセット

40 教師付き学習 ステップ 1: 相互作用するタンパク質ペアが近くにあるような特徴空間に射影 元の空間 特徴空間 x 1 f f ( x 1 ) x 2 x 3 : 真のネットワーク : トレーニングセット f ( x 3 ) f ( x 2 )

41 教師付き学習 ステップ 1: 相互作用するタンパク質ペアが近くにあるような特徴空間に射影 元の空間 特徴空間 x 1 f f ( x 1 ) x 2 x 3 : 真のネットワーク : トレーニングセット f ( x 3 ) f ( x 2 )

教師付き学習 元の空間 特徴空間 x 1 f f ( x 1 ) x 2 x 3 : 真のネットワーク : トレーニングセット f ( x 3 ) f ( x 2 ) : テストセット 42

教師付き学習 ステップ 2: テストセットに関与するタンパク質間相互作用を予測 元の空間 特徴空間 x 1 f f ( x 1 ) x 2 x 3 : 真のネットワーク : トレーニングセット f ( x 3 ) f ( x 2 ) : テストセット 43

教師付き学習 ステップ 2: テストセットに関与するタンパク質間相互作用を予測 元の空間 特徴空間 x 1 f f ( x 1 ) x 2 x 3 : 真のネットワーク : トレーニングセット f ( x 3 ) f ( x 2 ) : テストセット 44

45 アルゴリズム K K 1 2 : 発現データの類似度行列 : ネットワークの類似度行列 ( α 1,α ) 2 = arg max α 1 T K 1 K 2 α 2 ( 1+ λ 1 α T 1 K 12 α) 1/ 2 ( 1 1+ λ 1 α T 2 K 22 α ) 1/ 2 2 f n ( x) = α1 1( x j, x) j= 1 j K データの類似度行列が入力であることが特長

性能評価 直接予測 教師付き学習 46

バクテリアの代謝系遺伝子の予測 Missing enzymes 緑膿菌のリジン分解系 47

バクテリアの代謝系遺伝子の予測 Lysine degradation of Pseudomonas aeruginosa Glutaryl-CoA dehydrogenase + FAD FADH 2 + + CO 2 Glutaryl-CoA Crotonoyl-CoA GcdH MVGKASFNWIDPLLLDQQLTEEERMVRDSAYQFAQDKLAPRVLEAFRHEQTDPAIFREMG EVGLLGATIPEQYGGSGLNYVCYGLIAREVERIDSGYRSMMSVQSSLVMVPINEFGTEAQ KQKYLPKLASGEWIGCFGLTEPNHGSDPGSMITRARKVDGGYRLTGSKMWITNSPIADVF VVWAKDDAGDIRGFVLEKGWQGLSAPAIHGKVGLRASITGEIVMDNVFVPEENIFPDVRG LKGPFTCLNSARYGISWGALGAAEACWHTARQYTLDRQQFGRPLAANQLIQKKLADMQTE ITLALQGCLRLGRMKDEGTAAVEITSIMKRNSCGKALDIARMARDMLGGNGISDEFGVAR HLVNLEVVNTYEGTHDVHALILGRAQTGIQAFY Citrate cycle 48

バクテリアの代謝系遺伝子の予測 Lysine degradation of Pseudomonas aeruginosa Lysine monooxygenase + O 2 + CO 2 + H 2 O L-lysine 5-aminopentanamide Gene: Unknown Citrate cycle 49

バクテリアの代謝系遺伝子の予測 Lysine degradation Pseudomonas aeruginosa????? No sequence data for any other species Gene: Unknown Citrate cycle 50

51 予測方法 Known???? 1.Predicting network of 4,225 protein genes in Pseudomonas, and extract lysine degradation pathway 2.Candidate genes are extracted from the genes located between known genes? TCA cycle Known

予測に使える情報 機能的に関連のあるタンパク質の遺伝子は ゲノム上で近い位置にある傾向 (Bork, P. et al., 1998) 機能的に関連のあるタンパク質は 同じような進化パターンを持つ傾向 (Pazos, F., 2001; Pellegrini, M. et al, 1999) 52

53 系統プロファイル Pellegrini et al. Proc. Natl. Acad. Sci. USA, 96:4285 (1999) オーソログ遺伝子のパターンを分類 E.coli S.cerevisiae B.subtilis H.influenzae 1 0 1 1 1 0 0 1 1 同じパターンを持つ遺伝子は進化的 機能的に関連がある 1 0 0 0 1 1 1 1 0

54 カーネル ( 類似度の表現 ) ゲノム上での位置 K gen ( x, x ) = exp( d / h) ここで d: 遺伝子 xとx 間の塩基数 系統プロファイル K phy ( x, x ) = x x ここで x: 系統プロファイル 統合 K int = K gen + K phy

55 予測結果 PA0262,260 (hypothetical) PA0265 (dehydrogenase) PA0266 (amino-transferase)

56 まとめ ゲノムをはじめとする多種多様なデータから生命システムを明らかにするにはデータを検索 解析技術が重要 ハイスループットデータをデータベース化するだけでなく 既知の情報もデータベース化して 新しいデータと組み合わせて解析できるようにすることが重要

京都大学で構築中のデータベース 様々な種類のデータを 生命現象の総体 として立体的に再構築 ツールの提供 EGassembler KAAS GENIES KegArray ネットワークの知識 KEGG PATHWAY 高次機能 機能の階層分類相互参照用データ KEGG BRITE ツールの提供 e-zyme pathcomp KegArray ゲノムの知識 KEGG GENES/EGENES 化合物の知識 KEGG LIGAND 研究者の知識をゲノムレベルのデータと結びつける KEGG: Kyoto Encyclopedia of Gene and Genomes http://www.genome.jp/kegg/

ご静聴ありがとうございました