Microsoft PowerPoint BI_lec

Similar documents
Microsoft PowerPoint - BI_okuno_

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

1_alignment.ppt

KEGG.ppt

計算機生命科学の基礎II_

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

ケモインフォマティクスや創薬における 機械学習の世界初の本 Lodhi, H. and Yamanishi, Y., Chemoinformatics and Advanced Machine Learning Perspectives, IGI Global, 2010.

の活性化が背景となるヒト悪性腫瘍の治療薬開発につながる 図4 研究である 研究内容 私たちは図3に示すようなyeast two hybrid 法を用いて AKT分子に結合する細胞内分子のスクリーニングを行った この結果 これまで機能の分からなかったプロトオンコジン TCL1がAKTと結合し多量体を形

バイオインフォマティクスⅠ

AJACS18_ ppt

日本の製薬業界はすごい! 国際市場における創薬シェア 主要医薬品 約100品目 の創出国 アジア唯一の新薬開発国 2016年:世界3位 医薬産業政策研究所 政策研ニュースNo 年3月 国内における主要製造業の 納税者額の推移 高水準の納税額 国内2位 を安定に維持 2

医薬基盤 健康 栄養研究所の沿革 医薬基盤研究所 国 健康 栄養研究所 平成 27 年 4 月 1 日統合 国立研究開発法人 医薬基盤 健康 栄養研究所

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Web Web Web Web Web, i

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

GWB_RNA-Seq_

CourseDescriptions_

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

学位論文の内容の要旨 論文提出者氏名 小川憲人 論文審査担当者 主査田中真二 副査北川昌伸 渡邉守 論文題目 Clinical significance of platelet derived growth factor -C and -D in gastric cancer ( 論文内容の要旨 )

FMO法のリガンド-タンパク質相互作用解析への応用

OECD QSAR Toolbox活用マニュアルv1.0

核内受容体遺伝子の分子生物学

NGSデータ解析入門Webセミナー

Microsoft PowerPoint - 6_TS-0891(TS-0835(Custom TaqMan Assay Design Tool利用方法修正5.pptx

28 TCG SURF Card recognition using SURF in TCG play video

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

( )

FMO法演習

次世代シークエンサーを用いたがんクリニカルシークエンス解析

GWB

第2章 生物有機化学実験及び実験法

リード・ゲノム・アノテーションインポート

機能ゲノム学(第6回)

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

浜松医科大学紀要

<4D F736F F D B82C982C282A282C482512E646F63>

Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

19 Systematization of Problem Solving Strategy in High School Mathematics for Improving Metacognitive Ability

PowerPoint プレゼンテーション

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

A4パンフ

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

ï\éÜA4*

一次サンプル採取マニュアル PM 共通 0001 Department of Clinical Laboratory, Kyoto University Hospital その他の検体検査 >> 8C. 遺伝子関連検査受託終了項目 23th May EGFR 遺伝子変異検

untitled

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

図 1 緩和ケアチーム情報共有データベースの患者情報画面 1 患者氏名, 生年月日, 性別, 緩和ケアチームへの依頼内容について,2 入退院記録, 3カンファレンス ラウンド実施一覧,4 問題点のリスト,5 介入内容の記録. 図 2 緩和ケアチームカンファレンス ラウンドによる患者評価入力画面 (

第121回関東連合産科婦人科学会総会・学術集会 プログラム・抄録

バクテリアゲノム解析

_統合化推進プログラム_金久チーム_サイトビジット資料


ChIP-seq

Bio-Rad Spectroscopy Products Guide

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme

Microsoft PowerPoint - 2_(廣瀬宗孝).ppt

CBRC CBRC DNA

Transcription:

創薬インフォマティクス Department of PharmacoInformatics 奥野恭史

医薬品開発の成功確率 2-3 年 3-5 年 3-7 年 1-2 年計 9-17 年 基礎研究 非臨床試験 臨床試験 ( 治験 ) 承認申請承認取得 化合物数 499,915 197 97 62 32 移行確率 1/2,538 1/2.03 1/1.56 1/1.94 累積成功率 1/2,538 1/5,154 1/8,063 1/15,622 ボトルネック ( 製薬協 Data Book(2001-2005)) 計算機を用いた超効率的な薬物候補探索 医薬品の開発期間とコストの短縮

医薬品開発プロセス ゲノム情報 ゲノム基盤ターゲット研究探索 ターゲット バリデーション 創薬リード探索 創薬リード最適化 前臨床研究臨床研究 創薬 ゲノム情報 (~2 万 2 千遺伝子 ) 化合物ライブラリー (10^60 化合物 ) 疾患の原因遺伝子の同定 薬の種リード化合物の選択 医薬品最適化 & 臨床試験

創薬におけるインフォマティクス ゲノム情報 ゲノム基盤ターゲット研究探索 ターゲット バリデーション 創薬リード探索 創薬リード最適化 前臨床研究臨床研究 創薬 ゲノム情報 (~2 万 2 千遺伝子 ) バイオインフォマティクス 化合物ライブラリー (10^60 化合物 ) ケモインフォマティクス ケミカルゲノミクス 疾患の新しいインフォマティクス薬の種原因遺伝子の同定リード化合物の選択 医薬品最適化 & 臨床試験

ちょっと復習

多変量解析 : クラスター解析 例えば 5 科目のテスト結果から 能力別 ( 理系 文系 優秀など ) にクラス分けを行いたい場合 どうすれば良いのか? 国語社会数学理科英語 a 29 33 55 79 74 b 71 68 72 64 97 c 74 91 79 76 100 d 52 56 58 60 85 e 77 92 96 88 98 人間的に a~eさんの点数のパターンを眺める数学的に a~eさんの変数をベクトル表現する パターンが似ている者どうしを同じグループにする 似ているか似ていないかを距離という尺度で定義する

ベクトル表現から類似度定義 a~e さんの変数をベクトル表現する V r a b 似ているか似ていないかを距離という尺度で定義する = (29, 33, 55, 79, 74) V r = (71, 68, 72, 64, 97) ユークリッド距離で表現する ( 似ているものは距離が小さい ) V r c = (74, 91, 79, 76, 100) r r 2 D = ( Va Vb) 簡単のため 2 次元の場合 今の場合 5 次元になる Va=(x1, y1) D = 2 ( x1 x2) + ( y1 y 2) 2 Dab = Dac = Dbc = (29 71).... 2 + (33 68) 2 +... + (74 97) 2 Vb=(x2, y2)

距離行列 ( 類似度行列 ) a b c d e a 0 63 81 39 90 a, e 間の距離 b 63 0 27 29 42 c 81 27 0 51 21 d 39 29 51 0 65 e 90 42 21 65 0 最も距離が近いものを一つにグループにまとめ 距離行列を作り直す Single linkage clustering 小さい方を代表値にして a b d c, e a 0 63 39 81 b 63 0 29 27 d 39 29 0 51 c,e 81 27 51 0 Complete linkage clustering 大きい方を代表値にして a b d c, e a 0 63 39 90 b 63 0 29 42 d 39 29 0 65 c,e 90 42 65 0

階層型クラスタリング 距離の近いものから グルーピングしていく c a 距離 D2 b d 距離 D1 クラスター表記 : 系統樹 e g h f D1 D2 g h f a b c d e 簡単にするため 2 次元で表現している

創薬におけるインフォマティクス ゲノム情報 ゲノム基盤ターゲット研究探索 ターゲット バリデーション 創薬リード探索 創薬リード最適化 前臨床研究臨床研究 創薬 ゲノム情報 (~2 万 2 千遺伝子 ) バイオインフォマティクス 化合物ライブラリー (10^60 化合物 ) ケモインフォマティクス ケミカルゲノミクス 疾患の新しいインフォマティクス薬の種原因遺伝子の同定リード化合物の選択 医薬品最適化 & 臨床試験

バイオインフォマティクス 配列解析 Sequences information Similarity matrix Fasta format Alignment (ex. Blast ) Classification Biological Space

ケモインフォマティクス 構造解析 Structure OC(=O)C(N)CC1=CC=C(O)C=C1 5 4 0 0 0 999 V2000-0.1276 0.2621 0.0000 C 0 0 0 0 0 0 0.5552-0.1862 0.0000 C 0 0 0 0 0 0-0.8552-0.1483 0.0000 O 0 0 0 0 0 0-0.1552 1.0931 0.0000 O 0 0 0 0 0 0 0.5793-1.0207 0.0000 N 0 0 0 0 0 0 1 2 1 0 0 0 1 3 1 0 0 0 1 4 2 0 0 0 2 5 1 0 0 0 M END Distance matrix Classification Structure comparison OH O O O NH NH O O NH 2 OH Chemical Space

ケミカルゲノミクスとインフォマティクス Database Chemical Database Chemoinformatics Computational Exploration of Search Space Chemical space Knowledge extraction Lead discovery Activity prediction.. Analogy Chemical Genomics Statistical Model Biological Database Bioinformatics Biological space Gene finding Functional annotation.. New Informatics For Chemical Genomics

In silico スクリーニング Query compound (Chemical structure) Prediction of Lead Compounds Chemical space Biological space Query gene (protein) (sequence structure) Prediction of Target Genes

GLIDA: GPCR-Ligand Database http://pharminfo.pharm.kyoto-u.ac.jp/services/glida Nucleic Acids Research, 2006 Database issue, D673-677

Motivation (Why GPCRs?) リガンド 医薬品の約 50% が GPCR を標的としている H2N COOH GPCR G タンパク質 ヒトでは約 1000 の GPCR が予測されており 約 700 がリガンド未知のオーファン GPCR GPCR とリガンドとの相互作用研究は 創薬において非常に重要 細胞内シグナル伝達 公共の GPCR- リガンド相互作用データベースの開発 ケモゲノミクスデータのマイニング手法 (In silico screeing 手法 ) の開発

GPCR とリガンドの相互作用情報

GPCR/ リガンドのクラスタリング O O NH NH O O O OH NH 2 Chemical structures OH GPCR sequence Mol files Profiles based on KEGG atom types Similarity matrix Profiles based on (k,m)-spectrum method Similarity matrix Classification with tree representation

例 ) リガンド分類

GPCR-Ligand Space of GLIDA Hierarchal Clustering by Structure similarity Y Chemical space Ligands Correlation map Ligand Y X Biological space GPCR X GPCR Hierarchal Clustering by Sequence homology

In silico Screening by GLIDA Query compound Correlation map Chemical space Tree Biological space Hit GPCRs

In silico Screening by GLIDA Correlation map Chemical space Hit Ligands Biological space Query GPCR

Execution of GLIDA (From From a query GPCR to target Ligands) Click here to begin GPCR search

Keyword search of GPCR Input a keyword and enter * Examples of search HTR1A, DRD2_HUMAN(gene names), P14416 (Swiss-Prot ID), Angiotensin (GPCRDB Family names), oncogene, smell, hormone (gene ontology term or SwissProt functional annotation)

Result of keyword search Click here to view its result page Result page of ADA1A_HUMAN

Similarity search & binding prediction Click here to start calculation Analytical report page Information of the ligand of the GPCR GPCR-ligand correlation map Similar entries list

Result of Similarity search Linked to their result pages The top 25 GPCRs which are most similar to the selected GPCR (i.e.,ada1a_human in this example) are displayed in this report page

Result of binding prediction: GPCR-Ligand correlation map The clustering tree of the top 25 GPCRs that are similar to ADA1A_HUMAN in sequence The clustering tree of the corresponding ligands of the 25 GPCRs, calculated based on their structure similarity. First Candidates of Binding Ligands ADA1A_HUMAN

機械学習による タンパク質 化合物相互作用予測 化合物 タンパク質 O O NH NH O O OH NH 2 O OH.mol >gene1.mol MSGGAC LAAVCL 既知のタンパク質 化合物ペアを利用 タンパク配列情報と化学構造から相互作用パターンの自動の自動学習 未知ペアの相互作用の予測へ?

相互作用マシンラーニング法 ケミカルゲノミクス情報 相互作用ルールに最も近い化合物を算出 既知の相互作用パターン ( 多対多 ) 相互作用パターンの統計的ルール化 ( 機械学習 ) 予測 標的タンパク質 立体構造モデルが不要 標的タンパク質の立体構造は不要 ( 膜タンパクの場合 一次配列のみでの高精度予測が検証済み ) 相互作用関係を優先し 化学構造の自由度を許容するため 新規骨格の発見の可能性が高い 計算時間が短時間で済み 計算コストが非常に良い

相互作用マシンラーニング法による β2-アドレナリン受容体リガンド予測の結果 843 種類の化合物との相互作用の有無を予測 予測スコア Top50 の化合物 入手不可 (15) 文献調査で判明した β 2 リガンド (14) 入手可能 (21) Non-Hit (4) Hit (17) [125I]CYP bound (%) 100 In vitro 結合阻害実験 80 60 40 20 0-7 -6-5 -4-3 -2 log[concentration(m)] ヒット率 : 81.0% (17/21) トータルヒット率 ( 実験 + 文献調査 ) : 89 % (31/35)

相互作用マシンラーニング法の予測実績 日刊工業新聞 2007.3.26 1. 他の GPCR (10μM オーダー化合物がヒット ) 2. TRP タンパク ( ナノモルオーダー化合物 (1000 倍の活性 ) がヒット ) 3. マラリア標的ピリミジン合成酵素 (10% のヒット率 )

ゲノム情報 Kyoto-Univ Pharmaco-Informatics Navigation System ゲノム基盤ターゲット研究探索 ターゲット バリデーション 創薬リード探索 創薬リード最適化 前臨床研究臨床研究 Genome Proteome Chemicals Clinical information 創薬 Genome Network DB Chemical Genome DB GPCR-Ligand DB 特願 2006-147433 国際出願番号 PCT/JP2006/312858 Zhu, S., Okuno, Y., et al., Bioinformatics, 21(s2), ii245-ii251, 2005 Okuno, Y. et al., Nucleic Acids Research, Database issue, D673-677 2006

統合薬学フロンティア教育センター 統合薬学教育開発分野 Department of PharmacoInformatics http://pharminfo.pharm.kyoto-u.ac.jp/ ( メリット ) 世界一戦級の研究ができる 計算に強くなる ( とりあえず 賢くみえる ) 実験が肌に会わない人に最適 生き物の命を大切にする人に最適 常に人材不足であり 世界をリードする人材となれる 私の指導が受けられる ( デメリット ) 特にないと思いますが 本格的な Wet 実験が出来ない デスクワークが続き不健康気味 秋葉系に間違えられる可能性があるかも