共起関係解析によるタンパク質の機能モジュール探索法の開発

Similar documents
共起関係解析によるタンパク質の機能モジュール探索法の開発

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

研究成果報告書

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

CourseDescriptions_

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

生命情報学

NL11

untitled

コンピュータ応用・演習 情報処理システム

次世代シークエンサーを用いたがんクリニカルシークエンス解析

1_alignment.ppt

ChIP-seq

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

bioinfo ppt

KASEAA 52(1) (2014)

データ科学2.pptx

生物物理夏学・計算ハンズオン.docx

1 研究開発のねらい 糖鎖は 細胞表面のタンパク質や脂質に結合し 血液型の決定 細胞接着 抗原抗体反応 ウイルス感染などの生体反応で重要な役割を果たす生体分子である 糖鎖による多様な生物学的機能のうち 糖鎖結合タンパク質による糖鎖の特異的認識があり 糖鎖 - タンパク質間の相互作用の解析に糖鎖アレイ

KEGG.ppt

第2章 生物有機化学実験及び実験法

5_motif 公開版.ppt

の活性化が背景となるヒト悪性腫瘍の治療薬開発につながる 図4 研究である 研究内容 私たちは図3に示すようなyeast two hybrid 法を用いて AKT分子に結合する細胞内分子のスクリーニングを行った この結果 これまで機能の分からなかったプロトオンコジン TCL1がAKTと結合し多量体を形

Microsoft PowerPoint - T07 豊田先生.pptx

論文の内容の要旨

<4D F736F F D B82C982C282A282C482512E646F63>

Microsoft Word J.^...O.|Word.i10...j.doc


<4D F736F F D E95F14E565F838C D955F907D90E096BE5F8F4390B394C5816A2E646F63>

取扱説明書 [F-05E]

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

中期目標期間の業務実績報告書

NGSデータ解析入門Webセミナー

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

全地連"次世代CALS"対応研究会 報告書

1. 背景血小板上の受容体 CLEC-2 と ある種のがん細胞の表面に発現するタンパク質 ポドプラニン やマムシ毒 ロドサイチン が結合すると 血小板が活性化され 血液が凝固します ( 図 1) ポドプラニンは O- 結合型糖鎖が結合した糖タンパク質であり CLEC-2 受容体との結合にはその糖鎖が

PDB の 新 フォーマット 金城玲 日本蛋白質構造データバンク (PDBj) 大阪大学蛋白質研究所 1

Microsoft Word - 実習テキスト.doc

Microsoft Word - ランチョンプレゼンテーション詳細.doc

yakugaku-kot.ppt


人工知能補足_池村

計算機生命科学の基礎II_

目次 I. 孤立系 ( 気相 ) II. 単成分液体 III. 混合液体 1 希薄水溶液 2 任意の濃度の溶液 IV. タンパク質 1 リガンドなし 2 リガンドあり V. ポリマー VI. 固液界面補足 Acpypeによる電荷の割り当て補足 RESP 電荷の割り当て 2017/10/01 Copy

Microsoft Word - 博士論文概要.docx

< 提供を開始するソリューション例 > Scorpion Scorpion は DesertSci 社がスイス Roche 社との共同研究に基づいて開発したものです Scorpion で用いられるネットワーク モデルは 分子間相互作用をネットワークとして記述し タンパク質 リガンド相互作用が周りの環

2008 年度下期未踏 IT 人材発掘 育成事業採択案件評価書 1. 担当 PM 田中二郎 PM ( 筑波大学大学院システム情報工学研究科教授 ) 2. 採択者氏名チーフクリエータ : 矢口裕明 ( 東京大学大学院情報理工学系研究科創造情報学専攻博士課程三年次学生 ) コクリエータ : なし 3.

第2章 生物有機化学実験及び実験法

PowerPoint Presentation

スライド 1

P P P P P P P P P P P P P

大規模災害時における、DNSサービスの継続性確保のために

[ 演習 3-6AA] ウェブページの検索結果の表示順序 ( 重要 ) 10D H 坂田侑亮 10D F 岩附彰人 10D D 財津宏明 1.1 ページランクとは ページランクとは グーグルが開発した検索エンジンのウェブページの重要度を判定する技術である サーチエ

KEGG_PATHWAY.ppt

Untitled


ナノの技術をバイオに応用

バイオインフォマティクスⅠ

indd

核内受容体遺伝子の分子生物学

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

040402.ユニットテスト

スライド 1

nagasaki_GMT2015_key09

untitled

ネットショップ・オーナー2 ユーザーマニュアル

/9/ ) 1) 1 2 2) 4) ) ) 2x + y 42x + y + 1) 4) : 6 = x 5) : x 2) x ) x 2 8x + 10 = 0

EPSON エプソンプリンタ共通 取扱説明書 ネットワーク編

ありがとうございました

EPSON エプソンプリンタ共通 取扱説明書 ネットワーク編

公務員人件費のシミュレーション分析


橡hashik-f.PDF

198


1

新婚世帯家賃あらまし

05[ ]戸田(責)村.indd

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

PowerPoint プレゼンテーション

Biotinylated Kinases BTNABL(ABL1) Tyrosineprotein kinase ABL1 Biotinylated N 2 Nterminal DYKDDDDK カルタヘナ 80 BTNACTR2B(ACVR2B) Activin r

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft Word - K-ピタゴラス数.doc

参考1 第2回自動車ワーキンググループ議事録(未定稿)

PowerPoint プレゼンテーション

Taro13-第6章(まとめ).PDF


GWB

人芯経営論 ・・・リーダーシップ考②

平成13年度 地域工業活性化支援事業報告書(多摩全域)

はたらく若者ハンドブック


本文/扉1

プログラム


Transcription:

2014.03.02 統合化推進プログラム統合データ解析トライアル研究成果報告会 共起関係解析によるタンパク質の機能モジュール探索法の開発 九州工業大学 情報工 生命情報 藤井聡 2014 藤井聡 ( 九州工業大学 )licensed under CC 表示 2.1 日本 1

背景 疾病関連遺伝子 ドメイン モチーフ ドラッグターゲット T/G Gefitinib LUNG CANCER OMIM NHGRI GWAS Catalog Human Variation DB etc... PROSITE Pfam InterPro CATH SCOP etc.. EGFR CYP2D6 ABCG2 DrugBank PubChem KEGG DRUG etc.. etc.. 2

EGFR tyrosine kinase domain の結晶構造 LEU858ARG, NONSMALL CELL LUNG CANCER (OMIM) 機能モジュール : 3 次元構造中で近傍に存在しており関係性が高い PS00107 : PROTEIN_KINASE_ATP (PROSITE) PS00109: PROTEIN_KINASE_TYR (PROSITE) 3

目的 非常に多くのゲノム プロテオームに関する情報の集積体 ( データベース ) が構築されている 疾病関連遺伝子やタンパク質の機能を示すドメインやモチーフ 薬剤などの相互作用部位を現すリガンド相互作用サイト タンパク質 - タンパク質相互作用サイトなどが挙げられる しかし 単独では価値を理解することが難しいものも多い 疾病情報やドメインなどの機能情報同士の間に浮かび上がる共起関係に注目し 構造と機能の有機的な結び付きを現す機能モジュールを探索する手法を開発することを目的とする 4

方法 研究項目として 検出するターゲットは PROSITE, Pfam から得ることのできる機能ドメインと機能モチーフに対象を絞る 共起関係は 1 対 1 の関係に絞って解析手法を確立を目指す 1. データの取得と生成 データの整形 2. 共起関係の解析手法の確立 3. データベース作成ならび検索サイトの作成 最終的にその得られた共起関係のリストを 空間的な距離やその出現数 統計的な有意性を含めてデータベースとして公開するまでを第 1 目標とする 5

データの取得と生成 データの整形 タンパク質の3 次元構造データ PDBjより全 PDB 構造を取得した ドメイン モチーフの情報 タンパク質に存在するドメイン モチーフの情報はPROSITEから得た 元々価値の高いドメインやファミリー同士の共起関係だけでなく 情報として価値の低い機能サイトとの共起関係についてなども同時に検証することを想定してPROSITEを最初のターゲットにした ドメイン モチーフの位置は 配列に対してPROSITEのps_scanにより配列に対して予測計算を行い求めた タンパク質構造の冗長化 タンパク質構造情報の冗長化はEMBL-EBI/SIFTSを利用して行ってた タンパク質の構造は同じタンパク質から複数得られていたり タンパク質の一部分のみの構造が得られていたりしているので冗長化を行う必要がある 6

共起関係の検出 1 タンパク質構造中で近傍に存在する共起関係の検出 2 タンパク質全体で高頻度に見られる共起関係の検出 EGFR FYN NTRK1 3 1+2 両方の条件に合致する共起関係の検出 7

結果 : 2 つのモチーフ同士の距離 Uniprot.ID_A Prosite_A Start_A End_A Uniprot.ID_B Prosite_B Start_B End_B N_pdb Cα.distance (min) (ave.) (s.d.) O87988 PS00005 66 68 O87988 PS00006 211 214 12 15.91 34.11 18.88 P16932 PS00008 143 148 P16932 PS00009 152 155 16 7.15 7.6 0.24 P96110 PS00005 189 191 P96110 PS00008 192 197 108 3.77 49.43 25.95 O66608 PS00006 266 269 O66608 PS00009 17 20 4 7.94 11.41 3.94 D2YW38 PS00005 73 75 D2YW38 PS00008 90 95 3 7.55 7.61 0.06 P24183 PS00006 63 66 P24183 PS00008 67 72 2 3.79 3.82 0.03 Q9XG81 PS00008 64 69 Q9XG81 PS00118 82 89 17 6.94 14.86 11.03 Prosite モチーフ数 : 2,006 総 PDBchain 数 : 221,581 総タンパク質数 : 32,042 モチーフ Hit 数 : 3,163,170 1,116,766 モチーフ組み合わせ数 : 164,122,109 7,945,374 8

モチーフ間の Cα 最短距離の分布 9

共起関係の検出法 ~Intra-molecule~ PDB 構造が存在する全タンパク質数 (T A,B ) モチーフ A とモチーフ B が両方存在するタンパク質数 (N A,B ) モチーフ A が存在するタンパク質数 (N A ) モチーフ B が存在するタンパク質数 (N B )

共起関係の検出法 ~Inter-molecule~ PDB 構造中に存在する全タンパク質ペア数 (T A,B ) タンパク質ペアについて Protein_B モチーフ A とモチーフ B がそれぞれのタンパク質に存在するタンパク質ペア数 (N A,B ) Protein_A 一方のタンパク質にモチーフ A が存在するタンパク質ペア数 (N A ) 一方のタンパク質にモチーフ B が存在するタンパク質ペア数 (N B ) Protein Pair: Protein_A - Protein_A Protein_B - Protein_B Protein_A - Protein_B

結果 : 共起関係の Enrichment Motif_combination N A,B N A N B T A,B FE p-value FDR PS00029_PS01281 1 676 5 32042 9.48 0.00426 0.007658 PS00008_PS01201 3 24311 3 32042 1.32 0 0 PS00004_PS00433 6 7689 9 32042 2.78 0.001029 0.001979 PS00006_PS01132 23 26003 23 32042 1.23 0 0 PS00006_PS50995 37 26003 39 32042 1.17 0.002908 0.005322 PS00370_PS00742 5 6 7 32042 3814.52 0 0 PS00004_PS00975 3 7689 6 32042 2.084 0.032538 0.05088 PS00008_PS00128 16 24311 24 32042 0.88 0.796727 0.850721 PS00006_PS01028 4 26003 4 32042 1.23 0 0 *p-value は超幾何分布により算出 FDR < 0.05: 11,885 entries N A,B P(X = k) = 1 k N B k T A,B N B N A k T A,B N A FDR は BH 法により計算 12

距離と共起の Enrichment 両方での絞り込み 含まれているモチーフ同士の Cα 最短距離が 3.5-6.0 Å 内にある 共起の Enrichment における有意性が FDR< 0.05 である 距離によって共起が検出されたタンパク質数 0.8 Enrichmentのよって共起が検出されたタンパク質数 13

PDBnet -Co-occurrence Search Tool- http://dna00.bio.kyutech.ac.jp/pdbnet/co-search.php 共起に関する条件を入力すると その条件で絞った PROSITE モチーフの共起リストを表示する 共起のリストから 各々の共起を持つタンパク質 さらにPDB 構造までリンクで追うことができる Jmolにより構造上の共起関係を確認することも可能 現状は 上記のような一方向の検索しかできない タンパク質名やモチーフの名前等から検索はできない 将来的にはPDBnetからこれらの情報へアクセスできるようにする予定である

Web ツールデモ 15

実例 : PS00107_PS01351 の共起関係 PDBID:3HF6 (human tryptophan hydroxylase type 1 ) 16

実例 : PS00107_PS01351 の共起関係 PDBID:3HF6 (human tryptophan hydroxylase type 1 ) 17

実例 : PS00017_PS00152 の共起関係 PDBID:3HF6 (human tryptophan hydroxylase type 1 ) 18

実例 : PS00017_PS00152 の共起関係 PDBID:3HF6 (human tryptophan hydroxylase type 1 ) 19

デモ終了 20

本ツールの汎用性について 現状では PROSITE にしか対応していないのでまだ汎用性は低い 共起を検出する手法としては単純なので 将来的には 原子単位 アミノ酸配列単位で付加されている情報に対しても適用できるだろう これまで作られてきた統合データベースの新たな活用法について 今回はタンパク質構造 (PDB) を情報を結びつけるための媒体として活用した それにより 情報を 3 次元の構造中に表すことにより有機的に結び付けることができた 21

本ツールを活用した有用な知識の発見について 客観的な評価指標を示せていないので評価するのは難しいが いくつか具体的な例を観察すると 活性部位付近に共起関係が存在するような 抽出されてくるべき結果は抽出できていた 今後 機能未知なタンパク質 領域等を実際に検証することで有用な知見の発見につながる可能性もあるだろう 今後の本研究の将来性 空間における集積性を調べる空間統計学により評価したり 物理化学で扱われる PMF(Potential Mean Force) により評価したりすれば タンパク質の立体構造を更に生かした結果を導き出せるだろう タンパク質構造を使って任意の情報を結びつける手法の 1 つのスタンダードとしたい 22

まとめ ほぼ当初の研究開発計画通りに進行した PROSITEに対する共起関係の検出を行い 得られた共起関係のリストをデータベースとして公開した 発展的な展開としては 2つのタンパク質の相互作用による共起関係の検出には対応した 今回の結果についての客観的な評価を示せていないが 主観的な観察によっては尤もらしい結果は得られていた 今後汎用化 共起検出の統計手法の改良によって 更に有用な手法となるだろう 23

実例 : PS00029_PS00367 の共起関係 PS00367: (A: 268-279) Biopterin-dependent aromatic amino acid hydroxylases signature P17752 P04177 P70080 Tryptophan 5-hydroxylase 1 (Human) 3hf6A 1mlwA 3hf8A 3hfbA Tyrosine 3-monooxygenase (Rat) 1tohA 2tohA Tryptophan 5-hydroxylase 1 (Chicken) 3e2tA PS00029: (A: 320-341) Leucine zipper pattern PDBID:3HF6 (human tryptophan hydroxylase type 1 ) 24

実例 : PS00286_PS00135 の共起関係 PS00286: (I: 503-522) Squash family of serine protease inhibitors signature PS00135: (E: 189-200) Serine proteases, trypsin family, serine active site P01074 2staI P35031 2staE P01074 1ppeI P00760 1ppeE P10293 2btcI P00760 2btcE P12071 1h9iI P00761 1h9iE P10295 1f2sI P00760 1f2sE P10293 2stbI P35031 2stbE P30709 1mctI P00761 1mctA PDBID:2STA(SALMON TRYPSIN IN COMPLEX WITH SQUASH SEED INHIBITOR) 25

共起関係のデータベースにアクセスする検索ページ 期待値より何倍 Enrich しているか 共起の Enrichment における FDR 共起のあるタンパク質の最低数 共起を定義するモチーフ同士の Cα 距離 距離によって共起がみつかったタンパク質数 /Enrichment のよって共起が見つかったタンパク質数 Intra-molecular: タンパク質内における共起のみ Inter-molecular: タンパク質間相互作用も含める

共起関係の検索結果表示のページ N AB : 共起のあるタンパク質の数 N Dist : 距離によって共起がみつかったタンパク質数 N Inter : タンパク質間相互作用によって共起が見つかったタンパク質数 それぞれの共起を持つタンパク質のリストへ

あるモチーフの共起関係を持つタンパク質のリスト それぞれのタンパク質に存在する PDB 構造のリストへ

あるモチーフの共起関係を持つある 1 つのタンパク質についての PDB 構造のリスト 共起しているそれぞれの motif それぞれに色を付けて表現している Jmol を使って分子構造を見る