プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

Similar documents
研究成果報告書

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

KEGG.ppt

KEGG_PATHWAY.ppt

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

核内受容体遺伝子の分子生物学

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

Untitled

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

nagasaki_GMT2015_key09

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

GWB

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

1. 背景 NAFLD は非飲酒者 ( エタノール換算で男性一日 30g 女性で 20g 以下 ) で肝炎ウイルス感染など他の要因がなく 肝臓に脂肪が蓄積する病気の総称であり 国内に約 1,000~1,500 万人の患者が存在すると推定されています NAFLD には良性の経過をたどる単純性脂肪肝と

NGSデータ解析入門Webセミナー

Slide 1

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン


GWB

スライド 1

Microsoft PowerPoint - T07 豊田先生.pptx

1. 背景血小板上の受容体 CLEC-2 と ある種のがん細胞の表面に発現するタンパク質 ポドプラニン やマムシ毒 ロドサイチン が結合すると 血小板が活性化され 血液が凝固します ( 図 1) ポドプラニンは O- 結合型糖鎖が結合した糖タンパク質であり CLEC-2 受容体との結合にはその糖鎖が

PrimerArray® Analysis Tool Ver.2.2

AJACS_komachi.key

く 細胞傷害活性の無い CD4 + ヘルパー T 細胞が必須と判明した 吉田らは 1988 年 C57BL/6 マウスが腹腔内に移植した BALB/c マウス由来の Meth A 腫瘍細胞 (CTL 耐性細胞株 ) を拒絶すること 1991 年 同種異系移植によって誘導されるマクロファージ (AIM

結果 この CRE サイトには転写因子 c-jun, ATF2 が結合することが明らかになった また これら の転写因子は炎症性サイトカイン TNFα で刺激したヒト正常肝細胞でも活性化し YTHDC2 の転写 に寄与していることが示唆された ( 参考論文 (A), 1; Tanabe et al.

7-1(DNA配列から遺伝子を探す).ppt

図 1 マイクロ RNA の標的遺伝 への結合の仕 antimir はマイクロ RNA に対するデコイ! antimirとは マイクロRNAと相補的なオリゴヌクレオチドである マイクロRNAに対するデコイとして働くことにより 標的遺伝 とマイクロRNAの結合を競合的に阻害する このためには 標的遺伝

大学院博士課程共通科目ベーシックプログラム

東邦大学学術リポジトリ タイトル別タイトル作成者 ( 著者 ) 公開者 Epstein Barr virus infection and var 1 in synovial tissues of rheumatoid 関節リウマチ滑膜組織における Epstein Barr ウイルス感染症と Epst

成果 本研究の解析で着目したのは 25 の遺伝性疾患とそれらの 57 の原因遺伝子で これらは ACMG が推奨する 偶発的 二次的所見としての遺伝情報の結果の返却を推奨する遺伝子のセットのうち常染色体上のものに相当し 大部分が遺伝性腫瘍や遺伝性循環器疾患の原因遺伝子です 本研究では 当機構で作成し

研究から医療へ より医療への実利用が近いもの ゲノム医療研究推進ワーキンググループ報告書 (AMED) 臨床ゲノム情報統合データベース公募 対象疾患の考え方の方向性 第 1 グループ ( 主に を目指す ) 医療への実利用が近い疾患 領域の着実な推進 単一遺伝子疾患 希少疾患 難病 ( 生殖細胞系列

バイオインフォマティクスⅠ

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

平成17年度研究報告

PowerPoint プレゼンテーション

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

Qlucore_seminar_slide_180604

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

H27_大和証券_研究業績_C本文_p indd

エネルギー代謝に関する調査研究

PowerPoint プレゼンテーション

平成14年度研究報告

PowerPoint プレゼンテーション

次世代シークエンサーを用いたがんクリニカルシークエンス解析

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

<4D F736F F D20819B8CA48B868C7689E68F D A8CA9967B5F E646F63>

PowerPoint プレゼンテーション

Microsoft PowerPoint

前立腺癌は男性特有の癌で 米国においては癌死亡者数の第 2 位 ( 約 20%) を占めてい ます 日本でも前立腺癌の罹患率 死亡者数は急激に上昇しており 現在は重篤な男性悪性腫瘍疾患の1つとなって図 1 います 図 1 初期段階の前立腺癌は男性ホルモン ( アンドロゲン ) に反応し増殖します そ

[Business Communication]

本成果は 以下の研究助成金によって得られました JSPS 科研費 ( 井上由紀子 ) JSPS 科研費 , 16H06528( 井上高良 ) 精神 神経疾患研究開発費 24-12, 26-9, 27-

スライド 1

研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2


共起関係解析によるタンパク質の機能モジュール探索法の開発

ゲートウェイのファイル形式

Microsoft PowerPoint - matsuda-web.pptx

報道発表資料 2006 年 4 月 13 日 独立行政法人理化学研究所 抗ウイルス免疫発動機構の解明 - 免疫 アレルギー制御のための新たな標的分子を発見 - ポイント 異物センサー TLR のシグナル伝達機構を解析 インターフェロン産生に必須な分子 IKK アルファ を発見 免疫 アレルギーの有効

Untitled

検体採取 患者の検査前準備 検体採取のタイミング 記号 添加物 ( キャップ色等 ) 採取材料 採取量 測定材料 P EDTA-2Na( 薄紫 ) 血液 7 ml RNA 検体ラベル ( 単項目オーダー時 ) ホンハ ンテスト 注 外 N60 氷 MINテイリョウ. 採取容器について 0

<4D F736F F D2088EA89B9918A88E181458C8B8D878FA E E838A C E646F6378>

インドネシアにおける意匠を対象にした無効資料調査 Q 自社製品に近いインドネシア意匠を発見した この意匠を回避す ることも選択肢ではあるが できれば無効化したい 1) 調査ツールの選択インドネシアにおける意匠は インドネシア知的財産総局 ( 以下 DGIP) が提供する e-sta


学位論文の内容の要旨 論文提出者氏名 小川憲人 論文審査担当者 主査田中真二 副査北川昌伸 渡邉守 論文題目 Clinical significance of platelet derived growth factor -C and -D in gastric cancer ( 論文内容の要旨 )

Untitled


統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

GWB

60 秒でわかるプレスリリース 2008 年 5 月 2 日 独立行政法人理化学研究所 椎間板ヘルニアの新たな原因遺伝子 THBS2 と MMP9 を発見 - 腰痛 坐骨神経痛の病因解明に向けての新たな一歩 - 骨 関節の疾患の中で最も発症頻度が高く 生涯罹患率が 80% にも達する 椎間板ヘルニア

るが AML 細胞における Notch シグナルの正確な役割はまだわかっていない mtor シグナル伝達系も白血病細胞の増殖に関与しており Palomero らのグループが Notch と mtor のクロストークについて報告している その報告によると 活性型 Notch が HES1 の発現を誘導

報道発表資料 2006 年 8 月 7 日 独立行政法人理化学研究所 国立大学法人大阪大学 栄養素 亜鉛 は免疫のシグナル - 免疫系の活性化に細胞内亜鉛濃度が関与 - ポイント 亜鉛が免疫応答を制御 亜鉛がシグナル伝達分子として作用する 免疫の新領域を開拓独立行政法人理化学研究所 ( 野依良治理事

大学院博士課程共通科目ベーシックプログラム

機能ゲノム学(第6回)

【藤田】統合失調症リリース 1001_理研修正181002_理研2

図 B 細胞受容体を介した NF-κB 活性化モデル

インドネシアにおける意匠を対象にした出願前調査 Q 自社製品の意匠権をインドネシアで取得したい 出願する前にや っておいた方が良いことはあるか? 1) 調査ツールの選択インドネシアにおける意匠は インドネシア知的財産総局 ( 以下 DGIP) が提供する e-status Kekay

統合失調症モデルマウスを用いた解析で新たな統合失調症病態シグナルを同定-統合失調症における新たな予防法・治療法開発への手がかり-

Microsoft Word - Gateway technology_J1.doc

ThermoFisher

機能ゲノム学(第6回)

4. 発表内容 : [ 研究の背景 ] 1 型糖尿病 ( 注 1) は 主に 免疫系の細胞 (T 細胞 ) が膵臓の β 細胞 ( インスリンを産生する細胞 ) に対して免疫応答を起こすことによって発症します 特定の HLA 遺伝子型を持つと 1 型糖尿病の発症率が高くなることが 日本人 欧米人 ア

分子系統解析における様々な問題について 田辺晶史

Microsoft Word - 【広報課確認】 _プレス原稿(最終版)_東大医科研 河岡先生_miClear

の活性化が背景となるヒト悪性腫瘍の治療薬開発につながる 図4 研究である 研究内容 私たちは図3に示すようなyeast two hybrid 法を用いて AKT分子に結合する細胞内分子のスクリーニングを行った この結果 これまで機能の分からなかったプロトオンコジン TCL1がAKTと結合し多量体を形

DNAFORM Clone Search Engine ユーザーズガイド

汎発性膿庖性乾癬の解明

ヒト脂肪組織由来幹細胞における外因性脂肪酸結合タンパク (FABP)4 FABP 5 の影響 糖尿病 肥満の病態解明と脂肪幹細胞再生治療への可能性 ポイント 脂肪幹細胞の脂肪分化誘導に伴い FABP4( 脂肪細胞型 ) FABP5( 表皮型 ) が発現亢進し 分泌されることを確認しました トランスク

計算機生命科学の基礎II_

ノム解析が実施された場合に偶発的 二次的所見としての遺伝情報を知ることが患者にとって有意義としている遺伝性疾患の原因遺伝子です 具体的には 現在示されている 26 疾患 (59 遺伝子 ) のうちから 常染色体上に存在する 57 遺伝子 (25 疾患 ) を本研究の解析対象としました 2KJPN の

<4D F736F F D F4390B38CE3816A90528DB88C8B89CA2E646F63>

2017 年 12 月 15 日 報道機関各位 国立大学法人東北大学大学院医学系研究科国立大学法人九州大学生体防御医学研究所国立研究開発法人日本医療研究開発機構 ヒト胎盤幹細胞の樹立に世界で初めて成功 - 生殖医療 再生医療への貢献が期待 - 研究のポイント 注 胎盤幹細胞 (TS 細胞 ) 1 は

平成16年7月2日

2. 手法まず Cre 組換え酵素 ( ファージ 2 由来の遺伝子組換え酵素 ) を Emx1 という大脳皮質特異的な遺伝子のプロモーター 3 の制御下に発現させることのできる遺伝子操作マウス (Cre マウス ) を作製しました 詳細な解析により このマウスは 大脳皮質の興奮性神経特異的に 2 個

機能的ゲノミックスに向けた新たなアプローチ ブルースブルンバーグ 米国カリフォルニア大学アーバイン校 菅野先生 御紹介ありがとうございます 私はこの会合へご招待くださった主催者 ならびに特に菅野先生と井上先生に感謝の意を表したいと思います 本日お話するのは 私の研究室で取り組んでいる比較的新しい方法

GWB_RNA-Seq_

Transcription:

個別要素技術 2 疾患との関連情報の抽出 予測のための 技術開発 平成 20 年 11 月 18 日産業技術総合研究所バイオメディシナル情報研究センター分子システム情報統合チーム 今西規

1 個別要素技術 2 課題一覧 1 大量文献からの自動知識抽出と文献からの既知疾患原因遺伝子情報の網羅的収集 2 疾患遺伝子情報整備と新規疾患遺伝子候補の予測 3 遺伝子多型情報整備

1 大量文献からの自動知識抽出と 文献からの既知疾患原因遺伝子情報 の網羅的収集 2 目標 疾患との関連情報をヒト全遺伝子データベースへ格納して公開する 6 種類の疾患に対し 疾患遺伝子予測プログラムにより新規の疾患遺伝子候補の絞込みを行い 疾患との関連情報を合計で 6 万件以上 その内 新規の情報については 600 件以上の情報を格納する 主な成果 [ 目標達成 ] 文献データベース PubMed からのテキストマイニング 基づくデータベース LEGENDA では 疾患名と遺伝子名の共起する文献情報を 612 万件登録し 公開した

1 文献からの 遺伝子 - 疾患関係 (Disease-Gene Association: DGA) 情報の抽出とデータベース構築 機械学習によるテキストマイニングを使って医学文献情報 (PubMED) からの DGA 情報の抽出とデータベース化を行った これにより OMIM 等の既存データベースを超える網羅性を持つ疾患遺伝子データベースを構築し LEGENDA (Literature-Extracted GENe-Disease Association) データベースとして公開した 3

1 4 LEGENDA の提供する 共起 情報 文献数 :1,538,757 共起数 :6,122,502 遺伝子数グループ :11,498 表現 :28,941 疾患数グループ :24,667 表現 :43,138 疾患 遺伝子 共起共起共起 物質 文献数 :2,183,933 共起数 :17,114,343 遺伝子数グループ :13,387 表現 :38,161 物質数グループ :51,591 表現 :72,002 文献数 :5,136,461 共起数 :27,011,606 疾患数グループ :33,931 表現 :61,847 物質数グループ :69,184 表現 :94,832 情報量を用いたスコアによる評価とともに 間接共起 ( 予測 ) の情報も公開を開始した

2 疾患遺伝子情報整備と新規疾患遺 伝子候補の予測 5 目標 疾患との関連情報をヒト全遺伝子データベースへ格納して公開する 6 種類の疾患に対し 疾患遺伝子予測プログラムにより新規の疾患遺伝子候補の絞込みを行い 疾患との関連情報を合計で 6 万件以上 その内 新規の情報については 600 件以上の情報を格納する 主な成果 [ 目標達成 ] PANDA システムによる予測関連遺伝子の情報は 慢性関節リウマチ (207 件 ) 糖尿病 (215 件 ) 前立腺がん (782 件 ) 食道がん (64 件 ) 胃がん (261 件 ) 大腸がん (143 件 ) に対して合計 1,672 件を得た ( 平成 20 年度に公開予定 )

2 6 新規疾患候補遺伝子の予測 優先順位付け のための技術開発 ( データマイニング ) PANDA(Priority ANalysis for Disease Association) とは H-InvDBを用いたデータマイニングにより 新規疾患候補遺伝子を予測 優先順位付けするシステム 既知の疾患関連遺伝子のさまざまな特徴( 機能アノテーション 構造ドメイン 代謝経路 細胞内局在 重複遺伝子など ) をH- InvDBから抽出し その類似性に基づいて新規の疾患候補遺伝子を探すことが可能 類似性の定量化にはマハラノビス距離を用い 特徴の相関を排除

2 PANDA による候補遺伝子の表示画面 (RA) 7 スコア =(MD2 - MD1)> 閾値 の条件を満たす遺伝子を表示 Gene Symbol ゲノム領域予測スコア ゲノム領域ごとに予測スコアでソートされた候補遺伝子を表示できる

2 慢性関節リウマチ (RA) に関する予測結果の例 8 Band name 10q21 12q12 17p13 18q21 1p13 1p36 1q43 21q22.3 22q11.2 5q31 Number of all genes 105 48 317 171 197 583 43 155 257 204 Number of known genes 0 0 1 1 1 4 0 0 1 2 Gene definition MBL2 (previous known) ADAMTS20 (dermal) ATP5A1, FECH, hypothetical, DCC TNFSF12 (previous known) Gene related to asthma PADI4 (folic acid metabolism) (folic acid metabolism) MIF SLC22A4 Number of PANDA candidates excluding known genes 9 8 57 19 32 88 3 15 37 48 6p21.3 9p22 250 49 11 0 NFKBIL1, the HLA complex RRAGA & PSIP1 (previous known) 59 葉酸代謝に関与する遺伝子を予測 6

2 遺伝子リスト特徴抽出ツール ( 仮称 公開準備中 ) 入力された遺伝子セットに共通な特徴を探すツール 知識発見支援ツール 9 HIT000101492 HIT000068148 HIT000032946 ここに遺伝子リストを記入 実行ボタン 解析対象となるアノテーション項目 : InterPro GO 遺伝子ファミリー 染色体バンド 立体構造ドメイン KEGG パスウェイ 細胞内局在予測 遺伝子発現パターン ( 開発中 )

2 遺伝子リスト特徴抽出ツールの実行例 知識発見支援ツール投入した遺伝子名 : 糖尿病関連遺伝子 6 個 (ADIPOQ, CAPN10, PPARG, TCF7L2, HNF4A, HHEX) 10 * アノテーション *Fisher の正確確率 DNA 結合性転写調節核受容体ステロイドホルモン受容体ファミリ (44) ステロイドホルモン受容体リガンド依存性の核受容体活性 Zinc-finger, 核ホルモン受容体型核ホルモン受容体 リガンド結合 コア核受容体 リガンド結合ドメイン核ホルモン受容体 リガンド結合

3 遺伝子多型情報整備 11 目標疾患との関連情報をヒト全遺伝子データベースへ格納して公開する 6 種類の疾患に対し 疾患遺伝子予測プログラムにより新規の疾患遺伝子候補の絞込みを行い 疾患との関連情報を合計で 6 万件以上 その内 新規の情報については 600 件以上の情報を格納する 主な成果 [ 目標達成 ] 遺伝子多型情報に関してデータベース VarySysDB を公開し 多型のアノテーション 構造多型 連鎖不平衡の情報を統合した Yamaguchi-Kabata et al. PLOS One (2008) Shimada et al. NAR (in press)

3 遺伝子多型 (SNP, indel) に関するアノテーション Termination Codon SNP 5 UTR ORF Synonymous 40,484 Nonsynonymous 3 UTR 41369 95,496 * 53,754 85423 Nonsense (Stop codon) 1258** Synonymous 123 Extension 75 ** Total 207374 Indel Non- frameshifting 180 Cause frameshift 1289 5 UTR-inORF 2 inorf-3 UTR 3 1993 1474 4926 Total 43369 96,970 90349 8393 215767 多型データ :dbsnp build 125, 遺伝子構造 :all human gene analysis 2 における ORFを持つ代表 cdna, ゲノム : Human genome assembly build 35 * 311 個の未分類のSNPを含む ** 方向性 cdna 上の塩基と一致するタイプを祖先型とみなした Yamaguchi-Kabata et al. PLOS One (2008)

3 ヒト遺伝子多型に関するデータベース VarySysDB の開発 ゲノム多型とそのアノテーション 構造多型 連鎖不平衡の情報を統合した 13 Shimada et al. NAR (in press)

成果のまとめ 14 大量文献から疾患 遺伝子 物質の名称の共起を抽出したデータベース LEGENDA を開発 公開した 間接共起する名称を表示するシステムも公開した 多因子性疾患の既知疾患関連遺伝子の特徴に基づいて新規の関連遺伝子候補を同定する予測システム PANDA(Priority ANalysis for Disease Association) を開発し 6 種類の疾患に対して候補遺伝子の予測を行った PANDA システムの簡易版 PANDA-mini を開発して公開した また 任意の遺伝子セットから共通の特徴を抽出するための 遺伝子リスト特徴抽出ツール を開発した ヒト遺伝子多型について タンパク質に多型がおよぼす効果のアノテーションや ゲノムの構造多型 連鎖不平衡の情報を統合したデータベース VarySysDB を開発 公開した