生命科学分野の研究用 DB の歴史と動向 文献データは1960 年代より 研究データは1970 年代より 塩基配列データバンクは日米欧の3 極体制で タンパク質データバンクは日米欧の4センターで 他のオミックスデータにも共有の枠組みが拡大 トランスクリプトーム プロテオーム メタボローム フェノーム

Similar documents
2016 年 2 月 8 日情報 システム研究機構シンポジウム 生命科学とオープンデータ 東京大学大学院理学系研究科生物科学専攻 科学技術振興機構 (JST) バイオサイエンスデータベースセンター (NBDC) 情報 システム研究機構 (ROIS) 国立遺伝学研究所 (NIG) DDBJ センター

資料1 ライフサイエンス分野における研究データの共有について

Microsoft PowerPoint _SINET_cloud

Sequence Read Archive 2013 年年 10 月 25 日 第 10 回シーケンサー利利 用技術講習会 ( 理理研横浜 ) 1

PowerPoint プレゼンテーション

<4D F736F F F696E74202D208E9197BF325F4E CC906992BB82C68D8793AF837C815B835E838B CC8A4A90DD2E707074>

データベースとは何か ~データ共有のための仕組みづくり~

Microsoft PowerPoint - 理研豊田_JST統合DB資料

<4D F736F F D AA96EC82CC837C815B835E838B C6782CC82BD82DF82CC92B28DB F18D908F912E646F63>

PowerPoint Presentation

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

nagasaki_GMT2015_key09

Microsoft PowerPoint - 3. 資料2 がんゲノム情報管理センターの進捗状況

2

アジェンダ オープンデータについて オープンガバメント セマンティック Web 技術 (RDF,SPARQL) RDF とは RDF の表現形式 : タートル,RDFa, マイクロデータ RDF グラフへの問い合わせ :SPARQL 利用環境 (SPARQL Timeliner,SparqlEPCU

資料 2-1 文部科学省における ライフサイエンス分野の取組について 平成 29 年 6 月

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

Microsoft PowerPoint - (140428NIIELS説明会)J-STAGE Lite(仮称)のご紹介_v2.pptx

Microsoft PowerPoint - T07 豊田先生.pptx

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

第5回 国際的動向を踏まえたオープンサイエンスの推進に関する検討会 資料1-1

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

検討課題の整理 1 第 1 回合同会議での意見及びその後委員から提出された意見を 第 1 回合同会議の 検討の進め方 ( 下記参照 ) に沿って分類 第 1 回合同会議資料 合同会議における検討の進め方 の抜粋 合同会議においては 以下の順で検討を進める (1) ゲノム指針と医学系指針との条文の整合

本事業の意義 実効性 ( 見直しの必要性 ) 医療情報データベース基盤整備事業 ( 平成 23 年度 ~ 10 協力医療機関 ) 日本再興戦略 ( 平成 25 年 6 月 14 日 ) 医療 介護情報の電子化の促進 医薬品の副作用データベースシステムについて データ収集の拠点となる病院の拡充や地域連

東京医科歯科大学医歯学研究支援センター illumina Genome Analyzer IIx 利用基準 平成 23 年 10 月 1 日医歯学研究支援センター長制定 ( 趣旨 ) 第 1 条次世代型シークエンサーはヒトを含むあらゆる生物種の全ゲノム配列の決定 全エキソンの変異解析 トランスクリプ

スキル領域 職種 : ソフトウェアデベロップメント スキル領域と SWD 経済産業省, 独立行政法人情報処理推進機構

次世代シークエンサーを用いたがんクリニカルシークエンス解析

CROCO について

KEGG.ppt

次 Ⅰ. 総論 2 Ⅱ. 重点分野 3 Ⅲ. 人材育成 確保 6 Ⅳ. 情報管理 8 Ⅴ. その他 9 1

スライド 1

メタデータスキーマレジストリ MetaBridge の概要

<4D F736F F F696E74202D20352D D E83678FD089EE F815B B490858E81292E707074>

PowerPoint プレゼンテーション

析法やフォーマットが混在し 発足から数年たった現在でも 統一されたデータは発表されていません また 2014 年 5 月に この HPP とは無関係に ヒトプロテオームドラフトマップ注 7 が Nature 誌で発表されました しかし このドラフトマップは 網羅性を上げるためにデータをひたすら寄せ集

データマネジメントを取り巻く IT の課題 大規模データの実践的活用に向けて レッドハット株式会社 Senior Solution Architect and Cloud Evangelist 中井悦司 2012/04/13 version1.0

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

平成17年度大学院 知識システム特論

取組みの背景 これまでの流れ 平成 27 年 6 月 日本再興戦略 改訂 2015 の閣議決定 ( 訪日外国人からの 日本の Wi-Fi サービスは使い難い との声を受け ) 戦略市場創造プラン における新たに講ずべき具体的施策として 事業者の垣根を越えた認証手続きの簡素化 が盛り込まれる 平成 2

資料 2-2 成長戦略改訂に向けた地域活性化の取組みについて ( 案 ) 内閣官房地域活性化統合事務局 成長戦略の改訂に向け これまでの施策の成果が実感できない地方において 新たな活力ある地域づくりと地域産業の成長のためのビジョンを提供しその具体化を図る 超高齢化 人口減少社会における持続可能な都市

KEGG_PATHWAY.ppt

スライド 1

塩基配列アーカイブのデータベース構築と統合への貢献 に関する成果報告 (H21 年度 ) 科学技術振興機構バイオインフォマティクス推進センター事業研究開発課題 バイオ情報資源の高準化と共用化 平成 21 年度研究開発実施報告書から抜粋 3.4 DDBJ Read Archive(DRA) 研究計画書

国立国会図書館ダブリンコアメタデータ記述

NGSデータ解析入門Webセミナー

OTデータとITデータの双方を統合的に分析可能な社会・産業インフラ分野向けのデータ分析基盤を提供開始

の連携による明確な出口戦略を持って NCを含む臨床研究中核病院などの 拠点 及びそのネットワークが中心となり 拠点外シーズ 拠点外施設も含め all Japan 体制で効率的に研究開発が進められる環境作り ( 1~3) を目指す 1 このような環境が整うことのメリットとしては 我が国における医薬品等

構成 1 第 1 章 IoT 時代の新たな地域資源 1. IoT 時代の新たな地域資源とその可能性 2. 新たな地域資源の活用に向けた基本的視点 第 2 章地域におけるオープンデータ ビッグデータ利活用の推進 1. 地域におけるオープンデータ利活用の現状と課題 2. 地域におけるビッグデータ利活用の

データベースとは何か ~データ共有のための仕組みづくり~

大学院博士課程共通科目ベーシックプログラム

final_生命科学データ保存GL_ver

ウェブサービスとは WWWを介してデータの取得 解析などをサー バ側で行うサービス 人が直接使うことは意図されていない プログラム等を使って大量に処理できる(単純) 作業を意図している SOAP, REST

所掌業務①:研究関係

Microsoft PowerPoint - 講習会 東北大学-村上分_v2.pptx

untitled

<4D F736F F F696E74202D E291AB8E9197BF A F82CC8A A390698DF42E707074>

2 研究開発項目 高信頼リモート管理技術の研究開発 (1) リモート管理プロトコルポータル リモート管理マネージャプロトコル仕様書の作成 およびエージェント向けリモート管理マネージャ API 仕様書の作成を行った (2) リモート管理マネージャ技術リモート管理マネージャ通信基盤基本設計書の作成とリモ

PowerPoint プレゼンテーション

Update of JaLC

不具合情報受付管理 DB 不具合情報対応情報要因 履歴登録 設備情報 不具合情報 対応情報 不具合 ( 履歴 ) 情報 機器仕様 納入情報 機器部品情報 関連資料 機器情報 交換部品情報 交換履歴 交換部品情報 保有部材管理 DB 保有部材管理 不具合情報 不具合先情報 不具合復旧情報 受付情報 対

NBDC-DBCLS-共同研究計画.key

スキル領域 職種 : マーケティング スキル領域と MK 経済産業省, 独立行政法人情報処理推進機構

Microsoft PowerPoint - T05_田畑先生【CC-BY】.pptx

報道発表資料(新宿駅屋内地図オープンデータ)

OpenLAB Data Store Release Notes

AJACS18_ ppt

<4D F736F F D20819B8CA48B868C7689E68F D A8CA9967B5F E646F63>

東北メディカル メガバンク計画検討会による提言について 東北メディカル メガバンク において 東北大学等が実施主体となって実施する被災地域を主な対象とした 15 万人規模の住民ゲノムコホートの実施 ゲノム情報等の解析等の計画について検討し 文部科学省や実施機関等へ提言を行うことを目的として 東北メデ

<4D F736F F D20906C8AD489C88A778CA48B8689C881408BB38A77979D944F82C6906C8DDE88E790AC96DA95572E646F6378>

データ流通 活用に関する取組状況等 ο 官民データ活用推進基本法 ( 平成 28 年 12 月公布 施行 ) や データ流通環境整備検討会 AI IoT 時代におけるデータ活用 WG 中間とりまとめ ( 平成 29 年 3 月 ) 等を受け 総務省 / 経済産業省の 情報銀行の認定に係る指針 Ver

PowerPoint Presentation

料 情報の提供に関する記録 を作成する方法 ( 作成する時期 記録の媒体 作成する研究者等の氏名 別に作成する書類による代用の有無等 ) 及び保管する方法 ( 場所 第 12 の1⑴の解説 5に規定する提供元の機関における義務 8 個人情報等の取扱い ( 匿名化する場合にはその方法等を含む ) 9

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

<4D F736F F D FC8E448FEE95F1837C815B835E838B C8F92E88B608F912E646F63>

Microsoft PowerPoint - 資料3)NIIELSoverview.pptx

研究から医療へ より医療への実利用が近いもの ゲノム医療研究推進ワーキンググループ報告書 (AMED) 臨床ゲノム情報統合データベース公募 対象疾患の考え方の方向性 第 1 グループ ( 主に を目指す ) 医療への実利用が近い疾患 領域の着実な推進 単一遺伝子疾患 希少疾患 難病 ( 生殖細胞系列

再生医療の制度的な対応の検討について 薬事法等制度改正についてのとりまとめ平成 24 年 1 月 24 日厚生科学審議会医薬品制度改正部会 1 再生医療製品については 今後も 臓器機能の再生等を通じて 重篤で生命を脅かす疾患等の治療等に ますます重要な役割を果たすことが期待される 特に ips 細胞

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

スライド 1

介護ロボットの開発 普及に関する現状 社会保障費は増加の一途 ( 介護に係る社会保障費の推計 :2012 年 8.4 兆円 2025 年 19.8 兆円 ) 2025 年時点の介護職員の需給を推計すると 介護職員は 38 万人不足する見込み 持続的な財政及び社会保障システム維持のためには 介護需要増

社会的責任に関する円卓会議の役割と協働プロジェクト 1. 役割 本円卓会議の役割は 安全 安心で持続可能な経済社会を実現するために 多様な担い手が様々な課題を 協働の力 で解決するための協働戦略を策定し その実現に向けて行動することにあります この役割を果たすために 現在 以下の担い手の代表等が参加

大規模データの匿名加工処理を高速化する技術を開発

GWB

<4D F736F F F696E74202D208E9197BF B8BB38EF690E096BE8E9197BF2E707074>

研究開発期間 平成 27 年度間 研究開発費合計額 うち 直接経費 希望する研究開発費 ( 円 ) 年度 5. 全体表 の 合計 欄の額を 記載してください 5. 内訳表 の総括 直接経費小 計 欄の額を記載してください H27 年度 XX,XXX,XXX 円 XX,XXX,XXX 円 研究開発目的

AJACS_komachi.key

Microsoft PowerPoint - A3② JaSST_MISRA2004ソースコード品質診断.ppt

TogoDBシステム概説書

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

PowerPoint プレゼンテーション

Microsoft PowerPoint _Part 2_scopus_training2018

連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

PowerPoint プレゼンテーション

Microsoft Word - NII_Content_Ojiro.doc

リード・ゲノム・アノテーションインポート

LODチャレンジ2012 に挑戦しよう 2012年10月20日10:15 広島国際学院大学中野キャンパス10号館 LODチャレンジ2012実行委員会 羽鳥健太郎

平成 27 年 3 月科学技術振興機構 JREC-IN Portal( 研究人材のためのキャリア支援ポータルサイト ) 平成 26 年度 JREC-IN Portal 一般ユーザアンケート結果 1. 調査概要 1-1. 調査対象 JREC-IN Portal トップページ訪問者 /JREC-IN P

130712AJACS40

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

Transcription:

2017 年 6 月 26 日研究データ利活用協議会公開シンポジウム データ共有の先行事例の紹介生命科学におけるデータ共有の歴史 現状 課題 東京大学大学院理学系研究科生物科学専攻 科学技術振興機構 (JST) バイオサイエンスデータベースセンター (NBDC) 情報 システム研究機構 (ROIS) 国立遺伝学研究所 (NIG) DDBJ センター (DDBJ) 高木利久

生命科学分野の研究用 DB の歴史と動向 文献データは1960 年代より 研究データは1970 年代より 塩基配列データバンクは日米欧の3 極体制で タンパク質データバンクは日米欧の4センターで 他のオミックスデータにも共有の枠組みが拡大 トランスクリプトーム プロテオーム メタボローム フェノーム 分野別目的別単位でのデータ共有の枠組みも 微生物 植物 実験動物 ヒト疾患 脳

生命科学ではデータ共有がなぜ活発なのか? 少数の数式や法則で表現できない ( データが重要 ) 研究成果の再現や検証 データ共有による研究の促進 統計解析のパワーアップ 他の観点からの新発見 イノベーション促進 重複の排除 資金の効率化 研究不正への対応 資金提供機関からのデータ共有の要請 論文投稿時における出版社からのDB 登録要請 受け皿としてDBセンターやアーカイブの整備 DBは研究のインフラでありフロンティア

ゲノム関係の国内外の DB センター 1980 EMBL-Bank 1982 LANL GenBank 1987 NIG DDBJ 1988 NIH NLM NCBI 1992 EMBL EBI 2001 JST BIRD 2007 ROIS DBCLS 2011 JST NBDC

DDBJ センターが運営するデータベース アノテーション 制限公開データベース JGA 個人レベルの遺伝型と表現型情報 DDBJ ヒトデータ審査委員会で提供と利用を審査 アセンブリ BioProject BioSample アライメント DRA リード Quality value INSDC: オープンアクセスデータベース

情報の多様化と爆発 データ爆発 次世代ゲノムシークエンサーなどの計測技術の進歩 ムーアの法則を凌駕 10 万を超えるゲノムプロジェクト進行中 ゲノム以外の omics データや画像も急増 知識爆発 論文数 2,700 万件 オープンアクセスの拡大 データベース爆発 世界 1 万から 2 万 ( 日本は千 ) 解析ツール数千 内容も非常に多様化 生命科学はビッグデータを扱う情報の学問に データ駆動型科学 生命科学は peta オーダーの時代に 主要 DB センターは数十 PB のデータ保有

http://www.genome.gov/sequencingcosts/

様々な生物のゲノムプロジェクト https://gold.jgi.doe.gov/

http://www.ncbi.nlm.nih.gov/traces/sra/

生命科学におけるデータの利活用に関する障害 自分の専門外の DB を使う必要性あり ゲノムは生物横断的 DB や解析ツールの数が多すぎて使い方不明 生体内相互作用 DB だけでも 500 以上の DB 注釈が信頼性のあるものとないものが混在 フォーマットや用語がバラバラ 遺伝子の概念さえ DB によって違う 同じ遺伝子にも多数の名前あり データの文脈依存性 曖昧性 冗長性 複雑性 単純にレポジトリするだけでは再利用性低い

10 年ほど前の我が国固有の事情 資金提供機関からの共有の義務化ルールなし プロジェクト終了すると維持管理更新されない データの囲い込み データの権利関係不明 小規模プロジェクト多い ビッグデータ化必要 バイオインフォマティシャン不足 競争に負ける 受け皿となる中核 DB センターがない ( 欧米は数百人規模のセンター )

我が国の生命科学 DB 統合推進事業 データの共有 公共財化を促進し その価値を最大化 内閣府 CSTP 主導の統合データベースプロジェクト (2006 ) 文科省 経産省 農水省 厚労省で実施 2011 年 12 月に四省連携のポータルサイト 文科省の統合データベースプロジェクト (2006 ) 中核センターの設立 2007 情報 システム研究機構ライフサイエンス統合 DB センター DBCLS 2011 科学技術振興機構バイオサイエンス DB センター NBDC クリエイティブコモンズ (CC) ライセンスによるデータの共有 フォーマット 辞書 統合技術 動画教材などの開発 カタログ 横断検索 アーカイブの構築など種々のサービス提供 研究分野ごとのデータベース統合化進行中 ( ファンディングによる ) ヒト由来データの共有 セキュリティガイドラインの作成 ヒト DB( オープン 制限アクセス ) の構築 受入れ (DDBJ と連携して )

公募要領にデータ提供協力依頼記載 文科省ライフ課委託プロジェクト (H20 ) JST 戦略事業 (CREST さきがけ )(H23 ) 厚労科研費 (H24 ) 文科省科研費 (H25 ) AMED-CREST, PRIME(H27 ) 医療分野研究成果展開事業産学連携医療イノベーション創出プログラム (H27 ) ナショナルバイオリソースプロジェクト ゲノム情報等整備プログラム (H27 )

生命科学 DB 統合推進事業の成果

http://dbarchive.biosciencedbc.jp/index.html

http://dbarchive.biosciencedbc.jp/index.html

NBDC における分野別目的別のデータベース統合 プロテオーム統合データベースの構築 生命動態情報と細胞 発生画像情報の統合データベース エピゲノミクス統合データベースの開発と機能拡充 ゲノム 疾患 医薬品のネットワークデータベース 糖鎖科学ポータルの構築 蛋白質構造データバンクのデータ検証高度化と統合化 データサイエンスを加速させる微生物統合データベースの高度実用化開発 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合 個体ゲノム時代に向けた植物ゲノム情報解析基盤の構築

NBDC ヒトデータベース / データの種類 NBDC ヒトデータベース 非制限公開 ( オープン ) データ 制限公開データ ( 標準レベル [Type Ⅰ] セキュリティ ) ( ハイレベル [Type Ⅱ] セキュリティ ) 公開待機データ 匿名化 匿名化前 公開留保データ他 ウェブサイト等から制限なく公開 集団の統計値 特定の個人由来では無い試料の解析結果 ヒトデータ審査委員会 (NBDC) での審査に基づき利用可能 個人ごとの情報 一定期間の後 制限公開データ等へ移動 各プロジェクト 実施機関

ヒトデータベース基本方針 インフォームドコンセントで禁止してない限り民間企業も利用可能 無料でデータ提供可 データ利用可 今後大規模データを受入れる際はデータ提供側に課金の可能性も 米国 NCBIのdbGAPで導入 欧州ではそのような動きない データ公開時期は提供者の意向を基本的に尊重 最長でも論文出版までが通常 今後 NIHのガイドラインに準拠して変更する可能性も

アクセス制限 ( 制限公開 ) データベース JGA Japanese Genotype-phenotype Archive dbgap Database of Genotype and Phenotype EGA European Genome-phenome Archive JGA と EGA は SRA をベースにしたデータモデルを使用 dbgap と EGA は概要情報を交換 (JGA も参画予定 )

NBDC ヒトデータベースのセキュリティルール データの種類によって実施すべきセキュリティ対策を共通化 データの種類 データ提供者 データベースセンター データ利用者 NBDC ヒトデータベース オープン 制限公開 ( 標準レベル [Type Ⅰ] セキュリティ ) 制限公開 ( ハイレベル {Type Ⅱ] セキュリティ ) 公開待機 提供申請が必要 データ改ざん防止などの基本的対策も実施 TypeⅠ レベルセキュリティ TypeⅡ レベルセキュリティ TypeⅡ と同レベルのセキュリティを適用 自由に利用できる ( ルール不要 ) 利用申請が必要 利用できない 匿名化前 公開留保 利用できない

NBDC ヒトデータベース 大規模な国のプロジェクトと連携 東北メディカル メガバンク機構 次世代がん研究 オーダーメイド医療プログラム 公開中 52 件 ( 制限公開含む ) 提供申請 123 件 26 万検体

RDF によるデータと知識の統合 Resource Description Framework の略 ( 主語 述語 目的語 ) の 3 つ組 ( トリプル ) で 主語 述語 目的語 主語 述語は URI(Uniform Resource Identifier) で Semantic Web LOD (Linked Open Data) Web of Data

NBDC RDF Portal DBCLS の RDF 化ガイドラインに沿う 17 DB を収録 SPARQL エンドポイントから利用可能

Databases in NBDC RDF Portal 現在 Open TG-GATEs が最大 (70 億トリプル ) 近々 DDBJ RDF の 200 億トリプルが公開される予定

Open TG-GATEs RDF (170 の化合物 ( 医薬品 ) の毒性検査に関する情報 ) 各 RDF データには詳細なメタデータや内部構造を示すスキーマ図が付与されている

これまでの 10 年を振り返って 当時のもくろみ IT によるデータや知識の整理統合 & 推論による仮設生成 質問応答 データ駆動型科学 ある程度できたこと FAIR 生命研究者のデータ共有 DB への理解増進 データシェアリングポリシー DMP などの導入 ( まだ不十分 ) 中核センターの設置 ( ただし まだ問題残っている ) あまりできなかったこと データ駆動型科学の実践 データ共有のインセンティブ付与 人材育成 もくろみが達成できなかった主な理由 IT による統合の前にデータ共有の大きな壁 生命科学データの多様性 文脈依存性 複雑性 曖昧性 など

爆発するデータ 知識への対応 データ共有のコストは誰が負担? 何を DB として残すべきか? スパコン ( ストレージ 計算パワー ) などの基盤整備様々な技術の開発

総コア数 20 万 総メモリ 66TB ストレージ 13PB

国内 250 以上の大学 研究機関,2500 名の研究者が利用

持続可能な体制や基盤の構築 オープンサイエンス データ共有の効能の評価プロジェクトと連動した予算の確保

https://beagrie.com/static/resource/ebi-impact-report.pdf

我が国における DB センターの連携 一元化

( 国際的な ) ヒト由来データの共有 マシンリーダブルコンセント フォーマット 研究者認証 アクセス権限 セキュリティ ELSI( 個人情報保護法など ) マイクロアトリビューション

http://genomicsandhealth.org/about-global-alliance

GA4GH 加入組織 411 組織 (41 カ国 ) NIH, ELIXIR, Google, Amazon, Illumina など 研究機関に限らず 医療機関 IT 企業等も参加 日本からは 12 組織がメンバーに ライフサイエンス統合データベースセンター (DBCLS) エーザイ株式会社 Genomedia 株式会社 日本医療政策機構 (HGPI) 科学技術振興機構バイオサイエンスデータベースセンター (NBDC) 日本人類遺伝学会 (JSHG) 国立がん研究センター (NCC) 国立遺伝学研究所 DDBJ センター 大阪大学大学院医学系研究科 医学部 理化学研究所 株式会社理研ジェネシス 株式会社テンクー

GA4GH 運営体制 運営委員会の下に 4 つのワーキンググループを設置 1. Clinical Working Group Phenotype データの統一フォーマットの開発 ( オントロジー ) やゲノムデータとのリンク付け方法の確立を目的としている 2. Data Working Group データ形式 クラウド環境における安全な保管 ゲノム情報を共有するためのアプリケーション プログラミング インターフェース (API) の開発 データを使いやすくするためのアプリケーション開発といった 技術開発を実施している 3. Regulatory and Ethics Working Group 国際ガイドラインや倫理的な枠組みを作成し ゲノムデータ 臨床情報の信頼のおける共有を世界規模で活性化させることを目的としている 4. Security Working Group データセキュリティ アクセス制御 監査機能 プライバシー保護について検討している

実証プロジェクト Beacon Project 遺伝情報を国際的に共有するオープンウェブサービス 分散しているゲノムデータを検索しやすくすることを目的としており 現時点では 指定した条件を満たすデータを含むデータベースを示す (2015/6 現在 252 Datasets が検索対象,) BRCA Challenge 乳ガンやその他のガンの遺伝要因の理解を深めるために 世界中からガンに関与する遺伝子多型データを共有するための試み まずは乳ガンのデータ共有を進めている Matchmaker Exchange 類似の表現型情報や遺伝子型情報を共有することで 希少疾患や診断未確定疾病の理解を深めるためのデータベース連邦型ネットワークシステム

Reference Graph Data Working Group の Reference Variation Task Team での活動 リファレンス DNA 配列 GGCCAG https://genomicsandhealth.org/files/public/6-beacon-hausslerga4ghleiden.pdf DNA 配列をグラフ ( 各塩基を節 隣接する塩基を枝で接続 ) で表現 リファレンス DNA 配列を 1 本の経路で表現 リファレンスに対する変異をリファレンス配列の経路から分岐した経路で表現 多様性を持つゲノム配列の集合をグラフで表現することにより ゲノム配列の既知のあらゆる変異を表現でき 既存の文字列表現での不完全性 矛盾を解消することを目指す

Beacon 検索対象 DB が条件 ( ゲノム上の特定の位置の塩基が 指定した塩基か否か ) を満たすゲノムデータ ( 頻度だけでなく個人ゲノム ) を持っているかを yes/no で返す 分散しているゲノムデータを検索しやすくする https://genomicsandhealth.org/files/public/6-beacon-hausslerga4ghleiden.pdf プログラムをダウンロードでき 誰でも Beacon を公開できる

Matchmaker Exchange 分散する DB から類似の phenotype/genotype を持つ希少疾患者を探す仕組み https://genomicsandhealth.org/files/public/8plenary2presentation-matchmakerexchange-heidirehm.pdf

人材の育成 発掘 教育体制 ポジション キャリアパス

なぜ人材育成はうまく行かなかった? 人材は育ってきたが需要の拡大の方が大きかった! なぜ需要を見越して対応できなかったのか? 教育体制の問題 受け皿 ( 産業界 研究機関 大学 ) の問題 制度面の問題 データ囲い込み問題 ポジション キャリアパスの問題 評価の問題 人材の分類とそれに合わせた対応策必要 参入障壁の解消 ( 良いデータベースの開発 )