本報告書は 文部科学省の科学技術試験研究委託事業による委託業務として 京都大学が実施した 平成 19 年度の ライフサイエンス知識の階層化 統合化事業 の成果を取りまとめたものです 従って 本報告書の著作権は 文部科学省に帰属しており 本報告書の全部または一部の無断複製等の行為は 法律で認められたと

Similar documents
国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

Microsoft PowerPoint - AJACS38_KEGG-GEnomeNet_tokimatsu v2.ppt [互換モード]


KEGG_PATHWAY.ppt

<4D F736F F D AA96EC82CC837C815B835E838B C6782CC82BD82DF82CC92B28DB F18D908F912E646F63>

PowerPoint プレゼンテーション

Microsoft Word - NII_Content_Ojiro.doc

()

2

マニュアルの表記 呼称について本マニュアルでは以下の呼称を使用しています DataNature Smart 管理ツール :DN 管理ツール DataNature Smart クライアント :DN クライアント 画面に表示されるコマンド名などの文字コマンド名やダイアログボックス名など 画面上の固有の文

CONTENTS マニュアルの表記... S01-13_01 1.DataNature Smart 全体概要図... S01-13_11 2. 基本操作... S01-13_ Web レポートの表示... S01-13_ 画面構成... S01-13_ 集計表 /

画面について 画面構成 画面構成 Smart Copy for Android の画面構成は 次のとおりです 1フォルダパス 2. ファイルの種類 3 ファイル一覧 5[ 戻る ] ボタン 4[ メニュー ] ボタン 1 フォルダパス現在表示している画面のフォルダパスが表示されます 2ファイルの種類

Exfront4.1.0リリースノート

ProQuest PPT Styles

はじめに - マニュアルエディター機能の概要 - Dojoの種類とマニュアルエディター機能解除について マニュアルレイアウトの生成 - マニュアルレイアウトの生成 基本編集 4 - 表紙の挿入 4 - 目次の挿入 5 - 一括変換 6 4 マニュアルビルド 9 4- MS Word 9

EndNote X7 クイックレファレンスガイド

PowerPoint プレゼンテーション

Microsoft PowerPoint - 資料3)NIIELSoverview.pptx

2-1. システム概要 2-2. システムの設計 SNS Twitter Web-GIS 推薦システム スマートグラスを統合 平常時は観光回遊行動支援 災害時は避難行動支援 情報の蓄積 共有 推薦とナビゲーションを可能にする 有用性 時間的制約の緩和 スマートグラスの統合 動的 リアルタイム性 SN

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

不具合情報受付管理 DB 不具合情報対応情報要因 履歴登録 設備情報 不具合情報 対応情報 不具合 ( 履歴 ) 情報 機器仕様 納入情報 機器部品情報 関連資料 機器情報 交換部品情報 交換履歴 交換部品情報 保有部材管理 DB 保有部材管理 不具合情報 不具合先情報 不具合復旧情報 受付情報 対

(Microsoft PowerPoint - \220V\213\214\225\266\217\221\224\344\212r\203\\\203t\203g\202o\202o\202s\216\221\227\277ADVIT1-30\224\305.ppt)

報道関係者各位 プレスリリース 2019 年 01 月 15 日 株式会社ネオジャパン グループウェア desknet's NEO バージョン 5.2 を 1 月 15 日に提供開始 ~ 業務アプリ作成ツール AppSuite との連携を強化 他にも AppSuite 連携 API 公開など多数の機

<4D F736F F D20819B8CA48B868C7689E68F D A8CA9967B5F E646F63>

1. WebShare(HTML5 版 ) 編 1.1. ログイン / ログアウト ログイン 1 WebShare の URL にアクセスします xxxxx 部分は会社様によって異なります xxxxx 2 ユーザー名 パ

ProQuest PPT Styles

柔軟に行えるとともに 将来のシステム拡張性を考慮するものとする またデータのバックアップが行えるとともにサービス停止など障害時の復旧作業や必要に応じた再インストール等に対応する (OS のアップデート等の定期的な保守を実施するとともに 継続的に CMS の機能向上を図るものとする ) (11) ドメ

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

平成22年度「技報」原稿の執筆について

情報連携用語彙データベースと連携するデータ設計 作成支援ツール群の試作及び試用並びに概念モデルの構築 ( 神戸市こども家庭局こども企画育成部 千葉市総務局情報経営部業務改革推進課 川口市企画財政部情報政策課 ) データ構造設計支援ツール設計書 2014 年 9 月 30 日 実施企業 : 株式会社ア

ProQuest PPT Styles

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

PowerPoint プレゼンテーション

EndNote basic / Mendeleyを用いた文献管理方法

平成 27 年度 ICT とくしま創造戦略 重点戦略の推進に向けた調査 研究事業 アクティブラーニングを支援する ユーザインターフェースシステムの開発 ( 報告書 ) 平成 28 年 1 月 国立高等専門学校機構阿南工業高等専門学校

NGSデータ解析入門Webセミナー

画面について メイン画面 メイン画面 Logitec EXtorage Link を起動すると メイン画面が表示されます メイン画面の構成は 次のとおりです 1 メニュー 2 端末から外部ストレージへ 3 外部ストレージから端末へ 4 端末 5 外部ストレージ 6 カメラ機能 スマホやタブレットで使

<4D F736F F F696E74202D E48FE A92C789C192CA926D82C982C282A282C45F696E6F75652E >

黒板作成 連携ツールの概要 黒板作成 連携ツールは 事前に撮影する工事写真用の黒板を作成するツールです 本書では EX-TREND 武蔵の写真管理 黒板作成 連携ツール ios アプリ 現場 DE カメラ土木版 の連携について 説明します 写真管理 EX-TREND 武蔵の写真管理で作成した 工種分

Microsoft Word - CiNiiの使い方.doc

Microsoft PowerPoint _札幌医科大学様_ENX7_原沢(改訂).pptx

Microsoft Word - RefWorksコース( _.doc

PowerPoint プレゼンテーション

Microsoft PowerPoint _tech_siryo4.pptx

目次はじめに 必要システム環境 インストール手順 インストール前の注意点 インストールの準備 (.NET Framework3.5 SP1 のインストール ) ライセンスの登録 初期設定情報の入力... 8

マルチエージェントシステムグループの研究計画

Trinity標準価格.xls

改訂履歴 版数日付改訂内容項番 ページ等 /03/31 全面改定

変更要求管理テンプレート仕様書

スライド 1

PowerPoint プレゼンテーション

Microsoft Word - ShareFastClientManual_JP_R1-1-0.doc

4-7 SciFinder - 第4章「雑誌論文を探そう」 - 情報通 -徳島大学生のための情報探索ガイドブック-

プロジェクトマネジメント知識体系ガイド (PMBOK ガイド ) 第 6 版 訂正表 - 第 3 刷り 注 : 次の正誤表は PMBOK ガイド第 6 版 の第 1 刷りと第 2 刷りに関するものです 本 ( または PDF) の印刷部数を確認するには 著作権ページ ( 通知ページおよび目次の前 )

SILAND.JP テンプレート集

<4D F736F F D F726B7382C B835E82F08EE682E88D9E82DE>

法人税の達人from減価償却の達人 運用ガイド

スライド 1

Sol-005 可視化とRCSA _ppt [互換モード]

要求仕様管理テンプレート仕様書

スライド 1

Microsoft Office Visioによる 施設管理について

< F31322D8A6591E58A7782D682CC8EC08E7B92CA926D816988C4816A>

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

DB STREET 設置マニュアル

スライド 1

Microsoft Word - MTransㇹㇿㅼㅋ㇬㇤ㅛ+丕苬ㅦㅼㇶㅼ咂ㆂ;_ver1.7_original.docx

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

お客様各位 ~ IT 資産管理サービス ASSETBASE ~ ASSETBASE Ver.8.5 リリースについて 2017 年 11 月 10 日 株式会社内田洋行 日頃は IT 資産管理サービス ASSETBASE をご利用いただきまして 誠にありがとうございます この度 ASSETBASE

システム管理者ガイド GIGAPOD 3 システム管理者ガイド - 負荷分散構成 第 1.01 版 2013 年 3 月 改訂履歴 No バージョン 日付 作成者 改訂者 補足 /09 トライポッドワークス 初稿 /03 トライポッドワークス cr

2. 簡単セットアップ方法概要 SRRD のインストールが完了すると メイン ( 初期 ) 画面が表示されます また SRRD を終了しても 通常はタスクバーにアイコン ( 羊のアイコン ) が残り このアイコンをクリックすると メイン画面が表示されます * RAM ディスクの作成 RAM ディスク

Microsoft Word - CBESNet-It連携ガイドver8.1.doc

FAQ案(Linkup Manager)

なお,PMDA メディナビでパスワードを設定済の方は, 共通のパスワードとなります (4) 登録完了 ( 図 2 ステップ 3) なお, 登録後, ログイン時は (1) で表示される画面で, ログイン画面へ をクリックし, メー ルアドレス及びパスワードを入力してください 図 1 PMDA メディナ

資産ファイルのエクスポート(会計王19シリーズ) 運用ガイド

資産ファイルのエクスポート(会計王13PRO) 運用ガイド

アナタの業務に システムをマッチさせるための仕組み

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

< 目次 > 1. パソコンの画面構成... 3 連絡先一覧... 3 連絡先一覧の切り替え... 4 連絡先... 6 付帯情報... 7 関連... 7 代行入力... 8 CRM... 8 グローバルメニュー SkyDesk Cards R for ios 画面構成... 12

Jupyter Notebook を活用したプログラムライブラリ構築の検討 吹谷芳博 1, 藤澤正樹 1 ( 1 あすか製薬株式会社 ) Examination of the program library construction using Jupyter Notebook ASKA Pharm

使える! IBM Systems Director Navigator for i の新機能

グループ一覧を並び替える すべてのユーザー グループの並び順を変更する ユーザーの登録

外国語論文の探し方 ( 図書館情報学 ) 今回の講習会で取り上げるデータベースの概要 LISA(Library and Information Science Abstracts) は図書館学および情報学関係の抄録データベースです 1969 年以降の 68 ヵ国以上 20 以上の言語の 440 点を

Microsoft Word - RefWorksコース doc

データベース 【1:データベースシステムとは】

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

HPシンクライアントイメージ入れ替え手順書

リリース リリース日 2010 年 11 月 24 日 ( 水 ) 製品ご購入 CD-ROM 2010 年 11 月 24 日 ( 水 ) よりご提供開始 オンラインアップデート 2010 年 11 月 24 日 ( 水 ) 20:00~ ASP サービス NISaaS サービス 2010 年 11

(Microsoft Word \214\264\215e\201{\216\221\227\277.doc)

スライド 1

Microsoft Word - 06.doc

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

一括請求 Assist Ver.2 操作マニュアル 連携編 ( 蔵奉行 i8) 第 2.1 版

電子ジャーナルの動向 本日の内容 医図懇アンケート結果 電子ジャーナルとは 電子ジャーナルの種類 契約形態など 電子ジャーナルの利用 ( 水 ) 島根大学附属図書館医学分館葛原克子

1. 主な機能追加項目 以下の検索項目をサポートしました 書誌 全文検索コマンド検索 国内 査定日 最新の査定日 ( 登録査定日または拒絶査定日 ) を検索します 査定種別 最新の登録 拒絶査定 または査定なしを検索します 審査最終処分日 最新の審査最終処分日を検索します 審査最終処分種別 最新の審

初版 : 改訂 : Dr.Web 製品ダウンロード & アクティベーションガイド この度は 株式会社 Doctor Web Pacific の製品をご購入いただき 誠に有難うございます 本ガイドは 初めて弊社製品をご利用いただくお客様向けに 弊社製品モジュ

06.7 作成.EndNote Basic について -.EndNote Basic とは? EndNote は文献情報を保存 管理するツールです また 保存した文献情報をもとに文献リストを簡単に作成することができます デスクトップ版と EndNote Basic と呼ばれる Web 版があり 信州

DBMSリポジトリへの移行マニュアル

農業農村整備民間技術情報データベース技術概要書 (2/4) 17: 連絡先の郵便番号と住所をご記入ください < 郵便番号は半角数字 > < 2/6 > 連絡先 会社名住所担当部署担当者関連 URL MAIL 19 TEL FAX 1 18: 連絡先の担当部署をご記入

Transcription:

ライフサイエンス分野の統合データベース整備事業 ライフサイエンス知識の階層化 統合化事業 19 年度研究成果報告書 平成 20 年 3 月 国立大学法人京都大学化学研究所 金久實

本報告書は 文部科学省の科学技術試験研究委託事業による委託業務として 京都大学が実施した 平成 19 年度の ライフサイエンス知識の階層化 統合化事業 の成果を取りまとめたものです 従って 本報告書の著作権は 文部科学省に帰属しており 本報告書の全部または一部の無断複製等の行為は 法律で認められたときを除き 著作権の侵害にあたるので これらの利用行為を行うときは 文部科学省の承認手続きが必要です 2

1. 委託業務の目的 本計画は現在すでに世界有数のバイオ情報サービスとなっているゲノムネットを京都大学の事業と位置づけ 化学研究所バイオインフォマティクスセンターにおいて分子情報を中心とした統合データベースを構築する 日本語での統合 DB 検索システムを半年後に提供し 革新的なウェブ技術と KEGG において人手で構築された知識の体系を融合して 平成 22 年までにライフサイエンス分野における世界最高水準の知的情報基盤を確立する 2. 平成 19 年度の実施内容 2.1 実施計画 (1) 共通基盤技術開発統合データベースを構築する基盤技術はこれまでの KEGG プロジェクトですでに確立しているので 本計画では統合データベースを利用するための技術開発が中心となる 利用の形態は大きく分けてキーワード検索と 類似性検索や解析 予測などのソフトウェア利用がある これらを 2 つの業務項目とし 平成 19 年度は以下の開発を行う 1 知識処理技術開発ソフトウェア利用については 平成 19 年度は化合物に関するソフトウェアを集中的に整備する 特に化合物の化学構造比較 化学反応予測など 化学研究所バイオインフォマティクスセンターの研究成果をもとにしたソフトウェアを実用化し ゲノムネットサービスとして順次公開する 2 ウェブ技術開発キーワード検索の基本的なものはすでに DBGET システムで運用しているので 日本語での利用環境作りとして 入力した日本語キーワードの翻訳機能と検索結果画面の英単語を日本語に翻訳するための支援ツールを開発する これらを実装したゲノムネットサービスを平成 19 年 10 月に運用開始する また現行の検索システムに代わる革新的なウェブ検索システムは 3 年間の開発期間を設定し その第 1 段階の開発研究を開始する (2) 統合データベース開発 運用本計画では既存データベースのデータ間のつながりを蓄積した LinkDB データベースが統合化の基本となる 一方では 我が国において公共的に利用可能なレポジトリーが存在しない医薬品や化合物について 新規データベースの開発も行う これらを 2 つの業務項目とし 平成 19 年度は以下の開発を行う 1 統合データベース開発 LinkDB データベースは これまでゲノムネットの DBGET システムで運用している内部データベースが対象であったが 外部データベースについてもデータベース間のクロスレファレンス情報を 2 項関係ファイルとして取り込むことができる枠組みを開発し 検索コマンドの高機能化を行う また DBGET システムやデータベースの日々更新を行う SEQNEW システムの高機能化も行う LinkDB の検索効率を高めるために 3

含まれるデータの階層化 重複除去作業に着手し 塩基配列データベースでこれをまず実現して公開する 2 医薬品 化合物データバンク開発医薬品および化合物情報について平成 19 年度は KEGG DRUG にある薬の名称 化学構造 薬効 ターゲットなどの情報と JAPIC が提供する医薬品の添付文書情報 特に副作用情報を統合し 日本語での医薬品 化合物データベースの最初のバージョンとして提供する (3) プロジェクトの総合的推進分担機関である京都大学は 中核機関である情報 システム機構の全体戦略に従い連携して本事業を推進する 医薬品 化合物に関する外部有識者を含む技術検討会を開催して プロジェクトの推進に資する 本プロジェクトの成果は直ちにゲノムネットサービス (http://www.genome.jp/) に反映し 利用者の意見を収集して今後の展開に資する 2.2 実施内容 ( 成果 ) 本統合データベースプロジェクトはゲノムネット (www.genome.jp) を KEGG と分離して開発 運用するために提案し実施してきた KEGG は現時点ではゲノムネットの主要サービス (www.genome.jp/kegg/) であるが 京都大学と東京大学の金久研究室が別予算で構築しており KEGG 独自のウェイブサイト (www.kegg.jp) も存在する 本計画ではゲノムネットを京都大学の事業と位置づけ DBGET/LinkDB システムを中心に統合化を行うものである KEGG は統合化の対象データベースの中心であり またケミカル情報解析ツールの一部はこれまで KEGG の中で開発されていたものを引き継いで本計画で開発している 初年度は当初計画で掲げた DBGET の一括検索 日本語支援機能の導入 LinkDB の高機能化に重点を置いて開発し すべて公開済である ( 図 1 参照 ) また採択後に中核機関との話し合いの中で追加事項として計画に取り入れた医薬品 化合物のデータベース開発では KEGG との重複を避けるため手作業でのデータ収集 統合ではなく JAPIC など他データベースの導入と LinkDB を用いた統合化を行った 初年度の実施内容は以下の通りである (1) 共通基盤技術開発 1 知識処理技術開発ゲノムネット利用形態のうちソフトウェア利用については 平成 19 年度は化合物に関するソフトウェアを集中的に整備した 特に化学研究所バイオインフォマティクスセンターの研究成果をもとにして実用化した化合物類似構造検索ツール SIMCOMP 糖鎖類似構造検索ツール KCaM 化学構造変化に基づく反応予測ツール e-zyme をゲノムネットのケミカル情報解析ツールとして整備し公開した ( 図 2 参照 ) また マイクロアレイデータからの糖鎖構造予測ツール GECS(Gene Expression to Chemical Structure) を開発し 平成 20 年 4 月 1 日の公開に向けて整備した SIMCOMP については サイズの大きな化合物に対する検索効率の悪さが問題となっていた そこで 化合物構造を比較する際のグラフ表現と比較アルゴリズムについて複数の方法を調査 検討し 現状のものと比較した その結果 高速化の目処がたったため 平成 20 年度中に高速化を実現する予定である 4

図 1. ゲノムネットの日本語版ホームページ ゲノムネットは 1992 年より京都大学化学研究所で開発 運用を行っているライフサイエンス分野の統合情報リソースである ゲノムネットの 1 日あたりの総アクセス数は 100 万件程度 1 日あたりアクセスのあったユニーク IP アドレス数は 1 万 5 千程度 ( 大学等の組織では proxy 経由で多数の利用者が同一アドレスでアクセスしているので実際の利用者数は 2 万 3 万と推定される ) で ライフサイエンス分野では我が国最大のまた国際的にも有数の情報サービスとなっている 平成 19 年度に本プロジェクトにおいて赤枠で囲んだ部分 すなわち日本語支援の辞書ツールの新規開発 DBGET の全データベース ( 統合データベース ) 一括検索機能開発 多数の外部データベースを含む LinkDB の高機能化 ゲノムネット医薬品データベースの新規開発 化合物関連情報の解析ツールの整備を行った 5

図 2. ゲノムネット計算ツールは配列解析 ゲノム情報解析 ケミカル情報解析に大別され 配列解析以外はすべて京都大学化学研究所バイオインフォマティクスセンターの研究成果を実用化したものである 本プロジェクトでは赤枠で囲んだ部分の新規開発または機能向上を行った 2 ウェブ技術開発もう 1 つの利用形態であるキーワード検索の基本的なものはすでに DBGET システムで運用しているので 日本語での利用環境作りとして 入力した日本語キーワードの翻訳機能と検索結果画面の英単語を日本語に翻訳するための支援ツールを開発し 平成 19 年 10 月 1 日に運用を開始した ( 図 3 参照 ) また 革新的なウェブ検索システムについては第 1 段階の開発研究として ゲノムネットで提供する全データベースに対する一括検索機能を開発し 7 月 1 日に運用を開始した ( 図 4 参照 ) 同時にゲノムネットにインストールされていない外部データベースへのリン 6

クや等価なエントリー間をつなぐリンクを含む LinkDB 新バージョンの検索機能を実装した その結果 一部の外部データベースも内部データベースと同様にキーワード検索できるようになった 図 3. ライフサイエンス辞書 (LSD) を用いた和英辞書ツールと英和辞書ツールの使用例 図 4. ゲノムネット統合データベースの全データベース一括検索の例 7

(2) 統合データベース開発 運用 1 統合データベース開発 LinkDB データベースでは これまでゲノムネットの DBGET システムで運用している内部データベース ( 表 1 のカテゴリー 1 とカテゴリー 2) が検索の対象であったが 本プロジェクトにおいて 外部データベースについてもデータベース間のクロスリファレンス情報を 2 項関係ファイルとして取り込み 検索ができるような枠組みの開発を行った 取り込むべき外部データベースの最初の対象を DBGET システムで既に運用している内部データベースから参照されているデータベースとして開発を行い これにより 内部データベースに加え 500 以上の外部データベースが LinkDB の検索対象となった また 検索コマンドの高機能化を行い 外部データベースと内部データベースを区別なく検索する機能および等価なリンクを扱うための機能を実装した DBGET システムおよび SEQNEW に関しては全データベース一括検索用の改良等高機能化を図った また LinkDB の検索効率を高めるため データの階層化 重複除去作業に着手した その第一段階として 塩基配列データベース GenBank, EMBL, DDBJ を対象とした重複除去作業を行い DBGET システムにおいて INSDC という一つのデータベースとして検索できるようにした キーワード検索結果画面からは 上記 3 つのデータベースすべてにリンクが張られており どのデータベースのエントリーも直接検索できる 表 1. ゲノムネット統合データベースのカテゴリー カテゴリー bget bfind blink brite 数 内訳 1. KEGG 18 KEGGを構成するコアデータベース 2. ミラーしているDB >16 RefSeq, UniProt 等の主要 DB 3. 検索可能な外部 DB 2 INSDC(DDBJ/GenBank/EMBL), InterPro 4. リンクのみの外部 DB >500 www.genome.jp/dbget/linkdb.html 参照 5. PubMed 1 ( 注 )bget: エントリー取得 bfind: キーワード検索 blink: リンク検索 brite: 機能階層検索 2 医薬品 化合物データバンク開発医薬品および化合物情報について JAPIC が提供する医薬品添付文書情報のうち 医療用医薬品に関するものをゲノムネット医薬品データベース第 1 版として平成 1 9 年 9 月 1 日に公開し さらに一般用医薬品に関するものも含めたバージョンを第 2 版として平成 20 年 1 月 28 日に公開した ( 表 2 にアクセス数を 図 5 に概略を示した ) 医療用医薬品データベースと KEGG DRUG 中の対応する医薬品へのリンク付けを行い 医薬品の名称 化学構造 薬効 ターゲット情報との統合を実現した また 参考文献のうち可能なものについては PubMed や J-STAGE へのリンク付けも行っている 表 2. ゲノムネット医薬品データベース (http://www.genome.jp/kusuri/) のアクセス数 アクセス数ユニークIP 数 2007 年 10 月 41,622 699 2007 年 11 月 55,943 1,126 2007 年 12 月 57,035 2,221 2008 年 1 月 95,870 3,614 2008 年 2 月 393,331 9,764 2008 年 3 月 267,892 10,478 ( 注 ) ゲノムネット全体の月単位のユニークIP 数は 200,000で その15% が国内からである 従って国内利用者の約 1/3がゲノムネット医薬品データベースを利用していることになる 8

図 5. ゲノムネット医薬品データベースの概略 医薬品 化合物データベースに関しては 有料サービスが多く 無料サービスの場合でも知財がからむ場合が多い JAPIC も本プロジェクトのデータベースとしてサービスするにはライセンス契約が必要である したがって 多様なデータベースの統合を進めるには 上記 LinkDB を用いたリンク情報を中心とした形態が有効であると考えられるため 今後は LinkDB を中心とした統合化を進める予定である (3) プロジェクトの総合的推進プロジェクトの推進にあたっては 中核機関である情報 システム研究機構の全体戦略の下 中核機関と日頃より連携して進めてきた 本プロジェクトの開始時点において本学は Google-like な全文検索システム化を含む分子情報統合データベースシステムの構築を担当することとしていたが 中核機関との協議の中で中核機関と本学の役割分担を整理し 中核機関では全文検索などの一般的技術の開発を担当することとし 本学では 化合物 医薬品を中心とする分子情報を利用した検索機能の高機能化を主に担当して統合データベースを構築することとした このため来年度以降に予定していた革新的なウェブ検索システムの第 2 段階以降の開発は中止することとなった また 中核機関との連携を図りつつ進めてきたほか 日頃から頻度高く技術検討委員と意見交換を行い 助言を得ることができた 特に 京都大学薬学研究科の業務協力者である藤井信孝教授からは JAPIC との協力関係構築において非常に多大な助言を得ることができ プロジェクトの推進に資することができた また 大阪大学蛋白質研究所の中村春木教授からは 化合物 2 次元構造データを 3 次元立体構造化したデータベース LIGAND BOX との連携について助言を得ることができ 化合物 医薬品データベースの統合化推進に資することができた 本プロジェクトは主 9

に京都大学化学研究所で推進しているが 薬学研究科の金子周司教授とはライフサイエンス辞書を用いたゲノムネットの日本語化に関して緊密に連携することができた 本年度の成果については すべてゲノムネット統合データベースとして公開しており 中核機関の横断検索のインデクシング対象となっている 化合物データベースに関しては 上記 (2)2 に記述したように 知財がからむ場合が多いので 中核機関に知財を移譲する形での統合ではなく 相互リンクでの統合を進めている ゲノムネットには 1 日あたり 100 万件のアクセスと 2 万人の利用者があり 世界有数のバイオインフォマティクスサービスとなっている ゲノムネットを今後とも京都大学化学研究所バイオインフォマティクスセンターの事業として発展させるために 本年度はサーバーなどの設備投資 ソフトウェア開発と運用に重点投資を行った また 本データベースのより一般ユーザーへの利用拡大と普及のために 平成 20 年 1 月にはゲノムネットデータベース利用講習会を開催した 講習会参加者からは 特に反応中の化合物構造変化パターンに関するコメントを得ることができ RPAIR データベースや e-zyme の改良に資することができた また サイボウズを用いたゲノムネットフィードバックのページを通して 利用者からの意見収集 質問応対を行っている 2.3 成果の外部への発表 (1) 論文寄稿和誌 医薬品の統合データベース 金久實他 蛋白質核酸酵素 52 12 1486-1491 (2) 講演国内 医薬品情報統合データベースの開発 伊藤真純他 BMB2007 2007.12.11-15 ポスター発表 (3) データベースの公開ゲノムネット医薬品データベース http://www.genome.jp/kusuri/ 研究の最先端と医療の現場さらには一般社会をつなぐ日本語の医薬品統合データベース JAPIC 医薬品添付文書情報 ( 医療用医薬品 13,973 件 一般用医薬品 12,658 件 平成 20 年 4 月現在 ) を検索可能 KEGG DRUG の構造情報やターゲット情報と統合している また PubMed や J-STAGE など文献データベースへのリンクも付加している 医療用医薬品は平成 19 年 9 月 一般用医薬品は平成 20 年 1 月より公開している DBGET/LinkDB: ゲノムネット統合データベース検索システム http://www.genome.jp/ja/gn_dbget_ja.html 平成 18 年度までに DBGET/LinkDB として開発してきたシステムを 日本語 10

支援環境の整備 LinkDB の拡張 新たな検索システムの開発という観点から改良したもの 全データベース一括検索と外部データベースを含む LinkDB 検索を平成 19 年 7 月に 日本語支援環境を平成 19 年 10 月に公開した (4) データベース基盤システム ツールの公開 SIMCOMP http://www.genome.jp/tools/simcomp/ 類似化合物検索システム グラフ比較に基づいた精度の高い類似度計算を実現している 検索速度に問題があったため 平成 19 年度には高速化についての調査を行い 平成 20 年度に高速化を実現する e-zyme http://www.genome.jp/tools/e-zyme/ 化学構造変化に基づく反応予測システム 基質と生成物を与えると その間の反応パターンを予測 EC 番号との対応付けなどを行う テンプレートとなる反応パターンの充実が課題であったため 平成 20 年度に反応パターンデータベースを整備し 化合物データとリンクさせる また 平成 21 年度以降に 複数反応ステップの予測システムを実現する KCaM http://www.genome.jp/tools/kcam/ 糖鎖類似構造検索システム 糖鎖に特徴的な木構造のための動的計画法を実装したシステムであり ユーザーインタフェースを他のシステムと統一した 今後は 以下の糖鎖構造予測システムとの連携を計画している GECS http://www.genome.jp/tools/gecs/ 遺伝子発現データから化合物構造を予測するシステム ゲノム情報と化合物情報を結ぶためのシステムとして開発している 平成 19 年度は糖転移酵素のリストから合成可能な糖鎖構造を予測するシステムを開発し 平成 20 年 4 月に第 1 版を公開した 今後は ユーザーインタフェースなどを改良するとともに 脂質など他の化合物のためのシステムを開発し統合する 2.4 活動 平成 20 年 1 月 30 日 31 日ゲノムネットデータベース講習会発表者 : 五斗進他 開催場所 : 東京大学概要 :PC を用いた実習形式での講習会 ホームページ上で一般から 20 名の参加 11

者を募った 大学 公的機関の研究所 企業から幅広く集まった 12

2.5 実施体制 研究項目担当機関等研究担当者 1. 共通基盤技術開発 (1) 知識処理技術開発 (2) ウェブ開発技術 京都大学化学研究所京都大学化学研究所京都大学化学研究所京都大学化学研究所 金久實山西芳裕馬見塚拓瀧川一学 2. 統合データベース開発 運用 (1) 統合データベース開発 (2) 医薬品 化合物データバンク開発 京都大学化学研究所京都大学化学研究所京都大学大学院薬学研究科京都大学化学研究所京都大学化学研究所京都大学化学研究所京都大学化学研究所 五斗進伊藤真純金子周司服部正泰時松敏明藤田征志奥田修二郎 3. プロジェクトの総合的推進 京都大学化学研究所 金久實 注 1. : 課題代表者 : サブテーマ代表者 注 2. 本業務に携わっている方は 全て記入 13