2017年度研究開発実施報告書(統合化推進プログラム_栗栖チーム)

Similar documents
この講義でやること PDBjのwebページの復習 webページのデータの元になっているデータ形 式の解説 上記の演習 2

トーゴーの日シンポジウム 2016 東大弥生講堂, 5 October 2016 生命科学におけるデータサイエンスの課題と PDB 中村春木 大阪大学蛋白質研究所

Microsoft PowerPoint - PSSJ_2019神戸(栗栖)

スライド 1

PowerPoint Presentation

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

Microsoft PowerPoint - 統合DBシンポ090612rev1.ppt

Microsoft Word - tutorial3-dbreverse.docx

PDB の 新 フォーマット 金城玲 日本蛋白質構造データバンク (PDBj) 大阪大学蛋白質研究所 1

JST _ _nakamura2015_YR

「蛋白質構造データバンクのデータ検証高度化と統合化」KO-MTG発表資料

<4D F736F F D AA8E5291E58A778FEE95F B835E B CC91808DEC95FB9640>

1 本ドキュメントが想定するネットワーク環境 本ドキュメントが想定するネットワーク環境を図に示す 各種モダリティで撮像した DICOM データは DICOM サーバに送信され データベースに登録される クライアントパソコンには InVesalius がインストールされている これらの機器はすべてネッ

スライド 1

ウェブサービスとは WWWを介してデータの取得 解析などをサー バ側で行うサービス 人が直接使うことは意図されていない プログラム等を使って大量に処理できる(単純) 作業を意図している SOAP, REST

Sharing the Development Database

PDBj : : 1

Microsoft PowerPoint - PDBjing実習.ppt

平成17年度大学院 知識システム特論

Exfront4.1.0リリースノート

OECD QSAR Toolbox活用マニュアルv1.0

MolDesk Basic Ver を使用

(Microsoft PowerPoint - WQ21JDEadapter\215\\\220\254\216\350\217\207\217\221_ ppt)

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

CourseDescriptions_

(Microsoft PowerPoint -

Oracle Business Intelligence Standard Edition One のインストール

ソフト活用事例③自動Rawデータ管理システム

蛋白質科学会アーカイブ RNA/蛋白質複合体の単結晶が得られるまで〜Exportin-5/RanGTP/pre-microRNA複合体を例として〜

Microsoft Word - CBSNet-It連携ガイドver8.2.doc

Microsoft Word - WebClass Ver 9.08f 主な追加機能・修正点.docx

IMI情報共有基盤 「表からデータモデル」 データ変換のみを行う方向け画面説明

研究開発の概要のイメージ ①画像 音声 映像情報の分析技術 周辺コンテンツや他情報源から収集したテキスト情報の分析 画像特徴量分析による信憑性検証 Web画像の典型度 過不足性 W b画像の典型度 過不足性 整合性の分析 映像 音声の偏り分析や 映像 音声の偏り分析や 視聴者評価情報の分析 Webア

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 OneNote Online を開く ノートブックを開く ノート ( セクション ) を作成する... 11

<4D F736F F D AA96EC82CC837C815B835E838B C6782CC82BD82DF82CC92B28DB F18D908F912E646F63>

NGSデータ解析入門Webセミナー

Microsoft Word - CBESNet-It連携ガイドver8.1.doc

Microsoft Word - RefWorksコース( _.doc

{{}}

KS_SSO_guide

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

果を確認します クロスワープ CONTENTS SECURITY サービスが検索 監視の対象とする 百度文庫 (URL: ) は 検索エンジンを運営する中華人民共和国の 百度社 ( バイドゥ社 ) が提供しているファイル共有 保存用のプラットフォームで

1 研究開発のねらい 糖鎖は 細胞表面のタンパク質や脂質に結合し 血液型の決定 細胞接着 抗原抗体反応 ウイルス感染などの生体反応で重要な役割を果たす生体分子である 糖鎖による多様な生物学的機能のうち 糖鎖結合タンパク質による糖鎖の特異的認識があり 糖鎖 - タンパク質間の相互作用の解析に糖鎖アレイ

ProQuest PPT Styles

第2章 生物有機化学実験及び実験法

目次 1. VISCANA 機能の改良 VISCANA ウィンドウ外観 フラグメント番号表示 クラスタリング配列の選択機能 データ読込 保持仕様の追加 修正 CSV ファイル出力機能

目次 目次 1. はじめに 2. ログイン ID とアクセス権限 3. 前提条件 4. 事前準備 ( ログイン ) 4-1. ログイン画面アクセス 4-2. ログイン 4-3. ログイン後 5. ホーム画面 6. 特記すべき画面操作 6-1. カレンダー表示 6-2. メニュー表示 6-3. クリッ

< 提供を開始するソリューション例 > Scorpion Scorpion は DesertSci 社がスイス Roche 社との共同研究に基づいて開発したものです Scorpion で用いられるネットワーク モデルは 分子間相互作用をネットワークとして記述し タンパク質 リガンド相互作用が周りの環

メタデータ管理システム

FISHERIES SCIENCE が閲覧できる電子ジャーナルサイト (Blackwell Synergy) の利用と登録方法 塩出大輔東京海洋大学海洋生物資源学科 DAISU KE SHIODE Department of Marine Biosciences, Tokyo University

やってみようINFINITY-製品仕様書 品質評価表 メタデータ 編-

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

第 1 章 システムの概要 シラバスシステムとは 利用環境 留意事項 シラバスシステムの概念 役割 システムの利用イメージ... 4 第 2 章 基本操作

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

01. 申込者情報の登録各種集会の企画者 講演者 一般講演の講演者 聴講のみ ( 事前参加申込 ) の方全員に必要な手続きです STEP1 ログイン画面 種別 を選択してください ログイン情報入力画面が開きます 正会員 の場合会員 ID パスワードを入力し, 次のページへ進む ボタンをクリックしてく

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 ( その)(IE0 IEの場合 ) 7 6 ( その)(IE0 IEの場合 ) 8 7 (IE9

PowerPoint プレゼンテーション

(Microsoft PowerPoint - HP\227pWASABI\217\320\211\356\216\221\227\277.ppt)

Microsoft Word - XOOPS インストールマニュアルv12.doc

1. 背景血小板上の受容体 CLEC-2 と ある種のがん細胞の表面に発現するタンパク質 ポドプラニン やマムシ毒 ロドサイチン が結合すると 血小板が活性化され 血液が凝固します ( 図 1) ポドプラニンは O- 結合型糖鎖が結合した糖タンパク質であり CLEC-2 受容体との結合にはその糖鎖が

2 目次 1 はじめに 2 システム 3 ユーザインタフェース 4 評価 5 まとめと課題 参考文献

目次 1. 回答作成手順 2 2. ツールの起動 3 3. 一般情報の入力 6 4. 成分表の入力 9 5. 依頼者情報の入力 エラーチェック XMLファイルの作成 動作設定 ( 任意 ) ( ご参考 ) 各種シートのボタン機能 ( ご参

ProQuest PPT Styles

<4D F736F F D B98AE091538D91936F985E DEC837D836A B>

PowerPoint プレゼンテーション

Microsoft Word - J-jdev_dba_db_developers.doc

動作環境設定

Oracle SQL Developer Data Modeler

D5-2_S _003.pptx

VB実用Ⅲ⑩ フリーデータベースⅡ

平成 26 年度研究開発実施報告書 ライフサイエンスデータベース統合推進事業 統合化推進プログラム 研究代表者 [ 中村春木 ] [ 大阪大学蛋白質研究所 所長 / 教授 ] [ 蛋白質構造データバンクの高度化と統合的運用 ] 1

Trend Micro Security for Mac 持込 PC 用インストールマニュアル [Mac OS 用 ] 作成 :2018 年 12 月 改訂 :2019 年 2 月 情報環境機構

<4D F736F F D208AC888D B836A F C91808DEC837D836A B81698AC7979D8ED A E646F6

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) 信頼済みサイトへの登録 (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 リストを出力する為の設定 (IE0 IEの場合 ) 7 6 ( その)(

1. はじめに 本書は スプリット演算器 MFS2 用コンフィギュレータソフトウェア の取扱方法 操作手順 注意事項などを説明したものです Windows の操作や用語を理解している方を前提にしています Windows の操作や用語については それぞれのマニュアルを参照してください 1.1. MFS

研究成果報告書

Microsoft PowerPoint - EMPro_ADS_co_design_draft.ppt [互換モード]

AJACS18_ ppt

Microsoft PowerPoint - 蛋白質科学会ランチョン2011_15min_001

2. Apple iphoto 1 Google Picasa 2 Calendar for Everything [1] PLUM [2] LifelogViewer 3 1 Apple iphoto, 2 Goo

プレス発表資料 平成 22 年 1 月 22 日独立行政法人防災科学技術研究所 JAXA 陸域観測衛星 だいち (ALOS) によるハイチ大地震 ( 仮称 ) の緊急観測画像を 相互運用 g サーバー より WMS 配信開始 独立行政法人防災科学技術研究所 ( 理事長 : 岡田義光 ) は 独立行政

インターネットファームバキグ 電子証明書ガイドブック ~証明書取扱手順編~ - 契約会社向け -(対応 OS :Windows 8)

データベースアクセス

KEGG_PATHWAY.ppt

FormPat 環境設定ガイド

V-CUBE One

B: サイトから参加 1) ブラウザからミーティングが開催されるコーポレートサイト URL にアクセスします 2) ミーティング一覧内の自分の参加するミーティングから [ 参加 ] をクリックします C: パーソナル会議へ参加 1) ブラウザからミーティングが開催されるパーソナル会議 URL にアク

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

SciFinder エラーへの対処法

プレス発表資料 平成 22 年 3 月 12 日独立行政法人防災科学技術研究所 JAXA 陸域観測衛星 だいち (ALOS) によるチリ大地震 ( 仮称 ) の緊急観測画像を 相互運用 g サーバー より WMS 配信開始 独立行政法人防災科学技術研究所 ( 理事長 : 岡田義光 ) は 独立行政法

UMIN INDICE Lower level data communication protocol for CDISC ODM規約

Trinity標準価格.xls

< 目次 > 1. ビジネスポータル初回ログイン手順について Arcstar IP Voice 開通後 最初にビジネスポータルにアクセスして 初期設定をしていただく手順についてご案内します 2. ログインとダッシュボード画面の表示メニュービジネスポータルにログインし ダッシュボード画面を表示するまで

PowerPoint プレゼンテーション

Microsoft PowerPoint - SCPJ.ppt [互換モード]

目次 ログインページ 3 成果公開申告 A 成果公開の予定のみを申告する場合ページ 4 B 成果公開の実績がすでにある場合ページ 7 申告内容更新 C 申告した内容を修正する場合ページ 16 D 事務局から修正依頼があった場合ページ 21 状況確認 E 認定状況の確認ページ 23 認定対象成果 が当

SQLインジェクション・ワームに関する現状と推奨する対策案

Microsoft Word - CiNiiの使い方.doc

Transcription:

ライフサイエンスデータベース統合推進事業 ( 統合化推進プログラム ) 研究開発実施報告書様式 研究開発実施報告 概要 研究開発課題名 開発対象データベースの名称 (URL) 研究代表者氏名 所属 役職 蛋白質構造データバンクのデータ検証高度化と統合化 日本蛋白質構造データバンク (PDBj) (https://pdbj.org) 栗栖源嗣 大阪大学蛋白質研究所教授 目次 1. 研究実施体制... 2 2. 研究開発対象とするデータベース ツール等... 3 (1) データベース一覧... 3 (2) ツール等一覧... 3 3. 実施内容... 4 (1) 本年度の研究開発計画と達成目標... 4 (2) 進捗状況... 5 4. 成果発表等... 9 (1) 原著論文発表... 9 1 論文数概要... 9 2 論文詳細情報... 9 (2) その他の著作物 ( 総説 書籍など )... 10 (3) 国際学会および国内学会発表... 10 1 概要... 10 2 招待講演... 10 3 口頭講演... 10 4 ポスター発表... 10 (4) 知的財産権の出願... 11 (5) 受賞 報道等... 11 5. 研究開発期間中に主催した活動 ( ワークショップ等 )... 11 1. 進捗ミーティング... 11 2. 主催したワークショップ シンポジウム アウトリーチ活動等... 12

1. 研究実施体制 グループ名 研究代表者または 主たる共同研究者 氏名 所属機関 役職名 研究題目 栗栖グループ 栗栖源嗣 大阪大学 教授 PDBおよびBMRBアーカイブの構築およ び高度化 統合化 藤グループ藤博幸関西学院大学 教授 ASH ビューアの開発 清水グループ (2017.10-18.3) 清水浩大阪大学 教授代謝工学への PDB の適用

2. 研究開発対象とするデータベース ツール等 (1) データベース一覧 主なデータベース No. 名称別称 略称 URL 1 Protein Data Bank PDB Archive https://pdbj.org その他のデータベース No. 名称 別称 略称 URL 1 Biological Magnetic Reso BMRB http://bmrbdep.pdbj.org nance Data Bank 2 ef-site 同左 https://pdbj.org/ef-site/ 3 ProMode elastic 同左 https://pdbj.org/promode-elastic/ 4 Molecule of the Month MoM https://pdbj.org/mom/ (2) ツール等一覧 No. 名称 別称 略称 URL 1 EM Navigator 同左 https://pdbj.org/emnavi/ 2 ASH 同左 https://sysimm.ifrec.osaka-u.ac.jp/ash_service/ 3 MolMil 同左 https://pdbj.org/help/molmil 4 ASH viewer 同左開発中のため非公開

3. 実施内容 (1) 本年度の研究開発計画と達成目標 1) 国際組織 wwpdb メンバーとしての蛋白質構造 (PDB) アーカイブの構築 データ検証 公開 本研究開発では,wwPDB の欧米のメンバーと協力し,PDBj(PDB Japan) および PDBj-BMRB が厳しい品質管理を行いつつ, 増加する一方の立体構造情報と NMR 実験情報に対応する. 具体的には, アノテータ の数を増やすことなく, 世界標準のデータベースとして継続的にデータ構築し公開する. 特に, 電子顕微鏡による構造解析例が急増しており,NMR による構造解析例を凌駕するに至った. 第 1 年次には,EM および NMR により解析された構造データの品質を検証する手法を wwpdb の欧米メンバーと協力して確立することに重点を置いて対応する. PDB 全データの品質管理のための検証レポートの拡充とセマンティック化を進める. 特に, 検証レポートの構築法がほぼ確立している X 線結晶構造解析のデータを先行して行う. 2) 他のデータベースとの統合化および高度化 2-1) PDB データを用いた 3D 構造同士の構造アラインメント サービス (ASH: Alignment of Structural Ho mologs) の高度化本年度は 開発のベースとなるビューアの骨格部分を Java で開発する. まず, ビューアを系統樹表示パネル, アラインメント表示パネル, 情報抽出パネルの3つのパネルから構成される形で設計する. 次に, メニューバーにファイル選択機能を持たせ, アラインメントファイル (FASTA 形式 ) と系統樹ファイル (Newic k 形式 ) を入力できるようにする. 読み込まれた分子系統樹の構文解析を行い, 各ノードに末端ノードからの平均距離を持たせ, それに基づいて 10 個程度のクラスタを自動同定できるようにする. 得られたクラスタ情報に基づき, 粗視化された系統樹を系統樹表示パネルに, 各クラスタに対応するアラインメントのコンセンサス配列を, アラインメント表示パネルに出力する. コンセンサス配列は,2019 年度導入予定の機能部位解析の手法の中の保存度の計算のいずれかをデフォルトとして, クラスタごとのサイトの保存度に基づく色分けの機能を持たせる. 機能部位解析の導入は上記のように 2019 年度実施予定であるが,Ku llback-leibler 情報量や相対 von Neumann エントロピーを利用した手法の実装の検討は, 本年度から実施する. また系統樹表示パネルに表示されている粗視化された系統樹の各ノードは,2018 年度開発のノードの圧縮 展開のために, マウスのクリックによるイベントを処理できるようにする. また, 次年度実施予定の各クラスタに含まれるタンパク質の情報の要約のため,FASTA ファイルの注釈行の構文解析を行えるようにするが, それと並行して注釈行に頼らずに RDF 化されたデータベースから必要な情報を取得する方法 (2020 年度実施予定 ) の検討も行う. 2-2) 各アミノ酸の蛋白質立体構造中における位置情報の自動アノテーションとその応用蛋白質分子内コンタクトの情報をデータベース化し, 既に運用されている PDBj Mine に統合 公開する計画で, 続いて同様のことを分子間コンタクト ( 蛋白質間相互作用 蛋白質 リガンド間相互作用など ) に対しても行う予定であった. しかし, 開発担当者が本プロジェクト期間中に海外に異動することが決まり, 蛋白質とリガンドに着目した統合化を選択して先に進める事とした 具体的には,(1)Chemical Compon ent Dictionary (CC) (2)Chemical Component Model (CC model) (3)Biologically Interesting M olecule Reference Dictionary (BIRD) との連携を図ることにした.

2-3) 統合化された NMR データベースおよび関連ツールの活用 NMR データベースの登録業務の自動化を図り, セキュリティおよびサーバ稼働状況の監視システムのプロトタイプを開発する. 具体的には, 現在,1 件辺りの登録業務平均時間は 2 3 時間であり, 登録者との通信業務, 更新作業はおおむね 2~3 時間を要している. これらを米国 BMRB( ウィスコンシン-マディソン大学 ) と協力して, 作業時間として現在の 75% になるよう簡略化 自動化する. NMR 構造座標, 実験データとの整合性に関する評価ツールを wwpdb との協力を通じて開発し, データの品質維持を客観評価可能な次世代技術について議論し, 開発およびツールとしての公開を進める. 国内企業との連携により,BMRB データベースを活用した自動解析支援ツールの試用を行う. 創薬研究へ利用できるパイプラインの構築と実際に応用可能であることを示す. 3) データベースの利用促進 人材育成 3-1) 利用者 研究者コミュニティとの連携および講習会等の開催 PDB の国内諮問委員会である大阪大学蛋白質研究所 蛋白質立体構造データベース専門部会 のメンバーに 度から企業研究者に入っていただき, 企業からの要望等を集める. また wwpdb Foun dation( 米国内の NPO 法人 ) の枠組みによる企業と wwpdb との連携を継続する. 学振 169 委員会に P DBj を代表するメンバーとして加わり, 企業ユーザの声を集める. 利用者 研究者向けのセミナーや講習会については, 他のデータベースとも協力し, 第 1 年次も All-in-o ne 講習会や学会年会中あるいは前後での利用講習会を実施する. これまでも参加してきたサイエンス アゴラの活動等, 一般社会人向けの生命科学におけるデータサイエンスの振興も積極的に実施する. 3-2) アノテータの育成 国際協力新たなアノテータ候補を非常勤として雇用し育成を図る. アノテータの教育については, 今後とも更新されていく OneDep 登録システムを活用した世界で同一の品質管理によるデータ登録を実施する必要があり, 国際連携による教育を進める. 具体的には,TV 会議による講習会と, 米国 RCSB-PDB あるいは欧州 EBI-PDBe での合同講習会へ参加する. (2) 進捗状況 1) 国際組織 wwpdb メンバーとしての蛋白質構造 (PDB) アーカイブの構築 データ検証 公開本研究課題の下で,PDBj および PDBj-BMRB が厳しい品質管理を行いつつ,wwPDB の欧米のメンバーと協力して, 増加する一方の立体構造情報と NMR 実験情報に対応した. 具体的には, 平成 29 年度中に PDB データ 2976 件 ( 内,X 線 2621 件,NMR117 件, 電子顕微鏡 120 件 [ 参考 : 平成 28 年度は 3 手法合わせて 2 387 件 ]),BMRB データ 107 件のデータセットを PDBj から新規公開した.wwPDB の欧米メンバーと協力して図 1. wwpdb 運営諮問会議開発したデータ登録システム (OneDep システム ) の高機

能化を進めた結果, 約 25% 増のデータ登録件数に対応して, アノテーターの数を増やすことなく世界標準のデータベースを構築し公開した 1). 平成 29 年度中に wwpdb 運営諮問会議を米国 Rutgers 大学において開催し, 引き続き OneDep システムの高度化を進め登録システムの更なる効率化を進めていくこととした ( 図 1). ここ数年, 電子顕微鏡による構造解析例が急増しており,NMR による構造解析例を凌駕するに至っている. 本年度期間中に, 電子顕微鏡マップのデータベースである EMDB との連携が議論され, 平成 30 年度中に wwpdb のメンバーの一員に正式に招聘されることを決定した. これにより,wwPDB の枠組みの下で, 電子顕微鏡構造についても検証レポートを実効図 2. 検証レポートの SPARQL 検索の例的に作成できる体制が整ったと言える. また, 合わせて wwpdb に新しいメンバーを加える際のルールを明文化し, 運用を開始することとした. PDB 全データの品質管理のための検証レポートの拡充とセマンティック化を進めた. 新たなオントロジー (wwpdb/owl) を加え,RDF 版 wwpdb Validation Report (wwpdb/rdf-validation) の作成のためのスタイルシートを作成した. 特に, 検証レポートの構築法がほぼ確立している X 線結晶構造解析のデータ 4) を先行して行い, プロトタイプでの確認を行った ( 図 2). 2) 他のデータベースとの統合化および高度化 2-1) PDB データを用いた 3D 構造同士の構造アラインメント サービス (ASH: Alignment of Structural Ho mologs) の高度化 非公開部分 ( 完成するまで公開しない ) アラインメントに基づく相同なタンパク質の配列 構造の比較解析は データの大量化のために困難に なってきている また 配列や構造情報に他のデータベースからの様々な情報をマッピングすることはデ ータの解釈やデータマイニングに重要な 意味を持つが 多様なデータベースから 必要な情報を抽出し配列と対応づける作 業もまた困難になっている 本計画では アラインメントと分子系統樹を粗視化して 表示し そこに RDF 化された種々のデー タベースから様々な情報を抽出し それを 上記の粗視化されたアラインメントや系統 樹の上にマッピングすることでタンパク質 の機能解析を支援するためのビューアを 開発した.度は,(1) 入力機能の 実装 (2) クラスタ同定機能の作成 (3) 表 示部分の作成 (4)SPARQL 検索機能の作 図 3. ビューアの構成 上部にメニューバーがある メニューバーは ファイル選択メニュー 配列解析メニュー 構造解析メニュー Web メニューの 4 つのメニューから構成される

成の4つを計画していたが, 当初計画からの変更点を中心に以下に進捗を報告する. まず ASH ビューアのベースとなる骨格部分を Java で開発した. 図 3に ASH ビューアの起動画面を示す 本年度実施計画 (1) 入力機能の実装について記す のキックオフミーティングにおいて系統樹を構築できた方が良いとのご意見を岩崎渉委員からいただいたので, 計画を変更し neighbor-joining 法でアラインメントから系統樹を構築できるようにした. そのため 本年度は Import Tree File の機能は実装していない 本年度実施計画 (2) クラスタ同定機能の作成および (3) 表示部分の作成について記す いずれも系統樹の作成に伴うので合わせて記述する 自動同定によるクラスタは必ずしもユーザの目的と合致するものではないので, 自動同定の方法の改良とともに File メニューの Import Cluster File から読み込まれるユーザ設定のクラスタ情報を利用できる方向での開発を行っていく予定である 最後に,(4) S PARQL 検索機能の開発結果について記す Java で SPARQL を使うためのパッケージ Jena を使って SPA RQL 検索を行えるようにした Web メニューは SPARQL と Scraping よりなるが Scraping は今回実装していないので SPARQL についてのみ記述する Web のプルダウンメニューから SPARQL を選択すると end point のテキストフィールドに endpoint を入力する Select Input File をクリックするとファイルチューザのウィンドウが開くのでそこから SPARQL クエリが記述されたファイルを選択する 下段パネルに SPARQL クエリを直接入力することもできる Select Output File は結果出力のファイルをファイルチューザから選択する機能を持たせる予定であったが 現在実装されておらず 結果は標準出力に出される ビューアから SP ARQL 検索ができることを確認したが, RDF 化されたデータの利用に関しては NBDC の山口敦子特任准教授から,NBDC で開発されているアプリケーションを組み込むことを提案いただいており, 現在その方向で検討を開始している そのため出力部分についてもそれに合わせて開発する予定である 本年度の実施計画は neighbor joining 法の実装や NBDC の RDF 化されたデータの利用などの変更はあったが ほぼ計画通り実施できた 2-2) 各アミノ酸の蛋白質立体構造中における位置情報の自動アノテーションとその応用 wwpdb が整理 公開している (1)Chemical Component Dictionary (CC) (2)Chemical Component Model (CC model) (3)Biologically Interesting Molecule Reference Dictionary (BIRD) を PDBj の基本データベースシステムである PDBj Mine (https://pdbj.org/mine) 3) に統合した これにより (1) InChI key や SMILES などの化合物情報に基づいて PDB エントリーを検索できるようになり (2)Cambri dge Structural Database (CSD) の ID と PDB の化合物の対応がつけられ (3) 抗生物質など生物学的に重要な化合物の情報と PDB エントリーの対応が容易に検索できるようになった 2-3) 統合化された NMR データベースおよび関連ツールの活用 NMR 実験データのパラメータは極めて豊富かつ複雑であり それらを整理して効率よく WEB ページで公開する事はユーザーにとって大きな利益となる PDBj-BMRB グループは既に開発した NMR-STAR フォーマットをそのデータ構造を既述するオントロジに相当する NMR-STAR dictionary に完全準拠させて XML 化を行いメタデータを含めた厳密な整合性の管理を自動化することを実現している これにより実験 NMR データ公開サイトページでは様々なフォーマットに変換したダウンロードサービス 2) JavaScript により視認性に優れた各登録エントリーに対する WEB ページの洗練化を行った これら NMR 実験データベースの登録 アノテーション 管理 公開に関するツール群の開発は, データ処理に掛かる時間を大

幅に削減する事に役立つと期待される. 米国 BMRB( ウィスコンシン-マジソン大学 ) をはじめとする wwp DB による国際協力関係において新ツール群の利用が推進され 特に NMR 実験データと登録された構造座標との整合性を評価するツールと解析ツールとデータベース間での相互交換を可能にする新しいフォーマット NEF コンバータツールの開発が公開フェーズに入り 平成 29 年度中に初期バージョンが各 w wpdb 拠点において実装された 3) データベースの利用促進 人材育成 3-1) 利用者 研究者コミュニティとの連携および講習会等の開催 PDBj の国内諮問委員会である大阪大学蛋白質研究所 蛋白質立体構造データベース専門部会 のメンバーに平成 29 年度から帝人ファーマ ( 株 ) の上村みどり氏に加わって頂いた. 平成 30 年 2 月 28 日に開催した専門部会において, 企業研究者の立場からコメントを頂き, 検証レポートの充実と更なる国際連携の重要性について助言を頂いた. また wwpdb Foundation( 米国内の NPO 法人 ) の枠組みによる企業と wwpdb との連携を継続し, 今年度は X 線装置メーカである ( 株 ) リガクに企業サポーターとして参画して頂くことになった. 代表の栗栖が, 学振 169 委員会に PDBj を代表するメンバーとして加わり, 定例の委員会に出席して企業ユーザからの声を集めた. 特に169 委員会において, 中性子線構造解析のデータについて検証レポートの不備が指摘された. 該当する解析例は非常に少ないが,wwPDB の枠組みの下で中性子線構造解析の検証レポートの今後の取り扱いについて議論を開始した. 利用者 研究者向けのセミナーや講習会については,DDBJ と協力し All-in-one 講習会を開催した. データ登録者の学術団体である日本結晶学会と日本蛋白質科学会の年会中に, ランチョンセミナーを開催し, データ登録への継続的な協力と, データ受付方針の変更点などを説明し理解していただいた. また, データ利用者の学術団体である日本生物物理学会と生命医薬情報学連合大会においてランチョンセミナーを開催し, 利用者の声をアンケートの形で集めた. 図 4. サイエンスアゴラ 2017 での VR による PDB 大阪大学いちょう祭 (4 月 30 日 ) とサイエンス アゴデータの可視化体験コーナーラ2017(11 月 24 26 日 ) に参加し ( 図 4), 一般社会人向けの生命科学におけるデータサイエンスの振興のため, 積極的な啓蒙活動を行った. 3-2) アノテータの育成 国際協力新たなアノテータ候補を非常勤として雇用し育成したが, 産休 育休のため新アノテータによる実際のデータキュレーションへの貢献は平成 30 年度以降となった. 効率的なデータ登録のため頻繁に更新される OneDep 登録システムを完全に使いこなすため, アノテータの能力維持は重要な課題である. 国際協力 図 5.OneDep のリーフレット ( 日本語版 )

による世界で同一の品質管理によるデータ登録を担保するため,Skype を用いた OneDep アノテータ会議を定期的に実施し, 国際連携によるアノテータ教育を進めた.Face-to-Face 会議も実施しており,2017 年 5 月に英国 EBI で, 同年 11 月に米国 Rutgers 大学で OneDep 開発者会議を開催して, PDBj から 1 名のアノテータを派遣し今後の方向性と問題点を議論した. OneDep 登録用サイトがより正しく利用されるように, 日本語, 韓国語, 中国語 ( 簡体字および繁体字 ) によるリーフレット ( 図 5) を作成し, 関連する国際会議 (19 th IUPAB Congress, 24 th IUCr congress, 5 th A PPA conference) や国内学会 ( 日本結晶学会 ) で配布して宣伝に務めた. 4. 成果発表等 (1) 原著論文発表 1 論文数概要 種別 国内外 件数 発行済論文 国内 ( 和文 ) 1 件国際 ( 欧文 ) 5 件 未発行論文 国内 ( 和文 ) 0 件 (accepted, in press 等 ) 国際 ( 欧文 ) 0 件 2 論文詳細情報 1. Young JY, Westbrook JD, Feng Z, Peisach E, Persikova I, Sala R, Sen S, Berrisford JM, Swami nathan GJ, Oldfield TJ, Gutmanas A, Igarashi R, Armstrong DR, Baskaran K, Chen L, Chen M, Clark AR, Di Castanzo L, Dimitropoulos D, Gao G, Ghosh S, Gore S, Guranovic V, Hendrickx PMS, Hudson BP, Ikegawa Y, Kengaku Y, Lawson CL, Liang Y, Mak L, Mukhopadhyay A, Nara yanan B, Nishiyama K, Patwardhan A, Sahni G, Sanz-Garcıá E, Sato J, Sekharan MR, Shao C, Smart OS, Tan L, van Ginkel G, Yang H, Zhuravleva MA, Markley JL, Nakamura H, Kurisu G, Kleywegt GJ, Velankar S, Berman HM, Burley SK. Wolrdwide Protein Data Bank biocuration supporting open access to high-quality 3D structural biology data, Database (Oxford), Jan 1, 2018 (DOI:10.1093/database/bay002.) 2. Schober D, Jacob D, Wilson M, Cruz JA, Marcu A, Grant JR, Moing A, Deborde C, de Figueire do LF, Haug K, Rocca-Serra P, Easton J, Ebbels TMD, Hao J, Ludwig C, Gunther UL, Rosato A, Klein MS, Lewis IA, Luchinat C, Jones AR, Grauslys A, Larralde M, Yokochi M, Kobayashi N, Porzel A, Griffin JL, Viant MR, Wishart DS, Steinbeck C, Salek RM, Neumann S. nmrml: A Community Supported Open Data Standard for the Description, Storage, and Exchange of NMR Data, Anal Chem. Vol.90, No.1, pp.649-656, 2017 (DOI: 10.1021/acs.analchem.7b02795. Epub 2017 Dec 14. 3. Kinjo AR, Bekker GJ, Wako H, Endo S, Tsuchiya Y, Sato H, Nishi H, Kinoshita K, Suzuki H, K awabata T, Yokochi M, Iwata T, Kobayashi N, Fujiwara T, Kurisu G, Nakamura H. New tools and functions in data-out activities at Protein Data Bank Japan (PDBj). Protein Science. Vol. 27, No.1, pp.95-102, 2018 (DOI:10.1002/pro.3273) 4. Gore S, Garcıá ES, Hendrickx PMS, Gutmanas A, Westbrook JD, Yang H, Feng Z, Baskaran K,

Berrisford JM, Conroy M, Hudson BP, Ikegawa Y, Kobayashi N, Lawson CL, Mading S, Mak L, Mukhopadhyay A, Oldfield TJ, Patwardhan A, Peisach E, Sahni GS, Sekharan MR, Sen S, Shao C, Smart OS, Ulrich EL, Yamashita R, Quesada M, Young JY, Nakamura H, Markley JL, Berm an HM, Burley SK, Velankar S, Kleywegt GJ, Validation of the Structures in the Protein Data Bank, Structure, Vol.25, pp.1916-27. 2017 (DOI: 10.1016/j.str.2017.10.009.) 5. Burley SK, Kurisu G, Markley JL, Nakamura H, Velankar S, Berman HM, Sali A, Schwede T, T rewhella J. PDB-Dev: a Prototype System for Depositing Integrativ/Hybrid Structural Models. Structure, 2017, 25, 1317-1318, doi: 10.1016/j.str.2017.08.001. (2) その他の著作物 ( 総説 書籍など ) 1. 小林直宏 生体系 NMR の解析ツール ( 機械学習と自動化 ) 日本核磁気共鳴学会誌 Vol.8 2017 (3) 国際学会および国内学会発表 1 概要 種別 国内外 件数 招待講演 国内 0 件国際 2 件 口頭発表 国内 1 件国際 1 件 ポスター発表 国内 4 件国際 2 件 2 招待講演 国際 1. Kurisu G, Ligand representation and validation in the Protein Data Bank, International Life Science Integration Workshop, Tokyo, 2018/3/6 2. Kurisu G, Small molecule ligand/drug representation and validation in the Protein Data Ban k, 24 th International Union of Crystallography Congress, Hyderabad, 2017/8/22 3 口頭講演 国内 1. 栗栖源嗣, 蛋白質構造データバンクのデータ検証高度化と統合化, トーゴーの日シンポジウム 2017,2 017/10/4 国際 1. Kurisu G., The Protein Data Bank Japan(PDBj): A Partner of the wwpdb Accepting Structur e Depositions through One Dep Syste,International Symposium on Establishment of Structu ral Biology Network in Asia and Oceania, 新竹 台湾,2017/12/6-7, 4 ポスター発表

国内 1. 栗栖源嗣, 蛋白質構造データバンクのデータ検証高度化と統合化, トーゴーの日シンポジウム 2017,2 017/10/4-5 2. 小林直宏,PDBj-BMRB における統合化データベースの取り組み : 高度な WEB 検索表示機能への応用, トーゴーの日シンポジウム 2017,2017/10/4-5 3. 藤博幸 工藤高祐 山下鈴子 ASHViewer の開発 トーゴーの日シンポジウム 2017 東京大学弥生講堂 2017/10/4-5 4. 鈴木博文, 川端猛, 栗栖源嗣, 中村春木, クライオ EM マップ及び多階層構造を対象とした状類構造検索サービス Omokage 検索 の改良, 第 55 回日本生物物理学会,2017/9/19-21 国際 1. Kobayashi N, Nagata T, Kojima C, Fujiwara T., "Highly automated NMR signal assignments u sing peak-noise recognition assisted by Deep Neural Networks", Gordon Research Conferenc e,sunday River USA,2017/6 2. Kinjo AR, Bekker GJ, Suzuki H, Tsuchiya Y, Kawabata T, Ikegawa Y, Kurisu G, Nakamura H. Protein Data Bank Japan (PDBj): updated semantic web services and tools for large struct ures, 19th IUPAB congress, Edinburgh,2017/7/16, (4) 知的財産権の出願 該当なし (5) 受賞 報道等 該当なし 5. 研究開発期間中に主催した活動 ( ワークショップ等 ) 1. 進捗ミーティング 年月日 名称 場所 参加人数 目的 概要 PDBj 開発者会議 ( 非公開 ) 4 月 1 日 ~2018 年 3 月 31 日 ( 毎週開催 ) 4 月 1 日 ~2018 年 3 月 31 日 ( 隔週開催 ) 4 月 1 日 2018 年 3 月 31 日 ( 隔月開催 ) PDBj Primary Annotat or s meeting ( 非公開 ) 大阪大学蛋白質研究所構造解析研究棟 4 階セミナー室 大阪大学蛋白質研究所構造解析研究棟 4 階セミナー室 10 人研究進捗報告のためのミーティング 14 人同上 wwpdb PI ミーティング Skype 4 人 wwpdb を構成するデータベ ースの各 PI による方針決定 会議

2. 主催したワークショップ シンポジウム アウトリーチ活動等 年月日 名称 場所 参加人数 目的 概要 4 月 30 日 大阪大学いちょう祭 大阪大学蛋白質研究所 60 人 一般向け蛋白質立体構造の展示および解説 5 月 27 日 All-in-one 合同講習会 2017 三島市文化会館 45 人 学生及び研究者を対象とした PDBjサービスの紹介 6 月 22 日 第 17 回日本蛋白質科学会年会 PDBjランチョンセミナー 仙台国際センター 100 人 学会参加者に向けた PDBjとサービスの紹介 9 月 21 日 9 月 27 日 11 月 24-26 日 11 月 24 日 12 月 6-9 日 2018 年 2 月 20 日 2018 年 3 月 27 日 第 55 回日本生物物理学会年会 PDBjランチョンセミナー第 6 回生命医薬情報学連合大会 PDBjランチョンセミナーサイエンスアゴラ 2017 日本結晶学会 H29 年度年会 PDBjランチョンセミナー ConBio2017 データベース展示企画ブース出展及びフォーラム講演 PDBj&BINDS 合同講習会 日本薬学会 PDBj ランチョンセミナー 熊本大学黒髪地区 100 人学会参加者に向けた PDBj とサービスの紹介 北海道大学 80 人 学会参加者に向けた PDBjと サービスの紹介 テレコムセンター ( 東京都 ) JMS アステールプラザ ( 広島市 ) 神戸国際展示場 大阪大学銀杏会館 金沢県立音楽堂 750 人子供 中高生を含む一般参加者に向けた蛋白質立体構造の展示 解説等 80 人学会参加者に向けた PDBjとサービスの紹介 100 人学会参加者に向けた PDBj とサービスの紹介 40 人大学院生及び研究者を対象に PDBj 及び BINDS の事業 サービス紹介と ツールの活用方法の紹介 150 人学会参加者に向けた PDBjとサービスの紹介 以上

別紙既公開のデータベース ウェブツール等 No. 正式名称別称 略称概要 URL 公開日状態分類関連論文 1 Protein Data Bank PDB Archive 生体高分子の立体構造データベー https://pdbj.or ス,wwPDBと協力して構築,RDF g を開発, 公開 2002/4/1 維持 発展 データベース等 本紙論文リストの文献番号 4-2-1 2 Biological Magnetic Resonance Data Bank BMRB 生体高分子の化学シフト, 緩和データ, 相互作用データ等の NMR の実験データのデータバンク http://bmrbde p.pdbj.org 2011/4/1 維持 発展 データベース等 本紙論文リストの文献番号 4-2-2 3 ef-site 同左 蛋白質の分子表面の形状と物性 ( 静電ポテンシャルと疎水性度 ) を機能部位情報と結合したデータベース. 維持 更新のみ https://pdbj.or g/ef-site/ 2002/3/1 維持 発展 データベース等 本紙論文リストの文献番号 4-2-3 4 ProMode elastic 同左 二面角を変数とする基準振動解析プログラムによって計算された蛋白質のダイナミクス データベース. 維持 更新のみ. https://pdbj.or g/promodeelastic/ 2003/4/1 維持 発展 データベース等 本紙論文リストの文献番号 4-2-3 5 Molecule of the Month MoM RCSB-PDB より毎月提供されている分子解説記事 Molecule of the Month を日本語に訳したもの. 社会で話題となっている内容に関わる分子を PDB から選び, 機能と構造に関して解説. 維持 更新のみ. https://pdbj.or g/mom/ 2008/4/1 維持 発展 データベース等 6 EM Navigator 同左 生体分子や生体組織の 3 次元電子顕微鏡データ (EMDB) 閲覧用 web site https://pdbj.or g/emnavi/ 2007/5/1 維持 発展ツール等 7 ASH 同左 8 Molmil 同左 PDB データを基にした構造アラインメント インターネット上の web 環境で稼働する JavaScript による分子構造ビューア https://sysimm.ifrec.osakau.ac.jp/ash_serv ice/ https://pdbj.or g/help/molmil 維持 発展ツール等 2014/9/1 維持 発展ツール等 本紙論文リストの文献番号 4-2-3