Publishing BioMagResBank data derived from NMR

Similar documents
この講義でやること PDBjのwebページの復習 webページのデータの元になっているデータ形 式の解説 上記の演習 2

Microsoft PowerPoint - PDBjing実習.ppt

Microsoft PowerPoint - 蛋白質科学会ランチョン2011_15min_001

Microsoft PowerPoint - PSSJ_2019神戸(栗栖)

AJACS18_ ppt

PDB の 新 フォーマット 金城玲 日本蛋白質構造データバンク (PDBj) 大阪大学蛋白質研究所 1

ウェブサービスとは WWWを介してデータの取得 解析などをサー バ側で行うサービス 人が直接使うことは意図されていない プログラム等を使って大量に処理できる(単純) 作業を意図している SOAP, REST

平成17年度大学院 知識システム特論

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

PowerPoint Presentation

国立遺伝学研究所におけるDNAデータバンク:DDBJ

Chap. 1 NMR


PDBj : : 1

yakugaku-kot.ppt

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

Microsoft Word _abstract_kasai_ikeya2_tk.docx

PowerPoint Presentation

KEGG_PATHWAY.ppt

Microsoft Word - PubMed

メタデータスキーマレジストリ MetaBridge の概要

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

WebAPI 及びデータフォーマット (DC-NDL) の概要 国立国会図書館電子情報部 電子情報サービス課 1

スライド 1

Microsoft PowerPoint - Cambridge Books Online ユーザーマニュアル

Microsoft PowerPoint - 最終_図書館TA 黒木 Journal of citation Reports.ppt

Microsoft PowerPoint - 理研豊田_JST統合DB資料

活用が広がる 共通語彙基盤 (IMI) イベント 技術セッション 公園への応用 加藤文彦 国立情報学研究所 2016 年 6 月 3 日

CBRC CBRC DNA

目次 1 はじめに 稼働環境 GUI の起動 画面構成 メニュー Google Map 検索データ一覧 データの検索 出典情報の確認 検索領域の指定と

120126_RRR_jp.pptx

intra-mart Accel Platform — OData for SAP HANA セットアップガイド   初版  

Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

<95DB8C9288E397C389C88A E696E6462>

AJACS_komachi.key

KEGG.ppt

ITdumpsFree Get free valid exam dumps and pass your exam test with confidence

別添 2 SQL インジェクション ぜい弱性診断で最低限行うべき項目 1 ( ' ( 検索キー )''-- ( 検索キー ) and 'a'='a ( 検索キー ) and 1=1 は最低限 行うこと ) OS コマンドインジェクション 2 (../../../../../../../bin/sle

Contents Logging in 3-14 Downloading files from e-ijlp 15 Submitting files on e-ijlp Sending messages to instructors Setting up automatic

untitled

(Microsoft PowerPoint -

Microsoft PowerPoint - Tutorial_2_upd.ppt

37-4.indd

Bluemix いつでもWebinarシリーズ 第15回 「Bluemix概説(改訂版)」

FMO法演習

いるが それら Wiki 上でのデータは構造化されておらず 上記で述べた複雑さによ る問題がある 本プロトタイプではこの問題を解決する いくつかの解を提示してい る 図 1 スナップショット : ニーズを満たす結果の推薦 サービス対象をモンスターハンターに絞ったことにより 各行動に対応する述語に対し

Oracle Business Intelligence Standard Edition One のインストール

Jupyter Notebook を活用したプログラムライブラリ構築の検討 吹谷芳博 1, 藤澤正樹 1 ( 1 あすか製薬株式会社 ) Examination of the program library construction using Jupyter Notebook ASKA Pharm

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

修士論文予稿集の雛型

1_alignment.ppt

XML基礎

Blue Asterisk template

アジェンダ オープンデータについて オープンガバメント セマンティック Web 技術 (RDF,SPARQL) RDF とは RDF の表現形式 : タートル,RDFa, マイクロデータ RDF グラフへの問い合わせ :SPARQL 利用環境 (SPARQL Timeliner,SparqlEPCU

スライド 1

FISHERIES SCIENCE が閲覧できる電子ジャーナルサイト (Blackwell Synergy) の利用と登録方法 塩出大輔東京海洋大学海洋生物資源学科 DAISU KE SHIODE Department of Marine Biosciences, Tokyo University

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

Microsoft Word - Chap17

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる


直接 Reports & Statistics タブへの移動も可能です A. Publication Finder の統計を取得する Publication Finder Reports 1 Publication Finder タブが選択されていることをご確認下さい 2 下記項目を入力して下さい

PowerPoint プレゼンテーション

使える! IBM Systems Director Navigator for i の新機能


Microsoft Word - note02.doc

untitled

<4D F736F F F696E74202D208CC591CC944D95A890AB834E D322D352D325B93C782DD8EE682E890EA97705D>

PowerPoint プレゼンテーション

OSSTechプレゼンテーション

An Automated Proof of Equivalence on Quantum Cryptographic Protocols

Microsoft PowerPoint _SINET_cloud

講演タイトル

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

<4D F736F F F696E74202D208A778F708FEE95F197AC92CA82F08EC08CBB82B782E98B5A8F E97708B5A8F70816A5F94D196EC8D758E742E >

トーゴーの日シンポジウム 2016 東大弥生講堂, 5 October 2016 生命科学におけるデータサイエンスの課題と PDB 中村春木 大阪大学蛋白質研究所

9 WEB監視

平成28年度スーパーコンピュータ利用報告書


HIS-CCBASEver2

連絡先

C3 データ可視化とツール

1 Web [2] Web [3] [4] [5], [6] [7] [8] S.W. [9] 3. MeetingShelf Web MeetingShelf MeetingShelf (1) (2) (3) (4) (5) Web MeetingShelf

Microsoft PowerPoint - citation reports11_7_学内用.ppt


KNOB Knoppix for Bio Itoshi NIKAIDO

& Vol.5 No (Oct. 2015) TV 1,2,a) , Augmented TV TV AR Augmented Reality 3DCG TV Estimation of TV Screen Position and Ro

PowerPoint プレゼンテーション

UMLプロファイル 機能ガイド

1 はじめに 前準備 MICROSOFT 製品のプログラムを最新の状態にする NET FRAMEWORK 4.0 ( と日本語 LANGUAGE PACK) のインストール NET FRAMEWORK 4.0 のインストール... 4

Bioinformatics2

VPN 接続の設定

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

IUGONETメタデータ・データベースの使い方

Si 知識情報処理

スライド 1

TogoDBシステム概説書

HP cafe HP of A A B of C C Map on N th Floor coupon A cafe coupon B Poster A Poster A Poster B Poster B Case 1 Show HP of each company on a user scree

Fig. 3 3 Types considered when detecting pattern violations 9)12) 8)9) 2 5 methodx close C Java C Java 3 Java 1 JDT Core 7) ) S P S

EndNote basic / Mendeleyを用いた文献管理方法

Transcription:

第 51 回日本生物物理学会ランチョンセミナー 2013 年 10 月 28 日京都国際会館 Publishing BioMagResBank data derived from NMR spectroscopy in the structured formats: XML and RDF 大阪大学蛋白質研究所 横地政志

NMR 分光学の発展の歴史 実験法 解析法 現象記述法 1946 最初の 1 H 核磁気共鳴観測 (Purcell, Bloch) 1946 Bloch 方程式 1950 化学シフトの発見 1948 双極子緩和 (BPP) 1958 Magic-angle Spinning (Andrew) 1954 線形応答表現 ( 久保 - 富田 ) 1966 FT-NMR (Ernst, Anderson) 1957 密度行列表現 (Redfield) 1971 MRI (Lauterbur, Mansfield) 1983 直積演算子 (Sørensen) 1976 2 次元 NMR (Ernst) 1990~ DFTによる化学シフト計算 1987 NMRによる立体構造決定 (Wüthrich) 1989 最初のNMR 構造がPDB 登録 1990~ 遺伝子組換え蛋白質 15 N, 13 C, 2 H 等の一様標識 ブロードバンドデカップリング 多次元 NMR 1997 TROSY 法の提唱 (Wüthrich) 2000~ 高磁場 (800MHz~)NMR Cryoprobe NUS In-cell NMR 巨大分子システムへ応用 2013 wwpdbに登録されたnmr 構造が1 万件超

NMR により決定された立体構造 12000 10000 8000 6000 4000 2000 0

巨大分子システムの構造プローブとしての NMR 古細菌 20S プロテアソーム Core Particle (CP) 4 つの 7 量体の環構造 (α 7 β 7 β 7 α 7 ) α- 環は α サブユニットの N 端の残基 ( ゲート残基 : gating residues) から構成される X 線結晶解析ではゲート残基に対応する電子密度が見えない ( 図 A, C) α 7 の 1H- 15 N TROSY 及び 1 H- 13 C methyl-trosy を測定 ( 高度に重水素化 13 CH 3 -Met 標識 ) ゲート残基中の Met に 3 つの化学交換ピーク (A, B/C 状態 ) ( 図 D) ニトロキシラジカルを含む分子 (TEMPO) を赤字の Cys 変異残基に導入 常磁性緩和促進効果 (PRE) を観測 ( 図 B) Regina,T.N., Sprangers,R., Kay,L.E., Science, 328, 98-102 (2010)

巨大分子システムの構造プローブとしての NMR PRE の解析と模擬計算から ゲート残基は IN(A state)-out(b/c states) の平衡状態 ( 左図 A, B, D) 既知の変異体の生化学的データは IN-OUT の占有率と良い相関 ( 左図 C) A-B, B-C, B-C 状態間の交換速度 ( 図未掲載 ) 各変異体の模擬計算で求められた α 環の開口面積とプロテオリシス速度が比例関係 ( 下図 A, B) 下線は結晶構造では得られなかったの知見に相当 Regina,T.N., Sprangers,R., Kay,L.E., Science, 328, 98-102 (2010)

生体高分子 NMR のためのデータベース :BMRB 著者 文献 実験条件に関する情報 帰属された化学シフト NMR-STAR v3.1 PDB 登録された構造決定に使われた拘束条件 原子座標 帰属されたピークリスト 各種解析データ ( 緩和速度, S 2, 解離定数, 化学交換速度, H/D 交換速度, カップリング定数, RDC など ) NMR と組み合わせた方法論に関する記述 (LC-NMR/MS, SAXS, FRET) 有用な測定 解析法が提唱された場合 NMR-STAR のフォーマット定義 ( 辞書 ) は拡張される

BMRB の活動 1989 年米国ウィスコンシン大学マジソン校に BioMagResBank (BMRB) 設立 1991 年リレーショナルデータベース化 2007 年 Worldwide PDB (wwpdb) に加盟 2010 年 NMR 構造の登録には化学シフトデータが必須 2013 年現在 約 8900 件の NMR 実験 解析データを収蔵 約 1700 件の代謝物のスペクトルのデータベースの提供 PDB/BMRB に同時登録可能な総合受付システム (AIDT-NMR) の運営 妥当性検証 データ可視化ツールの提供

Worldwide Protein Data Bank BMRB Satellite in Japan bmrbdep.osaka-u.ac.jp

PDBj-BMRB@ 大阪大学蛋白質研究所 http://bmrbdep.protein.osaka-u.ac.jp/ ADIT-NMR : 生体高分子の NMR 実験データ登録のための窓口 SMS-Dep : 23 残基以下の蛋白質 3 塩基以下の核酸 3 糖以下の糖類の NMR 実験データ登録のための窓口 BMRB Osaka Mirror : BMRB エントリーの検索 代謝物の NMR スペクトル DB 各種ファイルのダウンロード

NMR データ登録の流れ FAQ 化学シフトファイルの作り方 ADIT-NMR の使い方

NMR データの検索サービス紹介 http://bmrb.protein.osaka-u.ac.jp/software/query/ 変性したユビキチンを検索 1. Entry information カテゴリを選択 2. Title アイテムに Ubiquitin を入力 3. Molecular assembly カテゴリを選択 4. Physical state アイテムに denatured を入力 5. 検索ボタンを選択

Biological Magnetic Resonance Data Bank Member of A Repository for Data from NMR Spectroscopy on Proteins, Peptides, Nucleic Acids, and other Biomolecules BMRB Entry 18610 Chem Shift validation: AVS_full, LACS BMRB number (explain) 18610 Open Accession Deposition NMR-STAR v3.1 file: bmr18610.str NMR-STAR v2.1 file: bmr18610.str Data Visualizations Goog le search Home Search Validation Tools Deposit Data NMR Statistics Spectroscopists' Corner Programmers' Corner Metabolomics Educational Outreach NMR Data Formats Useful NMR Links Site Map FTP Access Title: 1H, 13C and 15N assignments of Ubiquitin for both folded and denatured states at 258K and 2500 bar PubMed: 23284170 Authors: Vajpai, Navratna; Nisius, Lydia; Wiktor, Maciej; Grzesiek, Stephan Citation: Vajpai, Navratna; Nisius, Lydia; Wiktor, Maciej; Grzesiek, Stephan. "High-pressure NMR reveals close similarity between cold and alcohol protein denaturation in ubiquitin." Proc. Natl. Acad. Sci. U.S.A. 110,.-. (2013). Assembly members: Ubiquitin, polymer, 76 residues, Formula weight is not available Natural source: Common Name: Human Taxonomy ID: 9606 Superkingdom: Eukaryota Kingdom: Metazoa Genus/species: Homo sapiens Experimental source: Production method: recombinant technology Host organism: Escherichia coli

NMR データの検索サービス紹介 http://bmrb.protein.osaka-u.ac.jp/data_library/diseases/

BMRB エントリー 18610 の要約ページ NMR-STAR ファイルのリンク (bmr18610.str) タイトル 著者名 主要引用文献 試料の構成情報 主要データセット 試料の詳細情報 外部データベースの参照!? DBJ (DNA Data Bank of Japan), EMBL, SP (UniProtKB) への参照なし GB (GenBank), PIR, PRF, REF (NCBI RefSeq) への参照リンクが機能してない TPD, TDG は DDBJ, Genbank のユーザー登録エントリー (Third Party Annotation) を表す 従って上記の DB の省略名 DBJ, GB にそれぞれ含むべきでは?

NMR データの検索サービスの課題 問題点 1. NMR-STARフォーマット ( 情報の整理の仕方 ) の知識が必要 2. 同意義語の変化に由来する検索漏れの発生 3. 型一致 ( デフォルトで文字列型 ) が要求される検索に弱さ 4. 外部 DBとの連携不足に伴う関連情報の少なさ リンク漏れ リン ク切れの発生 解決策 1. NMR-STARの定義をウェブ標準技術で記述 2. 列挙型データの正則化 3. データ型宣言 厳格な適用 4. リンクの永続化をウェブ標準技術で対応 5. DB 間の相互接続の深化

新たな共通フォーマットの紹介 BMRB/XML と BMRB/RDF NMR-STAR data file example of the Assembly category describing the molecular system (assembly) for BMRB entry bmr15400 人 計算機の両方の可読性に優れる tag-value 文法はリレーショナル DB との親和性が高い タグはカテゴリ (.) アイテムの組み合わせで表現 カテゴリ アイテムの意味 関連は NMR- STAR v3.1 ディクショナリーに定義 _Atom_chem_shift.Value 4.15 tag value NMR-STAR v3.1 Atom_chem_shift Value 4.15 relation attribute value Relational DB

新たな共通フォーマットの紹介 BMRB/XML と BMRB/RDF The corresponding example in a BMRB/XML data file 計算機の可読性に優れる NMR-STAR v3.1 ディクショナリーに定義された階層性を明示的に再現 XML スキーマ ( フォーマット構造定義 ) は NMR- STAR v3.1 ディクショナリーを直接的に変換して作成 XML スキーマは以下の URL に存在 http://brmbpub.protein.osakau.ac.jp/schema/mmcif_nmr-star.xsd 名前空間の接頭辞は BMRBx

The corresponding example in a BMRB/RDF data file 計算機によるデータ交換に優れる 主語 述語 目的語を用いた簡潔な表現 殆どの語句は URI 参照可能 NMR-STAR v3.1 ディクショナリーに定義された階層性はオントロジー ( 知識表現形式 ) で再現 オントロジーは BMRB/XML のスキーマを変換して作成 オントロジーは以下の URL に存在 http://brmbpub.protein.osakau.ac.jp/schema/mmcif_nmr-star.owl オントロジーの名前空間の接頭辞は BMRBo

新たな共通フォーマットの紹介 BMRB/XML と BMRB/RDF Translation example of "Entry" category for BMRB entry 15400 NMR-STAR v3.1 のカテゴリ アイテムの意味 関連 XML ファイルでは階層性を含む完全な表現 RDF ファイルではオントロジーで表現 視覚的にはピリオド (.) で連結した直列化表現 全てのフォーマットの情報量は等価 XML, RDF は標準化されているため 様々なライブラリ ツールの利用が可能 NMR-STAR v3.1 BMRB/XML の変換のためのツール BMRBxTool を新たに開発 BMRB/XML BMRB/RDF の変換のためのツール BMRBoTool を新たに開発

新たな共通フォーマットの紹介 BMRB/XML と BMRB/RDF

新たな共通フォーマットの紹介 NMR データの正則化 BMRB の 8859 エントリーについて 計 76,606 件のデータを自動化ツール (BMRBxTool) を使い訂正 訂正の必要のなかったエントリーは計 226 エントリー 数個のデータの訂正が必要なエントリーは全体の 60% 程度 Statistics on data remediations in BMRB/XML conversion Number of data remediated Entries (Fraction %) 0 226 (2.6) 1-5 5354 (60.4) 6-10 1093 (12.3) 11-20 1282 (14.5) 21-50 750 (8.5) 51-154 (1.7)

新たな共通フォーマットの紹介 BRMB/RDF により再連結されたデータベース BMRB の 8859 エントリーについて 計 292,329 件の DB 間の参照が見出され 全体の 43.8% が PDB へ向かうリンク 2 番目に BMRB エントリー間のクロスリンク さらに配列データベースへのリンク数が多い (GenBank, NCBI RefSeq, DDBJ, UniProt, EMBL の順 ) Statistics on interlinked RDFs in BMRB/RDF A schematic representation of the linked external databases from BMRB/RDF

BMRB/XML & BMRB/RDF Publication Server http://bmrbpub.protein.osaka-u.ac.jp/

BMRB/XML & BMRB/RDF Publication Server http://bmrbpub.protein.osaka-u.ac.jp/ Available services: File download service via HTTP and rsync One-stop search service for NMR-STAR v3, BMRB/XML and BMRB/RDF Advanced search services using SPARQL RESTful APIs for BMRB/XML and BMRB/RDF

BMRB/RDF Data exchange via RDF links PDB/RDF

セマンティック ウェブ : データ交換フォーマットとして RDF を使うデータベースの自動的な連携 SPARQL can be used to express queries across diverse data sources. 31 billion RDF resources and 504 million RDF links by September 2011

生命科学データベースの拡大 http://s-web.sfc.keio.ac.jp/conference2013/0301-yamamoto.pdf 2013 年 5 月現在 1512 の生命科学関連データベースが存在 (Nucleic Acids Research)

まとめ PDBj-BMRB は BMRB/XML(NMR データの XML 表現 ) BMRB/RDF (NMR データの RDF 表現 ) を開発 NMR-STAR v3.1 従来通り BMRB 登録 配布の共通フォーマットとして利用 BMRB/XML データベースの内容の正則化に寄与 化学シフト 原子座標などのデータを駆使したツールの開発に最適 BMRB/RDF 豊富な関連情報の取得を容易に データベースの使い勝手の向上に応用 セマンティック ウェブを構成する情報源の一つとして BMRB のアーカイブされた NMR 実験データは統合化