Microsoft PowerPoint - 統合DBシンポ090612rev1.ppt

Similar documents
Microsoft PowerPoint - PDBjing ppt

この講義でやること PDBjのwebページの復習 webページのデータの元になっているデータ形 式の解説 上記の演習 2

<95DB8C9288E397C389C88A E696E6462>

PDBj : : 1

ディープラーニングとオープンサイエンス ~研究の爆速化が引き起こす摩擦なき情報流通へのシフト~

ñ{ï 01-65

Microsoft PowerPoint - PSSJ_2019神戸(栗栖)

トーゴーの日シンポジウム 2016 東大弥生講堂, 5 October 2016 生命科学におけるデータサイエンスの課題と PDB 中村春木 大阪大学蛋白質研究所

Microsoft PowerPoint - PDBjing実習.ppt

MRI | 所報 | 分権経営の進展下におけるグループ・マネジメント

Phonetic Perception and Phonemic Percepition

学術会議講演 pptx

ISO GC 24


阿部Doc

Web Web Web Web Web, i

AJACS18_ ppt

_念3)医療2009_夏.indd

千葉県における温泉地の地域的展開

untitled

Vol. 48 No. 3 Mar PM PM PMBOK PM PM PM PM PM A Proposal and Its Demonstration of Developing System for Project Managers through University-Indus

\615L\625\761\621\745\615\750\617\743\623\6075\614\616\615\606.PS



特-11.indd

別添 5 研究開発課題別事後評価結果 1. 研究開発課題名蛋白質構造データバンクの国際的な構築と高度化 (PDBj) 2. 代表研究者名中村春木 ( 大阪大学蛋白質研究所教授 ) 3. 代表研究者による成果開発概要 3-1. 研究目的欧米 日本を中心とする国際的な構造ゲノムプロジェクトの進展 成熟に

IPSJ SIG Technical Report Vol.2010-NL-199 No /11/ treebank ( ) KWIC /MeCab / Morphological and Dependency Structure Annotated Corp

IPSJ SIG Technical Report Vol.2014-EIP-63 No /2/21 1,a) Wi-Fi Probe Request MAC MAC Probe Request MAC A dynamic ads control based on tra


環境影響評価制度をめぐる法的諸問題(4) : 米国の環境影響評価制度について

202

206“ƒŁ\”ƒ-fl_“H„¤‰ZŁñ

デジタルメディアの時代における協働社会のデザインと地方行政の役割 : 元住吉商店街プロジェクトでの実践活動を通して

国立遺伝学研究所におけるDNAデータバンク:DDBJ

39-3/2.論説:藤井・戸前・山本・井上

Safe harbor statement under the Private Securities Litigation Reform Act of 1995: This presentation may contain forward-looking statements that involv



[2] , [3] 2. 2 [4] 2. 3 BABOK BABOK(Business Analysis Body of Knowledge) BABOK IIBA(International Institute of Business Analysis) BABOK 7

1 2. Nippon Cataloging Rules NCR [6] (1) 5 (2) 4 3 (3) 4 (4) 3 (5) ISSN 7 International Standard Serial Number ISSN (6) (7) 7 16 (8) ISBN ISSN I

e-learning e e e e e-learning 2 Web e-leaning e 4 GP 4 e-learning e-learning e-learning e LMS LMS Internet Navigware

Powered by TCPDF ( Title 米国における障害者を対象とした野外教育 : 米国の障害者政策と障害者教育の変遷との関連 Sub Title Outdoor education for people with disabilities in United

RIETI Highlight VOL.25

1 Web [2] Web [3] [4] [5], [6] [7] [8] S.W. [9] 3. MeetingShelf Web MeetingShelf MeetingShelf (1) (2) (3) (4) (5) Web MeetingShelf

ABSTRACT The movement to increase the adult literacy rate in Nepal has been growing since democratization in In recent years, about 300,000 peop


On the Wireless Beam of Short Electric Waves. (VII) (A New Electric Wave Projector.) By S. UDA, Member (Tohoku Imperial University.) Abstract. A new e

3_23.dvi

外国語学部 紀要30号(横書)/03_菊地俊一

2. Twitter Twitter 2.1 Twitter Twitter( ) Twitter Twitter ( 1 ) RT ReTweet RT ReTweet RT ( 2 ) URL Twitter Twitter 140 URL URL URL 140 URL URL

untitled

IP Management Within Universities: Experiences in the US

Sport and the Media: The Close Relationship between Sport and Broadcasting SUDO, Haruo1) Abstract This report tries to demonstrate the relationship be

はじめに

Highlights Employment increased in Ontario, Saskatchewan, and Manitoba. There was little change in the other provinces. More people were employed in c

橡03_ccTLD_rev.PDF

Web-ATMによる店舗向けトータルATMサービス

10-渡部芳栄.indd


1 UD Fig. 1 Concept of UD tourist information system. 1 ()KDDI UD 7) ) UD c 2010 Information Processing S

わが国における女性管理職研究の展望 Research on Women in Management Positions in Japan Kieko HORII 5 Abstract Japanese society is struggling with a low percentage of wo

Salesforce DX.key

本文.indd

ÿþ

DEIM Forum 2009 C8-4 QA NTT QA QA QA 2 QA Abstract Questions Recomme


....

論 文 Earnings Management in Pension Accounting and Revised Jones Model Kazuo Yoshida, Nagoya City University 要約本稿では退職給付会計における全ての会計選択を取り上げて 経営者の報告利益管理行動

untitled

"CAS を利用した Single Sign On 環境の構築"

1 Fig. 1 Extraction of motion,.,,, 4,,, 3., 1, 2. 2.,. CHLAC,. 2.1,. (256 ).,., CHLAC. CHLAC, HLAC. 2.3 (HLAC ) r,.,. HLAC. N. 2 HLAC Fig. 2

25 II :30 16:00 (1),. Do not open this problem booklet until the start of the examination is announced. (2) 3.. Answer the following 3 proble

Vol.54 No (Mar. 2013) 1,a) , A Case Study of the Publication of Information on the Japan Earthquake Naoto Matsumoto 1,a

PDCA


07_太田美帆.indd

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

1: ( 1) 3 : 1 2 4

The current state of Japanese Tourism considered from Travel & Tourism Competitiveness MITSUKI Takehiro Tourism is expected to be the growth industry

IPSJ SIG Technical Report NetMAS NetMAS NetMAS One-dimensional Pedestrian Model for Fast Evacuation Simulator Shunsuke Soeda, 1 Tomohisa Yam

評論・社会科学 84号(よこ)(P)/3.金子

149 (Newell [5]) Newell [5], [1], [1], [11] Li,Ryu, and Song [2], [11] Li,Ryu, and Song [2], [1] 1) 2) ( ) ( ) 3) T : 2 a : 3 a 1 :


- March

NLC配布用.ppt

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE.

_’¼Œì


Vol.55 No (Jan. 2014) saccess 6 saccess 7 saccess 2. [3] p.33 * B (A) (B) (C) (D) (E) (F) *1 [3], [4] Web PDF a m

ICSU World Data System (WDS) WDC WDS Scientific Committee (ICSU) WS

1_26.dvi

きずなプロジェクト-表紙.indd


18巻2号_09孫さま03p.indd

-October TPP ASEAN RCEP TPP MV Islamic State, IS EU EU EU EU EU

"CAS を利用した Single Sign On 環境の構築"

yakugaku-kot.ppt

Contents Launching of the Thailand-Japan Longstay Promotion Association Longstay and establishing the Thailand-Japan Longstay Promotion Association Re

スライド 1

Vol. 42 No MUC-6 6) 90% 2) MUC-6 MET-1 7),8) 7 90% 1 MUC IREX-NE 9) 10),11) 1) MUCMET 12) IREX-NE 13) ARPA 1987 MUC 1992 TREC IREX-N

Transcription:

文科省統合データベースプロジェクトシンポジウム東大武田先端知ビル,2009 年 6 月 12 日 蛋白質構造データバンク事業と 国際的な展開 中村春木 大阪大学蛋白質研究所 PDBj 日本蛋白質構造データバンク

PDB (Protein Data Bank) since 1971: 蛋白質の立体 (3 次元 ) 構造情報 原子種とその座標 アミノ酸残基 実験手法 実験時の情報 実験観測データ ( 構造因子 ) が整理して登録し Web から無料公開を行う X 線結晶解析 核磁気共鳴法 (NMR) 電子顕微鏡観測 蛋白質立体構造

http://www.wwpdb.org/

Agreement signature Nature Structure Biology (2003) Vol. 10, No.12

wwpdb における国際協力 1) データ編集 登録作業を wwpdb のメンバーで協力しながら実施する UCSD EBI Rutgers Univ. RCSB BMRB NIST PDBj 2) 唯一のデータアーカイブを持ち 米国の RCSB-PDB がアーカイブ キーパーとして書き込み権限をもつ 3) データ フォーマットや新たな記述法については 各メンバー間内の討議により決定する (V3.1 V3.2) 4) 各メンバーは 各々独自のデータ ブラウザ ビューア 検索ツール Web サービスを開発することが期待される (Berman, Henrick & Nakamura (2003) Nat. Struct. Biol. 10, 980)

日本 PDBj, 米国 RCSB-PDB, 欧州 PDBe-EBI, BMRB(NMRDB) の四極を結んだ wwpdb を運営 (Ref: Nucleic Acids Res. (2007) 35, D301-D303) シンク ル テ ータ アーカイフ を構築 ( 同時公開の開始 ) データ記述法 (v3.2) を共同で修正 確立 データ内容の修正 (remediation) を実施 Ligand data (RCSB-PDB), Sequence data (PDBe- EBI), Primary citation (PDBj) wwpdbac 会議 (S. K. Burley 議長 ) を開催 2004 年 11 月 Washington DC, 2005 年 8 月 Florence, 2006 年 10 月東京, 2007 年 9 月 Princeton, 2008 年 9 月 EBI 2006 年 10 月 @ 東京 2007 年 9 月 @Princeton 2008 年 9 月, EBI での wwpdbac メンバー 2008 年 9 月 @EBI

wwpdb FTP Traffic 61,364,573 ファイルが 2009 年 3 月の 1 ヶ月間に世界中の wwpdb メンバーサイトからダウンロードされている (RCSB-PDB, EBI-PDBe, and PDBj)

英語サイト 日本語サイト 中国語サイト ハングルサイト

英語サイト 日本語サイト 中国語サイト ハングルサイト

Protein Data Bank Japan 日本蛋白質構造データバンク http://www.pdbj.org/ 大阪大学蛋白質研究所にて実施 ( 独立行政法人 ) 科学技術振興機構バイオインフォマティクス推進センター (http://www-bird.jst.go.jp/) が 2001 年から支援 原子種とその座標 アミノ酸残基 実験手法 実験時の情報 実験観測データ ( 構造因子 ) を整理して登録 Web から無料公開

日本蛋白質構造データバンク :PDBj 1. 国際蛋白質構造データバンク (wwpdb) の創設 (2003 年 ) と協力 2. 蛋白質立体構造データベース登録作業 (~28%) 3. 蛋白質構造情報の標準 XML 記述 (PDBML) の開発とその応用 4. 蛋白質構造解析実験および蛋白質機能に関する文献 データベース情報の付加 5. 蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発 6. 講習会やセミナーの開催

日本蛋白質構造データバンク :PDBj 1. 国際蛋白質構造データバンク (wwpdb) の創設 (2003 年 ) と協力 2. 蛋白質立体構造データベース登録作業 (~28%) 3. 蛋白質構造情報の標準 XML 記述 (PDBML) の開発とその応用 4. 蛋白質構造解析実験および蛋白質機能に関する文献 データベース情報の付加 5. 蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発 6. 講習会やセミナーの開催

PDBj におけるデータ処理数の変遷 Total 58,083 data on 10 June, 2009 Yearly registration number 8000 6000 4000 2000 Yearly PDBj processed number Yearly wwpdb processed number 0 0 1 11 21 31 1972 75 80 85 90 95 2000 05 2009 year We process 25-30 % deposited data of the entire world, mainly from Asian and Oceania regions

日本蛋白質構造データバンク :PDBj 1. 国際蛋白質構造データバンク (wwpdb) の創設 (2003 年 ) と協力 2. 蛋白質立体構造データベース登録作業 (~28%) 3. 蛋白質構造情報の標準 XML 記述 (PDBML) の開発とその応用 4. 蛋白質構造解析実験および蛋白質機能に関する文献 データベース情報の付加 5. 蛋白質立体構造に関する新規二次データベースの構築と解析ツールの開発 6. 講習会やセミナーの開催

Get Entry Data from our XML-based browser Access to http://www.pdbj.org/ 12as PDBID (e.g. 12as) should be input in a box and GO Summary for each PDBID is displayed.

Graphic viewer: jvversion 3.6 Access to http://www.pdbj.org/jv/

Development of other Databases and Services Alignment of Sequence and Structures. MAFFTash (Kato. Toh & Standley) Encyclopedia of Protein Structures, eprots (Kinjyo, Kudo, & Ito) Molecular of the Month, MoM (Goodsell & Kudo) Homolog protein search, Sequence Navigator (Standley) Similar fold search, Structure Navigator (Standley & Toh) Protein Folds Browser, Protein Globe (Kinjo & Standley)

Development of other Databases and Services Protein Molecular Surface Database, ef-site (Kinoshita & Nakamura) Search for Similar Surface, efseek (Kinoshita & Nakamura) Electron Microscopy Navigator, EM-Navi (Suzuki) Function Annotation from Folds and Sequences, SeSAW (Standley) Ligand Binding Site Search, GIRAF (Kinjo) Protein Dynamics Database, ProMode (Wako & Endo)

What is required for Databank? For authors benefit ( 登録者のために ) Good portability ( 登録のしやすさ ) Rapid deposition ( 登録が早く便利なこと ) : For users benefit ( ユーザのために ) Good portability ( 使いやすさ ) Rapid search ( 検索が早く便利なこと ) Can be customized ( カスタマイズできること ) : For both authors and users (global community) Good data quality ( データの優れた品質の確保 ) Quality of each data can be validated ( 個々のデータの品質をユーザが判断できる )

データの品質管理 保守について 登録時に 各立体構造の品質が厳しく検査 鑑定される 登録者本人と wwpdbのアノテータが それぞれ検証する この検証に合格しないと PDBIDが発行されない 実験情報 (X 線結晶解析の場合には構造因子 NMRの場合には原子間距離情報 ) が 2008 年 2 月 1 日から 登録時に座標と同時に必須の項目となった データ記述のスキーマがバージョン ( 最新版 : v3.2) 毎に正確に定義され 記述についての validation( 検証 ) が常になされて公開される

Incorrect structures and validation Example: ABC transporter MsbA and EmrE multidrug transporter 1JSQ, 2Z2R Protein Science 16:1013-1016 (2007)

2007 Commentaries on incorrect structures T.A. Jones & G.J. Kleywegt (2007) Experimental Data for Structure Papers Science 317:194-195 R.P. Joosten & G. Vriend (2007) PDB Improvement Starts with Data Deposition. Science 317:195-196 A. Wlodawer (2007) Deposition of Structural Data Redux. Acta Cryst D63:421-423 B.W. Matthews (2007) Five retracted structure reports: Inverted or incorrect? Protein Science 16:1013-1016 M. Crispin, D.I. Stuart & E. Y. Jones (2007). Building meaningful models of glycoproteins. Nature Structural & Molecular Biology 14:354 H.M. Berman, K. Henrick, H. Nakamura & J. Markley (2007). Reply to: Building meaningful models of glycoproteins. Nature Structural & Molecular Biology 14:354-355 B. Rupp. (2006) Real-space solution to the problem of full disclosure Nature 444:817

Possible reasons Rushed as a short communication into the prestigious high impact journal Ignoring all counter theoretical and spectroscopic evidence Fewer professional crystallographers Crystal structures by biologists with limited crystallographic background High throughput methods Solved using black box crystallographic firmware/software Exploding number of structural papers to review and limited number of willing referees with crystallographic knowledge Papers are increasingly refereed by non-crystallographers who are unaware of many potential pitfalls Limited supporting information available for the reviewer

データの品質管理 保守について 登録時に 各立体構造の品質が厳しく検査 鑑定される 登録者本人と wwpdbのアノテータが それぞれ検証する この検証に合格しないと PDBIDが発行されない 実験情報 (X 線結晶解析の場合には構造因子 NMRの場合には原子間距離情報 ) が 2008 年 2 月 1 日から 登録時に座標と同時に必須の項目となった データ記述のスキーマがバージョン ( 最新版 : v3.2) 毎に正確に定義され 記述についての validation( 検証 ) が常になされて公開される

データの品質管理 保守について 登録時に 各立体構造の品質が厳しく検査 鑑定される 登録者本人と wwpdbのアノテータが それぞれ検証する この検証に合格しないと PDBIDが発行されない 実験情報 (X 線結晶解析の場合には構造因子 NMRの場合には原子間距離情報 ) が 2008 年 2 月 1 日から 登録時に座標と同時に必須の項目となった データ記述のスキーマがバージョン ( 最新版 : v3.2) 毎に正確に定義され 記述についての validation( 検証 ) が常になされて公開される

データの品質管理 保守について 登録時に 各立体構造の品質が厳しく検査 鑑定される 構造生物学の専門家集団が必要 ( 最新の測定法に精通している ) 実験情報が必須の項目 膨大な実験結果の情報 ( 手法や測定時のパラメータを含む ) をオントロジーで整理しながら DB 化するために情報科学の専門家が必要 データ記述のスキーマの定義とデータ検証 スキーマ記述やvalidationを行うプログラマや情報技術のエンジニアが必要

メンバー 代表 : 中村春木 PDBj データベース管理運営グループ : 中川敦史, 松浦孝範, 五十嵐令子, 見学有美子, 松浦かんな, 井上真由美, 陳旻瑜 ツール サービス開発グループ : 金城玲, 岩崎憲治, 鈴木博文, 山下鈴子, 工藤高裕, 清水有希子, 鎌田知左 NMR テ ータベース (BMRB-PDBj) グループ : 藤原敏道, 阿久津秀雄, 小林直宏 中谷英一, 原野陽子 研究開発協力者 : Daron M. Standley( 阪大免疫フロンティア ), 木下賢吾 ( 東大医科研 ), 藤博幸 ( 九大生防研 ), 輪湖博 ( 早大 ), 伊藤暢聡 ( 東京医歯大 )

http://www.nsf.gov/pubs/2005/nsb0540/ Report from National Science Board in Sept 2005 from NSF

http://www.elixir-europe.org/ ELIXIR Mission To construct and operate a sustainable infrastructure for biological information in Europe, to support life science research and its translation to medicine and the environment, the bio-industries and society. Partners: 32 partners, 13 member states Funding: 4.5 M from EU FP7 Deliverable: Consortium agreement to define the scope of the infrastructure and how it will be constructed Head of Elixir Project: Dr. Janet Thornton

Goals for ELIXIR Optimal Data Management Coordinated Data Resources with improved access Integration and interoperability of diverse heterogeneous data Good Value for Money Forge Links to data in other related domains A single European voice in international collaborations to influence global decisions and maintain open access to data Enhance European competitiveness in bioscience industries Address need for Increased Funding & its Coordination

Stakeholders Funders of Infrastructure National Government Funding Bodies; EMBL; EU Charities; Industry Data Resource Providers Core Resources Specialist (Many investigators - distributed) Data Providers Experimentalists Tool Providers Bioinformatics Groups Users 36

Why do we need ELIXIR? Data Growth Global context TB Server Storage 1400 1200 1000 800 600 400 200 0 2006 time now Europe Very large user community: USA 3.3 m web hits/day Japan 20,000 unique users per day Need to preserve data and make accessible to all Impact on medicine & agriculture Impact on society & bioindustries Need for increased funding for biodata resources

共立出版 蛋白質核酸酵素 誌での連載ライフサイエンス分野の統合データベース 生命科学系データベース統合化の背景大久保公策 Vol. 52 No. 9 (2007) 1027-1031 統合データベースがめざすもの高木利久 Vol. 52 No. 11 (2007)1388-1389 医薬品の統合データベース金久實 Vol. 52 No. 12 (2007)1486-1491 蛋白質構造情報の高度化と統合データベース中村春木 Vol. 52 No. 14 (2007)1897-1905 ゲノム情報と統合データベース五條堀孝 Vol. 52 No. 15 (2007) 2006-2011 ライフサイエンスにおけるデータベース構築のための人材養成瀬々潤 池村淑道 Vol. 53 No. 1 (2008) 87-93 海外データベースとの連携舘野義男 Vol. 53 No. 2 (2008)182-189 統合データベースプロジェクトのサーヒ スとその利用法川本祥子 坊農秀雄 Vol. 53 No. 3 (2008)281-287 利用者の立場からのコメント中村桂子 佐藤清 堀田凱樹 中井謙太 田畑哲之 津金昌一郎 松田秀雄 西川建 白井宏樹 深海薫 Vol. 53 No. 5 (2008) 686-691 わが国における疾患データベースの統合化田中博 Vol. 53 No. 6 (2008) 774-782 ゲノムワイド関連解析データベースの開発小池麻子 西田奈央 徳永勝士 Vol. 53 No. 7 (2008) 882-887 蛋白質核酸酵素 バックナンバーの全文検索サービス公開にあたって川本祥子 Vol. 53 No. 9 (2008) 1200-1205

For Long-Lived and Sustainable Databases: Roles and Resposibiliteis of Data Producers Data Users Data Managers Data Scientists Conclusion (for both informatics and particular biology field) Funding Agencies ( 日本の場合にはお金だけでなく人 : 安定な雇用も )