平成28年度スーパーコンピュータ利用報告書

Similar documents
変更履歴 版数変更日変更内容 /9/1 初版設定

内容 Visual Studio サーバーエクスプローラで学ぶ SQL とデータベース操作... 1 サーバーエクスプローラ... 4 データ接続... 4 データベース操作のサブメニューコンテキスト... 5 データベースのプロパティ... 6 SQL Server... 6 Microsoft

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

データベースアクセス

Si 知識情報処理

PowerPoint Presentation

Microsoft Word - mstattext02.docx

コンピュータグラフィックス基礎              No

スライド 1

初めてのプログラミング

WEBシステムのセキュリティ技術

スーパー英語アカデミック版Ver.2

PostgreSQL Plus 管理者ガイド

Microsoft PowerPoint pptx

PowerPoint プレゼンテーション

XMLとXSLT

Microsoft Word - 06.doc

DBMSリポジトリへの移行マニュアル

本書について 本書では Winmostar を初めて使う人を対象に その導入手順と基本操作を紹介します 不明な点がある場合や本書の通りに動かない場合はまず 随時更新されている よくある質問 をご確認ください 2

PowerPoint Presentation

TALON Tips < カレンダー ( 月別 ) の画面を表示する > 株式会社 HOIPOI 第 1.1 版 p. 1

ソフト活用事例③自動Rawデータ管理システム

基本的な利用法

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

無料で多機能な OSS の ETL ツール Kettle を使ってみよう! 情報政策課技術職員金森浩治 1. はじめにデータ処理を行うにあたって非常に便利なツール ETL 本稿では OSS の ETL Kettle の機能とその使用方法を紹介します 2. 用語説明 2.1 OSS とは? OSS と

ご存知ですか? データ転送

( 目次 ) 1. はじめに 開発環境の準備 仮想ディレクトリーの作成 ASP.NET のWeb アプリケーション開発環境準備 データベースの作成 データベースの追加 テーブルの作成

Sharing the Development Database

Webシステム授業資料

MolDesk Basic Ver を使用

Rの基本操作

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

モデリング操作ガイド (データベースモデリング編)

Microsoft Word - AutocadCivil3D.doc

改訂履歴

Microsoft PowerPoint - 資料04 重回帰分析.ppt

PowerPoint プレゼンテーション

スクールCOBOL2002

マニュアル訂正連絡票

コンピュータ応用・演習 情報処理システム

Microsoft PowerPoint - 三次元座標測定 ppt

CourseDescriptions_

Microsoft Word - Javacc.docx

FORTRAN( と C) によるプログラミング 5 ファイル入出力 ここではファイルからデータを読みこんだり ファイルにデータを書き出したりするプログラムを作成してみます はじめに テキスト形式で書かれたデータファイルに書かれているデータを読みこんで配列に代入し 標準出力に書き出すプログラムを作り

目次 1. はじめに x-servlet の SNMP エージェント設定... 3 ACL ファイルの作成... 3 start.bat の編集 サーバ ID によるサーバ再接続設定... 5 irule の作成... 5 Persistence Profile の作

3/7 マイグレーション開発方針 顧客名 0 作成者 根岸正 < プログラム移行方針 > システム名称 A-VX システムマイグレーション作成日 2015/09/01 < COBOL 資産のプログラム移行 > COBOLソース ( メインとCOPYLIB) を入力としてSCC 言語変換ツールにてVB

2. saccess saccess SQL SQL SQL saccess SQL SQL PHP 3. saccess saccess saccess Web *1 [5] saccess * saccess saccess, SQ

CONTENTS マニュアルの表記... S01-02_01 1.DataNature Smart 全体概要図... S01-02_11 2. 基本操作... S01-02_ ジョブの作成... S01-02_21 加工条件設定... S01-02_21 Step1: 処理対象データの指

A9R28B3.tmp

Chap. 1 NMR

Access のようなデータベースはないの? 答えは あります OOo は下記の なんちゃって Access の機能を持っています テーブルの作成とデータ操作が可能 クエリでデータの抽出 関連付けが可能 入力フロントエンドになるフォームの作成が可能 宛名ラベル レポートなどの印刷機能 データソース画

Fortran 勉強会 第 5 回 辻野智紀

問題 1 次の文章は Access データベース およびデータベースの概要について述べたものである にあてはまる適切なものを解答群 { } より選び その記号で答えよ 設問 1. Microsoft Access 2007 データベースのテーブルでは 表す としてデータを { ア. レコードを列 フ

使用する前に

スライド 1

コマンド入力による操作1(ロード、プロット、画像ファイル出力等)

10th Developer Camp - B5

intra-mart Accel Platform — TableMaintenance ユーザ操作ガイド   第7版   None

VB実用Ⅲ⑩ フリーデータベースⅡ

LAN ケーブル接続について

IBIS

Microsoft PowerPoint - Borland C++ Compilerの使用方法(v1.1).ppt [互換モード]

Transcription:

課題名 ( タイトル ): NMR 理論化学シフト予測法の精密化 利用者氏名 : 近山英輔 * 伊藤研悟 * 坪井裕理 * 所属 : * 環境資源科学研究センター環境代謝分析研究チーム 1. 本課題の研究の背景 目的 関係するプロジェクトとの関係 NMR メタボロミクス用化学シフトデータベースには実験データの登録数が十分でない問題があり 第一原理量子化学計算による理論データを登録してデータベース化する期待が高まっている その中で 計算精度の点で 現在良い手法がないことが問題になった 本研究は この解決のため 高品質 NMR 実験データを有効活用した NMR 理論デー タ予測法の精密化を目的とする 具体的には クエリー化合物に対し 遮蔽定数を量子化学計算プログラムである Gaussian で計算する 部分構造などの情報を活用して あらかじめ Gaussian により作成した部分構造 - 理論遮蔽定数 -NMR 実験値データベースに対し照合する このデータベースは 多数の化合物の計算結果の構築によるため スーパーコンピュータを用いた第一原理量子化学計算が必要になる 量子化学計算や化学構造の計算結果から 重回帰分析等の手法で NMR 理論化学シフト計算の精密化を達成できると考えている 2. 具体的な利用内容 計算方法部分構造 - 理論遮蔽定数 -NMR 実験値データベースは NMR 理論データ予測ソフトウェア ( 図 1) のコマンド 1 コマンド 2 コマンド 3 の間でデー 図 1 NMR 理論データ予測ソフトウェア新規 DB の物理配置としては parstrcta と parstrctb テーブルを SLDB( 図 1 SLDB) に構築する つまり SLDB 内に以下の parstrcta/b テーブルを create table する 図 1 では別の DBMS のように書いてあるが 実際の物理配置は同じ DBMS の同じデータベースになる これは parstrcta/b と SLDB の他のテーブルのリレーションを利用するためである parstrctb テーブルについて記述する このテーブルは 1 行が 1 個の原子 - 結合先原子を表す 末尾の b は bond の b である bondtype は SDF からの取得値をそのまま設定する 主キー 外 タ仲介をするためのリレーショナルデータベース metid INTEGER 部キー 代謝物 ID である まずコマンド 1 で 分子 ID 原子 ID 結合先原子 ID 結合タイプを新規 DB に登録する コマンド 2 で 結合先原子への相対 xyz 座標 平均位置からの距離標準偏差 遮蔽定数平均値 遮蔽定数標準偏差を登録する そして コマンド 3 でそれらのデータを利用して化学シフトを予測する atomid INTEGER 主キー 分子内原子通番 atomidto INTEGER 主キー 外部キー 結合原子の分子内原子通番このテーブルの同じ metid の異なる atomid を指す bondtype INTEGER 結合タイプ rx DOUBLE 結合先原子への相対 x 座標 ry DOUBLE 結合先原子への相対 y 座標

rz DOUBLE 結合先原子への相対 z 座標 定などがある 最低限 以下の項目を設定可能に rdv DOUBLE 結合先原子の平均位置からの距離の不偏標準偏差 するコマンド 2 は Gaussian 結果から抽出した 結 metid, atomid, atomidto, bondtype はコマンド 1 で登録し rx, ry, rz, rdv はコマンド 2 で登録する Parstrcta テーブルについて説明する 1 行が 1 個の原子を表す 末尾の a は atom の a である 合原子座標 遮蔽定数情報の parstrcta/b への登録コマンドである コマンド 2 は実行可能スクリプトが存在する場合 csps2 という名前にする jar のみの場合 metid INTEGER 主キー 外部キー 代謝物 ID csps2.jar という名前にする コマンド 2 には動作設定ファ atomid INTEGER 主キー 分子内原子通番 イルはない コマンド 2 はコマンド 1 の $outdir に sldavg DOUBLE 遮蔽定数の平均値 cd してから実行する そのカレントディレクトリ slddv DOUBLE 遮蔽定数の不偏標準偏差 上のファイルを解析する コマンド 1 で出力した使用した csps1.molecules( 動作設定ファイル a) metid, atomid はコマンド 1 で登録し sldavg, slddv はコマンド 2 で登録する コマンド 1 は Gaussian 入力ファイル生成と parstrcta/b への原子情報登録コマンドである コマンド 1 は実行可能スクリプトが存在する場合 csps1 という名前にする jar のみの場合 csps1.jar という名前にする コマンド 1 の動作設定ファイル a について説明する 動作設定ファイル a は代謝物 ID のリストである 代謝物 ID= 分子 ID で 以下 SLDB の対応する列名である metid とも記すことがある ( 代謝物 ID=metid= 分子 ID) 単なる整数のテキストファイルになる 1 行に 1 つの metid をテキストで指定する 空白は不可 ファイルの終末は改行がなくても 1 個以上並んでもよいことにし 整数のないファイル終末に連なる改行は無視する この metid をコマンド 1 は読み込み 各 metid に関する原子情報を parstrcta/b に登録し 各 metid について Gaussian 入力ファイルを生成する コマンド 1 の動作設定ファイル b について説明する 分子動力学 (MD) 遮蔽定数計算の 1 個の組を 1 ターンと呼ぶことにする 動作設定ファイル b には Gaussian 入力ファイル生成に必要な 入力ファイルの命令行の文字列などを記述する 他に 並列数 使用メモリ量の指 csps1.params( 動作設定ファイル b) を読む metid の各々について対応する Gaussian の結果ファイルを読み込んで解析する コマンド 3 は 常時稼働している SpinLIMS DB の一部に存在する理論化学シフト予測値に関わるレコードを SLDB を停止させずに コマンド 3 が動的に計算する新たな理論化学シフト予測値で上書きするシステムである コマンド 3 は新規 DB から回収した遮蔽定数データと SLDB から回収した実験化学シフトデータから動的に新しい理論化学シフト予測値を計算する コマンド 3 は新規 DB と SLDB からデータを読み SLDB に結果を追加 上書きする コマンド 3 のユーザーはそのデータベースの運用管理者である SLDB と新規 DB は同じコンピュータ上で稼働しているが コマンド 3 も同じコンピュータ上で稼働させる SLDB は 化合物 NMR スペクトル 実験室情報 化学シフトデータベースである また 昨年度に引き続き 藻類の混合成分の新規帰属法の構築を行うため NMR の実測データと Gaussian で計算された化学シフト値およびスピン結合定数の比較解析を行った まず 混合物の多様な多次元 NMR 計測を行い 既往研究および化学シフトデータベースから化合物のアノテーションを行った さらに 3D J-resolved HSQC および IPAP-HSQC-TOCSY 等の計測を行い njhh および njch 1JCC の実測値を得た ここでアノテーションがつ いた藻類の 90 の代謝物 ( 糖 アミノ酸 有機酸等 )

について B3LYP/6-311++G(d,p) レベルで構造最適 50 5 NULL NULL 化を行い 同じ計算レベルで GIAO 法を用いて化学 50 6 NULL NULL シフト値およびスピン結合定数の理論値を算出し 50 7 NULL NULL た また この時に SCRF 理論に基づいた溶媒効果 50 8 NULL NULL ( メタノール ) を取り入れて計算を行った これら 50 9 NULL NULL の実測値および理論値の比較解析では 二乗平均 50 10 NULL NULL 平方根偏差 (RMSD) および両側検定により 帰属 50 11 NULL NULL の妥当性および立体構造の評価を行った 50 12 NULL NULL 50 13 NULL NULL 3. 結果 50 14 NULL NULL 以下にコマンド 1 実行後の parstrcta の更新結 50 15 NULL NULL 果の一部を示す 代謝物毎に原子 ID が登録されて 50 16 NULL NULL いることが分かる 50 17 NULL NULL 50 18 NULL NULL 48 10 NULL NULL 50 19 NULL NULL 48 11 NULL NULL 50 20 NULL NULL 48 12 NULL NULL 50 21 NULL NULL 48 13 NULL NULL 50 22 NULL NULL 48 14 NULL NULL 50 23 NULL NULL 48 15 NULL NULL +-------+--------+--------+-------+ 48 16 NULL NULL 1152 rows in set (0.03 sec) 48 17 NULL NULL mysql> 49 1 NULL NULL 49 2 NULL NULL 以下にコマンド 1 実行後の parstrctb の更新結果 49 3 NULL NULL の一部を示す 原子 ID と結合先原子 ID 結合タイ 49 4 NULL NULL プが登録されていることが分かる 49 5 NULL NULL 49 6 NULL NULL 50 2 9 1 NULL 49 7 NULL NULL 49 8 NULL NULL 50 9 2 1 NULL 49 9 NULL NULL 49 10 NULL NULL 50 2 20 1 NULL 49 11 NULL NULL 49 12 NULL NULL 50 20 2 1 NULL 49 13 NULL NULL 49 14 NULL NULL 50 3 10 1 NULL 49 15 NULL NULL 49 16 NULL NULL 50 10 3 1 NULL 50 1 NULL NULL 50 2 NULL NULL 50 3 21 1 NULL 50 3 NULL NULL 50 4 NULL NULL 50 21 3 1 NULL

50 4 11 1 NULL 50 15 9 1 NULL 50 11 4 1 NULL 50 10 12 1 NULL 50 4 22 1 NULL 50 12 10 1 NULL 50 22 4 1 NULL 50 10 16 1 NULL 50 5 12 2 NULL 50 16 10 1 NULL 50 12 5 2 NULL 50 11 17 1 NULL 50 6 13 1 NULL 50 17 11 1 NULL 50 13 6 1 NULL 50 11 18 1 NULL 50 6 23 1 NULL 50 18 11 1 NULL 50 23 6 1 NULL 50 12 13 1 NULL 50 7 13 2 NULL 50 13 12 1 NULL 50 13 7 2 NULL +-------+--------+----------+----------+---- --+------+------+------+ 50 8 9 1 NULL 2264 rows in set (0.04 sec) mysql> 50 9 8 1 NULL コマンド 1 に metid が 1~50 までを指定して実 50 8 10 1 NULL 行した結果 正しく 50 個の Gaussian 用ファイル が出力されていることを確認した 以下はその一 50 10 8 1 NULL 部である 50 8 14 1 NULL out1/10: 合計 24 50 14 8 1 NULL -rw-rw-r--. 1 chika chika 153 4 月 1 03:00 2016 admph.com 50 9 11 1 NULL -rw-rw-r--. 1 chika chika 147 4 月 1 03:00 2016 admpl.com 50 11 9 1 NULL -rw-rw-r--. 1 chika chika 281 4 月 1 03:00 2016 gau.sh 50 9 15 1 NULL

2016 nmr0.com 2016 nmr1.com -rw-rw-r--. 1 chika chika 1924 4 月 1 03:00 2016 opt.com 0.282ppm (δ1h) 8.047 ppm (δ13c) 8.497Hz (njch) 1.802Hz (njhh) 4.553Hz (1JCC) であった また 藻類中に豊富に含まれていた Eicosapentaenoic acid (EPA) について 今回の実測値と 既往研究で知られているタンパク質中に 結合している EPA の 4 つの構造の理論値を比較し out1/11: 合計 24 -rw-rw-r--. 1 chika chika 153 4 月 1 03:00 2016 admph.com -rw-rw-r--. 1 chika chika 147 4 月 1 03:00 機能性のある構造との類似点 異なる点を調べた スピン結合定数の誤差が少ないほど 同様の部分的な相対配座を持っていることが分かる このことから 藻類中の EPA は 4 つの構造と部分的に類似の相対配座を持つことが示された 2016 admpl.com -rw-rw-r--. 1 chika chika 281 4 月 1 03:00 4. まとめ 2016 gau.sh 2016 nmr0.com 2016 nmr1.com -rw-rw-r--. 1 chika chika 349 4 月 1 03:00 2016 opt.com 部分構造 - 理論遮蔽定数 -NMR 実験値データベースは NMR 理論データ予測ソフトウェアのコマンド 1 コマンド 2 コマンド 3 の間でデータ仲介をするためのリレーショナルデータベースであり まずコマンド 1 で 分子 ID 原子 ID 結合先原子 ID 結合タイプを新規 DB に登録する コマンド 2 で Gaussian の結果をまとめる そして コマン ド 3 でそれらのデータを利用して化学シフトを予 out1/12: 合計 24 -rw-rw-r--. 1 chika chika 153 4 月 1 03:00 2016 admph.com -rw-rw-r--. 1 chika chika 147 4 月 1 03:00 2016 admpl.com -rw-rw-r--. 1 chika chika 281 4 月 1 03:00 2016 gau.sh 2016 nmr0.com 2016 nmr1.com -rw-rw-r--. 1 chika chika 597 4 月 1 03:00 2016 opt.com 測する parstrcta と parstrctb テーブルを SLDB に構築した parstrctb テーブルについては 1 行が 1 個の原子 - 結合先原子を表す 末尾の b は bond の b である bondtype は SDF からの取得値をそのまま設定する metid, atomid, atomidto, bondtype はコマンド 1 で登録する parstrcta テーブルについては 1 行が 1 個の原子を表す 末尾の a は atom の a である metid, atomid はコマンド 1 で登録する コマンド 1 は Gaussian 入力ファイル生成と parstrcta/b への原子情報登録コマンドである コマンド 1 の動作設定ファイルは代謝物 ID のリストである 代謝物 ID= 分子 ID で 以下 SLDB の対応する列名である metid である 各 metid に関する 原子情報を parstrcta/b に登録し 各 metid につ これらの各ディレクトリには Gaussian の HOKUSAI 実行用ファイルがセットアップされている 次に 藻類の 90 の代謝物中の 12 成分の化学シフト値およびスピン結合定数を正則化した実測値および理論値の比較解析では ほぼ全ての値が両側検定の採択域に入った それぞれの RMSD は いて Gaussian 入力ファイルを生成した コマンド 1 の動作設定ファイル b については Gaussian 入力ファイル生成に必要な 入力ファイルの命令行の文字列などを記述する コマンド 3 は新規 DB から回収した遮蔽定数データと SLDB から回収した実験化学シフトデータから動的に新しい理論化学シ

フト予測値を計算する コマンド 1 実行後の parstrcta の更新結果を確認し 代謝物毎に原子 ID が登録されていることが分かった また コマンド 1 実行後の parstrctb の更新結果を確認し 原子 ID と結合先原子 ID 結合タイプが登録されていることが分かった コマンド 1 に metid が 1~50 までを指定して実行した結果 正しく 50 個の Gaussian 用ファイルが出力されていることを確認した これらの各ディレクトリには Gaussian の HOKUSAI 実行用ファイルがセットアップされている 化学シフト予測法の精密化では 理論化学シフトに加え njhh njch 1JCC といった理論スピン結合定数も含めて総合的に解析することで 代謝混合物に対しての帰属精度の向上と立体構造の評価が可能になると考えられた 5. 今後の計画 展望部分構造 - 理論遮蔽定数 -NMR 実験値データベースと NMR 理論データ予測ソフトウェアのコマンド 1 コマンド 2 コマンド 3 の実装で部分的に終了していない部分があるため 改良が必要である 改良後は 実際に運用している化学シフトデータベースの数百の化合物に適用して 理論化学シフト計算方法の評価を行う 藻類の 90 の代謝物の化学シフト値およびスピン結合定数の実測値および理論値をまとめ 総合的な帰属および立体構造の評価を行う

平成 28 年度利用研究成果リスト 論文 学会報告 雑誌などの論文発表 1. Eisuke Chikayama, Yudai Shimbo, Keiko Komatsu, Jun Kikuchi, "The Effect of Molecular Conformation on the Accuracy of Theoretical 1H and 13C Chemical Shifts Calculated by Ab Initio Methods for Metabolic Mixture Analysis", Journal of Physical Chemistry B 120, 3479-3487(Mar 2016) 国際会議 学会などでの口頭発表 1. 伊藤研悟, 小松功典, 坪井裕理, 伊達康博, 菊地淳, 代謝混合物のフラグメント集積法による構造生成と計算化学による推定構造の総合評価, 日本農芸化学会 2016, 札幌, 2016 年 3 月 27-30 日 2. K. Ito, T. Komatsu, Y. Tsuboi, Y. Date, J. Kikuchi, Structure determination of metabolites in biological extract, ICMRBS 2016, Kyoto, 21-26 August 2016 3. 尾渕由佳, 伊藤研悟, 菊地淳, 理論化学シフト スピン結合定数と構造相関モデル式を用いた代謝混合物同定法の構築, 第 55 回 NMR 討論会, 広島, 2016 年 11 月 16-18 日