GC-MS データの詳細 Cnidium officinale Makino 川芎 ( センキュウ ) http://metabolomics.jp/wiki/crudedrug:cnidii_rhizoma
メタボロミクスの行程概要 (GC/MS の場合 )
メタボロミクスの抽出工程
メタボロミクスの誘導体化行程 E-isomer Z-isomer Glucose + 50 ml methoxyamine (20 mg/ml pyridine) + 50 ml MSTFA Vortex 10 s Shaking (30 C, 90 min) E-isomer Z-isomer Vortex 10 s Shaking (37 C, 30 min) Transfer 60 ml Centrifugation (3 min; 16,000 rcf)
GC/MS の分析条件 Injection order 1QC + 5samples Alkane mix Procedure brank QC QC QC QC QC 350 300 250 200 150 100 50 0 injection 30 min / sample 0 10 20 30 min injection Dunn W.B. et al., Nature Protocols 6 (2011) 1060 1083 Column CPSil-8CB MS 30 m 0.25 mm i.d.; 0.25 μm film Inlet temp. 230 C Gas flow 1.12 ml/min Transfer line temp. 250 C Ion source templ. 200 C Scan rate 20 Hz Mass range 85-500 m/z
Alkane mix は保持指標計算に必要 n-alkane standart mixture 1 (C8-C20) 50 ml (Sigma 04070) n-alkane standard mixture 2 (C21-C40) 50 ml (Sigma 04070) pyridine (GC-MS 誘導体化用 ) 50 ml 計 150 ml
netcdf (AIA) は各ベンダーソフトで出力可
Overview of common data formats 8
netcdf を直接読み込むための準備 9
保持指標の互換性
LC-MS リピドミクスデータの詳細 9 algal species Euglena gracilis (UTEX B367) Cricosphaera carterae (UTEX LB1014) Nannochloropsis oculata (UTEX LB2164) Dunaliella salina (UTEX LB200) Pavlova lutheri (UTEX 1293) Chlamydomonas reinhardtii(cc-125) Originally Chlorella minutissima (UTEX 2341) Chlorella sorokiniana (UTEX 2805) Chlorella variabilis (ATCC NC64A)
Mobile phase B(%) LC-MS 分析条件 (reverse phase LC) 100 TAG, CE 80 15 min / sample 60 40 LysoPL PL, SM, DG, MGDG, DGDG 20 0 0 2 4 6 8 10 12 14 min Separation of lipids Column: Mobile phase A: Mobile phase B: Oven temp.: 65 C Flow rate: Injection volume: ACQUITY UPLC CSH C18 (100 2.1 mm; 1.7 mm) 60:40 ACN:H 2 O + 10 mm AmF + 0.1% FA 90:10 IPA:ACN + 10 mm AmF + 0.1% FA 0.6 ml/min 3 ml Sample temp.: 4 C * ACN: Acetonitrile IPA: 2-Propanol AmF: Ammonium formate FA: Formic acid
Overview of common data formats 13
脂質構造を定義するフラグメントイオン (Negative) 14
脂質構造を定義するフラグメントイオン (Positive) 15
リピドミクスにおける脂質の命名法 http://prime.psc.riken.jp/metabolomics_software/ms-dial/index5.html 16
LC-MS ワインデータの詳細
アノテーションとは?
アノテーションの第一選択 : スペクトル DB MS/MS database ID Name Number of MS/MS spectra Number of compounds Online search Freely Instrument available diversity 1 NIST14 MS/MS 234,284 9,344 - $ +++ 2 MassBank 26,296 3,127 + + +++ 3 Metlin 67,428 13,021 + +/$ + 4 MONA 194,000 68,700 + + +++ 5 mzcloud 209,000 2,997 + + + 6 GNPS 9,000 8,000 + + ++ 7 Respect 9,000 4,000 + + + 8 MSforID 20,000 1,200 - $ + 9 HMDB 5,773 3,729 + + + 10 MetaMS 150 150 + + + 11 Sumner Plant Lib 1,734 289 - + + 12 ChemicalSoft 1,619 6,476 - +/$ + 13 Designer Drugs 10,000 750 - $ + 14 Drugs/Poisons 10,000 6,816 - $ + 15 DTU Microbials 836 277 - + + 16 WEISMS 3,540 3,540 - +/$ + Biomolecule database ID Name Species Number of compounds 1 BMDB Bovine 7225 2 ChEBI Small biomolecules 26599 3 DrugBank Drug 6273 4 ECMDB E. coli 1339 5 FooDB Food 15634 6 HMDB Human 39993 7 KNApSAcK Natural product 45844 8 PlantCyc Plant 3828 9 PubChem Small biomolecules 12026 10 SMPDB Small biomolecules 1487 11 T3DB Toxic 2527 12 UNPD Natural product 166965 13 YMDB Yeast 1838 14 STOFF Environment 8515
アノテーションの第一選択 : スペクトル DB MoNA: MassBank of North America
アノテーションの第一選択 : スペクトル DB MS-DIAL start up kit
How to annotate metabolites 22 Nature methods, 15, 53-56, 2018; Current opinion in biotechnology 54, 10-17, 2018
Database comparison MS/MS database ID Name Number of MS/MS spectra Number of compounds Online search Freely Instrument available diversity 1 NIST14 MS/MS 234,284 9,344 - $ +++ 2 MassBank 26,296 3,127 + + +++ 3 Metlin 67,428 13,021 + +/$ + 4 LipidBlast TRAP 212,516 119,200 - + ++ 5 LipidBlast TOF 135,704 61,513 - + ++ 6 MONA 194,000 68,700 + + +++ 7 mzcloud 209,000 2,997 + + + 8 GNPS 9,000 8,000 + + ++ 9 Respect 9,000 4,000 + + + 10 MSforID 20,000 1,200 - $ + 11 HMDB 5,773 3,729 + + + 12 MetaMS 150 150 + + + 13 Sumner Plant Lib 1,734 289 - + + 14 ChemicalSoft 1,619 6,476 - +/$ + 15 Designer Drugs 10,000 750 - $ + 16 Drugs/Poisons 10,000 6,816 - $ + 17 DTU Microbials 836 277 - + + 18 WEISMS 3,540 3,540 - +/$ + Compound database ID Name Species Number of compounds 1 BMDB Bovine 7225 2 ChEBI Small biomolecules 26599 3 DrugBank Drug 6273 4 ECMDB E. coli 1339 5 FooDB Food 15634 6 HMDB Human 39993 7 KNApSAcK Natural product 45844 8 PlantCyc Plant 3828 9 PubChem Small biomolecules 12026 10 SMPDB Small biomolecules 1487 11 T3DB Toxic 2527 12 UNPD Natural product 166965 13 YMDB Yeast 1838 14 STOFF Environment 8515 68,297,635
Why are there so many unknowns? 24
In silico based annotation (top-down approach) 25 Analytical Chemistry 88, 7946-7958, 2016
Relative abundance (%) Relative abundance (%) Relative abundance (%) Relative abundance (%) この MS/MS スペクトルの元構造は何でしょう? 1.Negative, <10ppm, Human 2.Positive, <3ppm, Drug 100 78.9597 100 448.1951 386.0155 80 80 60 158.9249 60 m/z 609.2807 40 40 397.2104 20 256.9616 96.9693 274.9731 368.003 20 195.0649 236.1267 368.1479 577.2516 0 50 100 150 200 250 300 350 400 m/z 0 200 300 400 500 600 m/z 3.Negative, <10ppm, Human 100 79.9588 212.0018 100 4.Positive, <3ppm, Plant (Onion) 253.0676 80 80 60 80.9665 132.046 60 236.041 40 20 0 80 100 120 140 160 180 200 220 m/z 40 20 0 382.1105 307.0783 145.3135 177.0328 289.0676 150 200 250 300 350 400 m/z 26
Relative abundance (%) 組成式候補の出力 1.Negative, <10ppm, Human 100 80 78.9597 386.0155 60 158.9249 40 20 256.9616 96.9693 274.9731 368.003 0 50 100 150 200 250 300 350 400 m/z m/z 386.0155±0.005 as [M-H] - C x H y N z O u S v P w C: 12 H: 1.00782503 N: 14.0030740 O: 15.9949146 S: 31.9720710 P: 30.9737616 e-: 0.00054857 27
組成式の絞り込み : ルールの活用 原子価測の確認 例 )C 8 H 7 NO 4 S TA: 8+7+1+4+1 = 21 OV: 7+1 = 8 SV: 32+7+3+8+6=56 元素の総数を TA 原子価が奇数の元素の総数を OV 原子価の総数を SV としたとき, OV * SV = even SV >= 2* (TA - 1) ただし,N(3), O(2), P(5), S(6) 経験的閾値 Mass H/C N/C O/C P/C S/C Max 1999.90 8.00 4.00 10.00 3.00 6.00 Min 50.02 0.00 0.00 0.00 0.00 0.00 Mean 601.03 1.38 0.10 0.32 0.01 0.02 Stdev 349.29 0.43 0.15 0.27 0.04 0.09 Median 512.32 1.39 0.04 0.27 0.00 0.00 Percentile 0.15% 72.05 0.00 0.00 0.00 0.00 0.00 Percentile 0.005% 52.02 0.00 0.00 0.00 0.00 0.00 Percentile 99.85% 1939.74 3.33 1.20 2.20 0.40 1.00 Percentile 99.995% 1998.10 6.00 4.00 6.00 1.83 3.00 28
組成式の絞り込み : ルールの活用 原子価測の確認 例外 )C 15 H 11 O 6 TA: 15+11+6 = 32 OV: 11 = 11 SV: 60+11+12=83 -> ルールには例外がつきもの! ということを, 理解しておく. 元素の総数を TA 原子価が奇数の元素の総数を OV 原子価の総数を SV としたとき, OV * SV = even SV >= 2* (TA - 1) ただし,N(3), O(2), P(5), S(6) 経験的閾値 Mass H/C N/C O/C P/C S/C Max 1999.90 8.00 4.00 10.00 3.00 6.00 Min 50.02 0.00 0.00 0.00 0.00 0.00 Mean 601.03 1.38 0.10 0.32 0.01 0.02 Stdev 349.29 0.43 0.15 0.27 0.04 0.09 Median 512.32 1.39 0.04 0.27 0.00 0.00 Percentile 0.15% 72.05 0.00 0.00 0.00 0.00 0.00 Percentile 0.005% 52.02 0.00 0.00 0.00 0.00 0.00 Percentile 99.85% 1939.74 3.33 1.20 2.20 0.40 1.00 Percentile 99.995% 1998.10 6.00 4.00 6.00 1.83 3.00 29
3 ヶ月前に受けた質問への回答 C15H11O6+ は原子価則を満たすのではないか ということに関して, ここに整理します. (3ヶ月前の講習会にて) まず,C15H11O6+ と, + を書いてしまっているのが, 混乱の原因だったかと思います. C15H11O6+ と書くと, この組成式は原子価則を満たします. 一方, 前提条件として, 私が作っているMS-FINDERというプログラムは, m/zとアダクトタイプを指定することで, ニュートラル ( 電荷を持たない状態 ) での組成式を出力する というものになります. 出していた構造は, シアニジン Exact mass as C15H11O6+: 287.0550145 となっておりますが, アダクトタイプは [M]+ と与えれば, 正解組成式が組成式候補として含まれます. もちろん [M+H]+ としてしまうと, 正解組成式が出力されない, というのはご理解いただけると思います. 一方,[M]+ と考えた場合です. このプログラムが出力する組成式の中で, もちろん, C15H11O6:287.0555 を候補として考えます. しかし, ここでのポイントは, この組成式は, ニュートラル な構造として解釈されることになります. この場合において, C15H11O6は資料に示すように, 原子価則を満たさないものとして候補から除外されます. 一方, 出力組成式を C15H11O6ではなく,C15H11O6+として考える場合,Hを一つ補完して考えれば, ご指摘のように原子価則を満たすことになります. ですが, プログラムの仕様上, 原子価則を適用する というオプションをつけて組成式を 30 計算させてしまうと, 上記の理由から, この正解組成式は出力されません.
Relative abundance (%) Relative abundance (%) Relative abundance (%) Relative abundance (%) 組成式の決定 : コンピューターを使いましょう 1.Negative, <10ppm, Human 2.Positive, <3ppm, Drug 100 80 78.9597 100 386.0155 C 9 H 15 N 3 O 10 P 2 80 C 33 H 40 N 2 O 9 448.1951 60 158.9249 60 40 40 397.2104 20 256.9616 96.9693 274.9731 368.003 20 195.0649 236.1267 368.1479 577.2516 0 50 100 150 200 250 300 350 400 m/z 0 200 300 400 500 600 m/z 3.Negative, <10ppm, Human 100 79.9588 212.0018 100 4.Positive, <3ppm, Plant (Onion) 253.0676 80 C 8 H 7 NO 4 S 80 C 13 H 23 N 9 O 4 S 2 60 80.9665 132.046 60 236.041 40 20 0 80 100 120 140 160 180 200 220 m/z 40 20 0 382.1105 307.0783 145.3135 177.0328 289.0676 150 200 250 300 350 400 m/z 31
In silico based annotation (top-down approach) 32 Analytical Chemistry 88, 7946-7958, 2016
In silico based annotation (top-down approach) 33 Analytical Chemistry 88, 7946-7958, 2016