2013 年 10 月 30 日 ( 水 ) バイオ情報解析演習 ウェブツールを活用した生物情報解析 (1) 配列と代謝経路の解析の基礎
有用物質生産菌を合理的に作ろう! 設計 試作 ベンチテスト 完成 プラスミド 効率的な代謝経路を設計する 文献調査代謝パスウェイの探索代謝シミュレーション 実際に微生物に組み込む データベースから有用遺伝子を探索する遺伝子組換え技術 培養をして問題点を突き止める 培養代謝物量 フラックスのデータを解析し 問題点を突き止める
ウェブツールを活用した生物情報解析 の予定 10 月 28 日 ( 水 ) 1. 配列と代謝経路の解析の基礎 11 月 6 日 ( 水 ) 2. 塩基配列 アミノ酸配列のマルチアライメントと進化系統樹 11 月 13 日 ( 水 ) 3. 相同性検索 11 月 20 日 ( 水 ) 4. 遺伝子のクローニングの設計 参考図書改訂第 2 版バイオデータベースとウェブツールの手とり足とり活用法 ( 羊土社 ) バイオインフォマティクス第 2 版ゲノム配列から機能解析へ ( メディカル サイエンス インターナショナル ) 2
今日の授業のモチベーション 大腸菌でブタノールを生産したい ブタノールを生産する他の生物の遺伝子を大腸菌に組み込む そのためには 1. ブタノールを生産する生物種を探す 2. ブタノール合成経路の遺伝子を探す 3. 遺伝子をクローニングするために塩基配列を獲得する 4. 遺伝子およびその酵素の情報を収集する ウェブツールを利用する 3
生物学研究におけるウェブツールの活用 興味のある機能を持つタンパク質を抽出 これらはウェブブラウザを介して解析できる! この配列の中で 遺伝子のコード領域 (CDS ORF) はどこか? その機能に関係のあるタンパク質をコードする遺伝子 DNA 断片をクローニング 遺伝子 DNA の塩基配列を決定 TACACACGAATAAAAGATAACAAAGATGAGTAAAGGAGA AGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATT AGATGGCGATGTTAATGGGCAAAAATTCTCTGTCAGTGG AGAGGGTGAAGGTGATGCAACATACGGAAAACTTACCCT TAAATTTATTTGCACTACTGGGAAGCTACCTGTTCCATG GCCAACACTTGTCACTACTTTCTCTTATGGTGTTCAATG CTTTTCAAGATACCCAGATCATATGAAACAGCATGACTT TTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAAAG AACTATATTTTACAAAGATGACGGGAACTACAAGACACG TGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATAG AATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAA CATTCTTGGACACAAAATGGAATACAACTATAACTCACA TAATGTATACATCATGGCAGACAAACCAAAGAATGGAAT CAAAGTTAACTTCAAAATTAGACACAACATTAAAGATGG AAGCGTTCAATTAGCAGACCATTATCAACAAAATACTCC AATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTA CCTGTCCACACAATCTGCCCTTTCCAAAGATCCCAACGA AAAGAGAGATCACATGATCCTTCTTGAGTTTGTAACAGC TGCTGGGATTACACATGGCATGGATGAACTATACAAATA AATGTCCAGACTTCCAATTGACACTAAAGTGTCCGAACA ATTACTAAATTCTCAGGGTTCCTGGTTAAATTCAGGCTG AGACTTTATTTATATATTTATAGATTCATTAAAATTTTA TGAATAATTTATTGATGTTATTAATAGGGGCTATTTTCT TATTAAATAGGCTACTGGAGTGTAT コードするタンパク質はどのような機能を持っていると推測されるか? この遺伝子の発現制御にかかわる DNA 配列には どのようなものがあるか? このタンパク質が持つ活性に関係のある配列モチーフには どのようなものがあるか? このタンパク質の立体構造はどうなっているのか? この遺伝子やタンパク質に関する過去の知見 ( 文献 ) にはどのようなものがあるか? 4
さまざまな生物情報データベース 塩基配列データベース : GenBank EMBL DDBJ アミノ酸配列データベース : SWISS-PLOT TrEMBL GenPept タンパク質の立体構造データベース : PDBj SCOP など タンパク質機能データベース : PROSITE Pfam InterPro など 代謝データベース : KEGG MetaCyc 酵素データベース : BREBDA ENZYME 各種生物のゲノムデータベース : EcoCyc ( 大腸菌 ) GenoBase ( 大腸菌 ) SGD ( 酵母 ) など 微生物ゲノムの統合データベース : MBGD トランスクリプトームデータのデータベース : GEO など 文献データベース : Entrenz PubMed Google Scholar など これらのデータベース名を Google 等で検索し どういうデータベースかを調べてみよう これらのデータベースから情報を入手し さまざまなバイオインフォマティクスの解析を行うことができる これらのデータベースの情報を活用した さまざまなツールがインターネット上に存在する 5
本日の内容 1. 塩基配列 アミノ酸配列の入手 2. KEGG データベースを用いた代謝経路設計 6
配列の表記は核酸塩基 アミノ酸ともに左から右へ DNA RNA の塩基配列 5 3 ATGTGCGGCCTTCTTGGCATATTGACTGCA 左から右へ 5 3 となるように記述する タンパク質のアミノ酸配列 N 末端 C 末端 MCGLLGILTANGNAEAFVPALERALPCMRH 左から右へ N 末端 C 末端となるように記述する 7
配列の表記は核酸塩基 アミノ酸ともに 1 文字表記 核酸塩基の 1 文字表記 アミノ酸の 1 文字表記 Code Description A Adenine C Cytosine G Guanine T Thymine U Uracil R Purine (A or G) Y Pyrimidine (C, T, or U) M C or A K T, U, or G W T, U, or A S C or G B C, T, U, or G (not A) D A, T, U, or G (not C) H A, T, U, or C (not G) V A, C, or G (not T, not U) N Any base (A, C, G, T, or U) 1-letter A R N D C Q E G H I L K M F P S T W Y V B Z X Description Alanine Arginine Asparagine Aspartic acid Cysteine Glutamine Glutamic acid Glycine Histidine Isoleucine Leucine Lysine Methionine Phenylalanine Proline Serine Threonine Tryptophan Tyrosine Valine Aspartic acid or Asparagine Glutamine or Glutamic acid Any amino acid 8
塩基配列データベース 国際塩基配列データベース DDBJ ( 国立遺伝学研究所 DDBJ) EMBL ( ヨーロッパ EBI) GenBank ( アメリカ NCBI) 全世界の研究者が取得した塩基配列データを 3 機関が定めた統一の基準によって収集 編纂したもの データの登録は 配列データを取得した研究者自身が行う ( 国際学術論文に新規取得した配列を掲載する際には これらのうちいずれかのデータベースに登録することが義務 ) [ 問題点 ] 統一基準を用いているとはいえ さまざまな種類のデータが混在している データの由来は異なるが 配列としては同一と見なせるデータが多数混在しており 冗長性を招いている 9
アミノ酸配列データベース SWISS-PROT 研究者が人手でハイレベルのアノテーション ( 付加情報 ) をつけたタンパク質 / アミノ酸配列データベース TrEMBL コンピュータにより ハイレベルのアノテーション ( 付加情報 ) をつけたタンパク質 / アミノ酸配列データベース GenPept 塩基配列データベースに登録されている配列を 自動的にアミノ酸配列に翻訳したものを登録 PIR 国際的なタンパク質 / アミノ酸配列データベース日本 (JPID) アメリカ (NBRF) ヨーロッパ (MIPS) の共同で開発 SWISS-PROT TrEMBL GenPept などの情報を統合し 重複を除いた PIR-NREF も開発 10
配列の記述形式 DNA の塩基配列やタンパク質のアミノ酸配列を用いて解析する際には 配列を適切な形式で記述する必要がある (1) GenBank 形式 ( アミノ酸配列は GenPept 形式 ) 文献情報 配列の機能情報 mrna やコード領域の位置 重要な変異の位置などの情報を配列とともに記述 (2) FASTA 形式配列の名前や由来に関する情報と配列のみを記述 DNA の塩基配列やタンパク質のアミノ酸配列には それぞれに固有の Accession number が付与されている 11
配列の記述形式 1 GenBank 形式 LOCUS 遺伝子座の名前 配列の長さと種類 生物分類 登録の日付 DEFINITION 配列の名前 ACCESSION アクセッション番号 VERSION 配列のバージョン KEYWORDS この配列を相互参照するためのキーワード SOURCE 由来となる生物 識別子と呼ばれ 解析プログラム ORGANISM 生物の詳細な記述 がこれらを認識して配列を扱う REFERENCE 文献情報 AUTHORS 著者名 TITLE タイトル JOURNAL 雑誌名 巻 号 ページ 出版年 PUBMED PubMed ID FEATURES 位置あるいは領域ごとの配列についての情報 FEATURESにはほかに source 配列の範囲 由来となる生物 intron ( イントロンの範囲 ) misc_signal 配列の範囲 機能やシグナルの種類 promoter ( プロモーターの範囲 ) mrna 配列の範囲 mrna mutation ( 変異の位置 ) gene 配列の範囲 遺伝子 等の情報を入力できる CDS 配列の範囲 コード領域 ORIGIN 配列の始まり 1 atgtgcggcc ttcttggcat attgactgca aatgggaacg ctgaagcatt cgttcctgca 61 ctcgagcggg ccttgccatg catgcgccac cgtggtcctg acgatgccgg cacttggcat // 配列の終わり 12
GenBank 形式で記述した配列 ( 例 ) LOCUS AB029550 1923 bp DNA linear BCT 23-MAY-2000 DEFINITION Corynebacterium glutamicum genes for LtsA, ORF1, complete cds. ACCESSION AB029550 REGION: 815..2737 VERSION AB029550.1 GI:6714539 配列の由来となる生物種 KEYWORDS ORF1; LtsA. SOURCE Corynebacterium glutamicum ORGANISM Corynebacterium glutamicum Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Corynebacteriaceae; Corynebacterium. REFERENCE 1 AUTHORS TITLE Hirasawa,T., Wachi,M. and Nagai,K. A mutation in the Corynebacterium glutamicum ltsa gene causes susceptibility to lysozyme, temperature-sensitive growth, and L-glutamate production JOURNAL J. Bacteriol. 182 (10), 2696-2701 (2000) PUBMED 10781535 REFERENCE 2 (bases 1 to 1923) AUTHORS TITLE JOURNAL Accession number Wachi,M. and Hirasawa,T. Direct Submission Submitted (03-JUL-1999) Masaaki Wachi, 配列に関連する文献の情報 Tokyo Institute of Technology, Department of Bioengineering; 4259 Nagatsuta Midori-ku, Yokohama, Kanagawa 226-8501, Japan (E-mail:mwachi@bio.titech.ac.jp, Tel:81-45-924-5770, Fax:81-45-924-5820) 13
FEATURES Location/Qualifiers source 1..1923 /organism="corynebacterium glutamicum" /mol_type="genomic DNA" /strain="ky9611" /db_xref="taxon:1718" gene Coding sequence 1..1923 (ORFに相当) の略 /gene="ltsa" CDS 1..1923 /gene="ltsa" /codon_start=1 CDSの位置 ( この場合は1から1923 番目まで ) /transl_table=11 /product="ltsa" /protein_id="baa89484.1" CDSに関する情報 /db_xref="gi:6714540" /translation="mcgllgiltangnaeafvpaleralpcmrhrgpddagtwhdada AFGFNRLSIIDIAHSHQPLRWGPADEPDRYAMTFNGEIYNYVELRKELSDLGYTFNTS 配列 < 途中省略 > DELFGWAQDTIKESGTEDIFNKQAVLDMLNEHRDGVSDHSRRLWTVLSFMVWHGIFVE NRIDPQIEDRSYPVEL ORIGIN 5 末端 1 atgtgcggcc ttcttggcat attgactgca aatgggaacg ctgaagcatt cgttcctgca 61 ctcgagcggg ccttgccatg catgcgccac cgtggtcctg acgatgccgg cacttggcat < 途中省略 > 1861 atttttgtgg aaaaccgcat tgatccacag attgaggacc gctcctaccc ggtcgagctt 1921 taa // 3 末端 14
アミノ酸配列 (GenPept 形式 ) アミノ酸配列 LOCUS BAB96652 588 aa linear BCT 20-NOV-2008 DEFINITION transpeptidase involved in septal peptidoglycan synthesis [Escherichia coli str. K-12 substr. W3110]. ACCESSION BAB96652 VERSION BAB96652.1 GI:21321965 Accession number DBSOURCE accession AP009048.1 KEYWORDS. SOURCE Escherichia coli str. K-12 substr. W3110 ORGANISM Escherichia coli str. K-12 substr. W3110 Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia. REFERENCE 1 AUTHORS TITLE Musso,R., Di Lauro,R., Rosenberg,M. and de Crombrugghe,B. Nucleotide sequence of the operator-promoter region of the galactose operon of Escherichia coli JOURNAL Proc. Natl. Acad. Sci. U.S.A. 74 (1), 106-110 (1977) PUBMED 319453 一部省略 REFERENCE 142 (residues 1 to 588) AUTHORS TITLE JOURNAL Mori,H., Hirai,A., Morooka,N. and Horiuchi,T. Direct Submission Submitted (22-AUG-2005) Contact:Hirotada Mori Graduate School of Biological Sciences, Nara Institute of Science and Technology; 8916-5 Takayama, Ikoma, Nara 630-0101, Japan FEATURES Location/Qualifiers source 1..588 /organism="escherichia coli str. K-12 substr. W3110" /strain="k-12" /sub_strain="w3110" /db_xref="taxon:316407" Protein 1..588 /product="transpeptidase involved in septal peptidoglycan synthesis" Region 2..579 /region_name="prk15105" /note="peptidoglycan synthase FtsI; Provisional" /db_xref="cdd:185060" Region 71..222 /region_name="pbp_dimer" /note="penicillin-binding Protein dimerisation domain; pfam03717" /db_xref="cdd:190723" Region 260..554 /region_name="transpeptidase" /note="penicillin binding protein transpeptidase domain; cl01039" /db_xref="cdd:154162" CDS 1..588 /gene="ftsi" /coded_by="ap009048.1:91413..93179" /note="eck0085:jw0082:b0084; penicillin-binding protein 3" /transl_table=11 ORIGIN N 末端 1 mkaaaktqkp krqeehanfi swrfallcgc illalafllg rvawlqvisp dmlvkegdmr // 61 slrvqqvsts rgmitdrsgr plavsvpvka iwadpkevhd aggisvgdrw kalanalnip 一部省略 481 gvkaaikgyr iaiktgtakk vgpdgryink yiaytagvap asqprfalvv vindpqagky 541 yggavsapvf gaimggvlrt mniepdaltt gdknefvinq gegtggrs C 末端 タンパク質の名称 由来となる生物種 この配列に関連する文献の情報 71 番目から 222 番目までのアミノ酸領域が penicillin-binding protein の二量体化 (dimerization) に関与する 261 番目から 554 番目までのアミノ酸領域が transpeptidase ドメインとして機能する 1 番目から 588 番目まで ( 全長 ) が coding sequences (CDS) である ftsi という遺伝子がコードしている
配列の記述形式 2 FASTA 形式 >gi 6714539:815-2737 Corynebacterium glutamicum genes for LtsA, ORF1, complete cds ATGTGCGGCCTTCTTGGCATATTGACTGCAAATGGGAACGCTGAAGCATTCGTTCCTGCACTCGAGCGGG CCTTGCCATGCATGCGCCACCGTGGTCCTGACGATGCCGGCACTTGGCATGACGCCGATGCAGCGTTTGG ATTCAACCGCCTCTCCATCATTGATATTGCACACTCCCACCAACCACTGCGTTGGGGACCTGCGGATGAA CCCGACCGCTACGCAATGACTTTCAACGGTGAGATCTACAACTACGTTGAGCTGCGTAAAGAGCTCTCGG ATTTGGGATATACCTTTAATACTTCTGGCGATGGCGAGCCAATTGTTGTCGGTTTCCACCACTGGGGCGA GTCCGTGGTCGAGCATCTCCGCGGAATGTTCGGCATTGCCATTTGGGATACAAAGGAAAAGTCGCTTTTC CTTGCGCGTGATCAGTTCGGCATCAAGCCACTGTTCTACGCAACCACCGAGCATGGCACCGTGTTCTCCT CAGAGAAGAAGACCATCTTGGAGATGGCCGAGGAGATGAATCTAGATCTGGGCCTTGATAAGCGCACCAT TGAGCACTACGTGGACCTGCAGTACGTGCCCGAGCCAGATACCCTTCACGCGCAGATTTCCCGCTTGGAG TCAGGCTGCACCGCAACAGTTCGTCCGGGCGGCAAGCTGGAACAGAAGCGTTACTTCAAGCCTCAGTTCC (1) 1 行目は > という文字とその後に配列の名前が続く注釈行 CAGTACAGAAGGTCGTAAAGGGTAAGGAGCAGGACCTCTTCGATCGCATTGCCCAGGTGTTGGAGGATAG CGTCGAAAAGCATATGCGTGCCGACGTGACCGTAGGCTCGTTCCTTTCCGGCGGCATTGACTCAACCGCA ( > と文字の間にスペースを入れてはいけない ) ATTGCGCCGCTTGCAAAGCGCCACAACCCTGACCTGCTCACCTTCACCACCGGTTTCGAGCGTGAAGGCT ACTCGGAGGTCGATGTGGCTGCGGAGTCCGCCGCTGCGATTGGCGCTGAGCACATCGTGAAGATTGTCTC (2) 2 行目以降は1 文字記号で表される配列 GCCTGAGGAATACGCCAACGCGATTCCTAAGATCATGTGGTACTTGGATGATCCTGTAGCTGACCCATCA TTGGTCCCGCTGTACTTCGTGGCAGCGGAAGCACGTAAGCACGTCAAGGTTGTGCTGTCTGGCGAGGGCG CAGATGAGCTGTTCGGTGGATACACCATTTACAAAGAGCCGCTATCGCTTGCTCCATTTGAGAAGATCCC TTCCCCACTACGTAAAGGCCTGGGAAAGCTCAGCAAGGTTCTGCCAGACGGCATGAAGGGCAAGTCCCTT CTTGAGCGTGGCTCCATGACCATGGAAGAGCGCTACTACGGCAACGCTCGCTCCTTCAATTTCGAGCAGA TGCAACGCGTTATTCCATGGGCAAAGCGCGAATGGGACCACCGCGAAGTCACTGCACCGATCTACGCACA ATCCCGCAACTTTGATCCAGTAGCCCGCATGCAACACCTGGATCTGTTCACCTGGATGCGCGGCGACATC CTGGTCAAGGCTGACAAGATCAACATGGCGAACTCCCTTGAGCTGCGAGTTCCATTCTTGGATAAGGAAG TTTTCAAGGTTGCAGAGACCATTCCTTACGATCTGAAGATTGCCAACGGTACCACCAAGTACGCGCTGCG CAGGGCACTCGAGCAGATTGTTCCGCCTCACGTTTTGCACCGCAAGAAGCTGGGCTTCCCTGTTCCCATG CGCCACTGGCTTGCCGGCGATGAGCTGTTCGGTTGGGCGCAGGACACCATTAAGGAATCCGGTACTGAAG ATATCTTCAACAAGCAGGCTGTGCTGGATATGCTGAACGAGCACCGCGATGGCGTGTCAGATCATTCCCG TCGACTGTGGACTGTTCTGTCATTTATGGTGTGGCACGGCATTTTTGTGGAAAACCGCATTGATCCACAG 塩基配列 :5 末端アミノ酸配列 :N 末端 ATTGAGGACCGCTCCTACCCGGTCGAGCTTTAA 塩基配列 :3 末端アミノ酸配列 :C 末端 配列名 16
配列の入手 NCBI (National Center for Biotechnology Information) Gene http://www.ncbi.nlm.nih.gov/gene/ Protein http://www.ncbi.nlm.nih.gov/protein/ KEGG (Kyoto Encyclopedia of Genes and Genomes) http://www.genome.jp/kegg/ 17
配列の入手塩基配列の入手 NCBI Gene http://www.ncbi.nlm.nih.gov/gene/ 生物種名 遺伝子名 Accession number 等を入力して Search ボタンをクリック 例えば 大腸菌 Escherichia coli k12 株の dnaa 遺伝子の配列を入手する Escherichia coli K12 and dnaa と入力し Search ボタンをクリック 18
配列の入手塩基配列の入手 発見 Accession number [ 今後の検索のために ] 1) 検索の際に複数のワードを AND もしくは OR でつなぐことができる スペースでワードをつなげると AND と同じ結果になる 2) 大文字 小文字の区別はない 19
配列の入手塩基配列の入手 遺伝子の機能に基づく名前 遺伝子がコードする酵素の機能 遺伝子のゲノム上の位置などに基づく名前 20
配列の入手塩基配列の入手 ゲノム上での近傍の遺伝子を含む位置情報 FASTA 形式の塩基配列 GenBank 形式の塩基配列 21
配列の入手塩基配列の入手 FASTA 形式の塩基配列の獲得に成功 22
配列の入手アミノ酸配列の入手 同じようにして タンパク質のアミノ酸配列も入手してみる Entrez Protein: http://www.ncbi.nlm.nih.gov/protein aequorea victoria AND gfp と入力して Search ボタンをクリックする 23
それらしいものを見つけたら 配列名のリンクをクリック 直接 目的の形式でタンパク質配列を取得できる 24
GenePept 形式で表示される ここをクリックすると FASTA 形式に表示が変わる 立体構造を調べることが可能 25
配列の入手 個々の生物のゲノム情報のデータベースも存在する 生物種 大腸菌 酵母 シロイヌナズナ ヒト 全般 データベース Encyclopedia of Escherichia coli K-12 Genes and Metabolism (EcoCyc) GenoBase 6.0 Profiling of E. coli Chromosome (PEC) Saccharomyces genome database (SGD) The Arabidopsis Information Resource (TAIR) Human Genome Project Information Ensembl Human Kyoto Encyclopedia of Genes and Genomes (KEGG) Entrez Genome Entrez Gene BioCyc Genome Information Broker (GIB) 26
配列の入手 KEGG を使ってゲノム配列が決定されている生物種の配列情報を入手する KEGG: http://www.genome.jp/kegg/ 配列 代謝経路 代謝物質 酵素 酵素反応などを統合的 横断的に解析することができるデータベース 例 ) パン酵母 (Saccharomyces cerevisiae) の ADH 遺伝子の配列を入手する KEGG Organisms をクリックする 27
この表の中から 生物種を選ぶ 下へ移動して Saccharomyces cerevisiae をクリック 28
ここに 検索キーワード ADH を入力し Go ボタンをクリックする 29
ここをクリック 酵母には複数の ADH 遺伝子が存在する 30
各種データベースへのリンク NCBI の ADH5 遺伝子の情報へ移動 下へ移動すると 31
配列が現れる ここをクリックすると 配列が FASTA 形式で表示される アミノ酸配列 表示されている配列はそのままコピペできる CDS (ORF) の塩基配列 ここに数字を入れて NT seq ボタンをクリックすると CDS の上流 (+upstream) 下流 (+downstream) の配列を付加した配列が FASTA 形式で表示される 32
ADH5 遺伝子が関連する代謝経路の情報 解糖系をクリックする 33
ADH5 遺伝子がコードするタンパク質の酵素番号が赤で示される AcetaldehydeをEthanolに変換することが図から読み取れる 34
本日の内容 1. 塩基配列 アミノ酸配列の入手 2. KEGG データベースを用いた代謝経路設計 35
代謝経路の情報収集 KEGG データベースの利用 KEGG データベース 代謝ネットワークの情報を含む統合データベース KEGG Pathway : 代謝ネットワーク情報 KEGG Genes : 遺伝子の情報 KEGG Ligand : 化合物の情報 KEGG Pathway (http://www.kegg.jp/kegg/pathway.html) 目的 各生物の代謝反応の違いを調べる 目的物質の生産に必要な遺伝子を探索する 36
KEGG Pathway 大きなカテゴリの代謝経路リスト Metabolic pathways 全代謝経路 Biosynthesis of amino acids 全アミノ酸の合成系路 上記のカテゴリを細分化した代謝経路リスト Glycolysis / Gluconeogenesis 解糖系 / 糖新生 Lysine biosynthesis リジン合成経路 37
KEGG Pathway 解析対象の生物を選択する小技 : 生物名の頭文字をキーボードで入力してみる ( 三文字目まで認識される ) 例 ) 大腸菌 (Escherichia coli) を調べたいときは E や Esc と素早く入力する 拡大できる 38
大腸菌 (Escherichia coli MG1655) の代謝反応全体図 39
酵母 (Saccharomyces cerevisiae (budding yeast)) の代謝反応全体図 大腸菌にはない 大腸菌にはある 40
解糖系 生物種を選択することで その生物種がもつ代謝反応がわかる は酵素反応や遺伝子の情報 は代謝物質の情報にリンクがある 酵素番号クリックすると酵素反応や遺伝子の情報へ 代謝物質の情報へ Escherichia coli K-12 MG1655 を選択 緑色が大腸菌が有する反応 41
反応番号 :R number 化学反応 ( 代謝反応 ) 固有の番号 物質名による反応 化合物番号による反応 酵素番号 この反応が含まれる代謝経路 42
化合物番号 :C number 化合物固有の番号 17,096 の化合物が登録されている C00001 H 2 O C00002 ATP C00003 など NAD + C00469 の例 化合物名 この化合物が関与する反応番号 この化合物が関与する代謝経路 この化合物が関与する酵素番号 43
酵素番号 :EC number 酵素反応の種類をグループ化した物 EC 1.X.X.X : オキシドレダクターゼ ( 酸化還元酵素 ) EC.1.1.X.X : CH-OHの結合に対し働く EC.1.1.1.X : NAD 又はNADPを用いる EC.1.1.2.X : チトクロムを用いる EC.1.1.3.X : 酸素を用いる EC 2.X.X.X : トランスフェラーゼ ( 転移酵素 ) EC 3.X.X.X : ヒドロラーゼ ( 加水分解酵素 ) EC 4.X.X.X : リアーゼ ( 脱離酵素 ) EC 5.X.X.X : イソメラーゼ ( 異性化酵素 ) EC 6.X.X.X : リガーゼ ( 合成酵素 ) 44
酵素番号 :EC number EC 1.1.1.1 の例 酵素反応の名称 代表的な反応 EC 1.1.1.1 の反応に分類された反応番号 EC 1.1.1.1 の反応を持つ生物種とその遺伝子名 45
代謝経路設計 大腸菌でブタノールを生産したい ( レポート問 5) ブタノールが関連する代謝経路を探す その経路で大腸菌が持つ 持たない遺伝子を調べる ブタノール生産に必要な遺伝子の内 大腸菌が持たない遺伝子を持つ他の生物を探すまずは検索してみましょう 46