PowerPoint プレゼンテーション

Similar documents
PowerPoint プレゼンテーション

130712AJACS40

PowerPoint プレゼンテーション

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日


KEGG_PATHWAY.ppt

ゲノム解析で活躍するコンピューター

PowerPoint プレゼンテーション

KEGG.ppt

AJACS_komachi.key


7-1(DNA配列から遺伝子を探す).ppt

Ligases の 分類クラス下に階層構造として表 検索機能を持つ 公共データベースサイトへのリンクと構成タンパク質の LSKB 内リンクにより 当該タンパク質をターゲットとする化合物をさまざまな角度から ることができるほか タンパク質を構成するドメインや PDB 複合体リガンド 文献を参照できる

ナノの技術をバイオに応用

yakugaku-kot.ppt


Microsoft PowerPoint - 阿部貴志.ppt

研究成果報告書

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展


スライド 1

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

Microsoft PowerPoint - AJACS38_KEGG-GEnomeNet_tokimatsu v2.ppt [互換モード]

PowerPoint Presentation

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

Bio-Mirror Project

PowerPoint プレゼンテーション

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

Microsoft PowerPoint - プレゼンテーション1

A

nagasaki_GMT2015_key09

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

Microsoft PowerPoint - 4_河邊先生_改.ppt

プレゼンテーション3

Bioinformatics2

Microsoft Word - CiNiiの使い方.doc

核内受容体遺伝子の分子生物学

Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

分子系統樹作成方法

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

スライド 1

プレゼンテーション2.ppt

国立遺伝学研究所におけるDNAデータバンク:DDBJ

共起関係解析によるタンパク質の機能モジュール探索法の開発

DNAFORM Clone Search Engine ユーザーズガイド

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

UniProt のトップページ

2 R K/S K/S K/S K/S K/S K/S K/SR R K/S K/S K/S K S R K/S K/S K/S K/S K/S K/S

独立行政法人産業技術総合研究所 PMID-Extractor ユーザ利用マニュアル バイオメディシナル情報研究センター 2009/03/09 第 1.0 版

GWB

1_alignment.ppt

共起関係解析によるタンパク質の機能モジュール探索法の開発

スライド 1

計算機生命科学の基礎II_

GWB

Microsoft PowerPoint - DNA1.ppt [互換モード]


Microsoft Word - PubMed

Microsoft Word - Comtxt05.doc

ウェブ23Brev2

AJACS18_ ppt

分子系統樹作成方法

Untitled

MB-lecture12.pptx

090825_Sakate_for_dist.pptx

第2章 生物有機化学実験及び実験法

遺伝子ネットワーク解析

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

会報35号表紙.pdf

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

<4D F736F F F696E74202D2090B696BD979D8D488A778EC08CB F31947A957A8E9197BF205B8CDD8AB B83685D>

NGSデータ解析入門Webセミナー

PowerPoint プレゼンテーション

DVDを見た後で、次の問いに答えてください

<4D F736F F F696E74202D E93788A B68CA381458FEE95F182CC925482B595FB F8AFA816A2E707074>

Microsoft Word - Informaworld_manual.doc

Slide 1

Microsoft Word doc

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

Untitled

PowerPoint プレゼンテーション

国内の主要なDBの使い方 (DDBJ, PDBj, KEGG)

Microsoft PowerPoint - メールガイダンスCiNii編2009.ppt

人工知能補足_池村

<4D F736F F F696E74202D E93788A B68CA381458FEE95F182CC925482B595FB F8AFAA58DC58F4994C5816A2E70707

Microsoft Word - Gateway technology_J1.doc

Microsoft PowerPoint - ????????????2016_01P.ppt [?????]

手順 ) 1) プライマーの設計 発注変異導入部位がプライマーのほぼ中央になるようにする 可能であれば 制限酵素サイトができるようにすると確認が容易になる プライマーは 25-45mer で TM 値が 78 以上になるようにする Tm= (%GC)-675/N-%mismatch

キーワードと検索条件について キーワード調べたい言葉 ( 検索語 ) を入力します スペースで区切って最大 0 個まで入力可能です 使用できる文字は漢字 ひらがな カタカナ 英数字です ( 記号 旧漢字も対応しています ) 全角 / 半角 大文字 / 小文字のどちらで入力しても区別なく検索されます

簡易ガイド1)書誌情報から整理番号を特定する(J-GLOBAL活用例)

LinkOut(リンクアウト)とアイコンの作り方 ~医学中央雑誌、PubMed~

Quick guide_GeneArt Primer and Construct Design Tool_v1(Japanese)

第1部参考資料

ChIP-seq

研究の背景と経緯 植物は 葉緑素で吸収した太陽光エネルギーを使って水から電子を奪い それを光合成に 用いている この反応の副産物として酸素が発生する しかし 光合成が地球上に誕生した 初期の段階では 水よりも電子を奪いやすい硫化水素 H2S がその電子源だったと考えられ ている 図1 現在も硫化水素

図 B 細胞受容体を介した NF-κB 活性化モデル

大学院博士課程共通科目ベーシックプログラム

簡易ガイド1)書誌情報から整理番号を特定する(J-GLOBAL活用例)

Transcription:

2013 年 10 月 30 日 ( 水 ) バイオ情報解析演習 ウェブツールを活用した生物情報解析 (1) 配列と代謝経路の解析の基礎

有用物質生産菌を合理的に作ろう! 設計 試作 ベンチテスト 完成 プラスミド 効率的な代謝経路を設計する 文献調査代謝パスウェイの探索代謝シミュレーション 実際に微生物に組み込む データベースから有用遺伝子を探索する遺伝子組換え技術 培養をして問題点を突き止める 培養代謝物量 フラックスのデータを解析し 問題点を突き止める

ウェブツールを活用した生物情報解析 の予定 10 月 28 日 ( 水 ) 1. 配列と代謝経路の解析の基礎 11 月 6 日 ( 水 ) 2. 塩基配列 アミノ酸配列のマルチアライメントと進化系統樹 11 月 13 日 ( 水 ) 3. 相同性検索 11 月 20 日 ( 水 ) 4. 遺伝子のクローニングの設計 参考図書改訂第 2 版バイオデータベースとウェブツールの手とり足とり活用法 ( 羊土社 ) バイオインフォマティクス第 2 版ゲノム配列から機能解析へ ( メディカル サイエンス インターナショナル ) 2

今日の授業のモチベーション 大腸菌でブタノールを生産したい ブタノールを生産する他の生物の遺伝子を大腸菌に組み込む そのためには 1. ブタノールを生産する生物種を探す 2. ブタノール合成経路の遺伝子を探す 3. 遺伝子をクローニングするために塩基配列を獲得する 4. 遺伝子およびその酵素の情報を収集する ウェブツールを利用する 3

生物学研究におけるウェブツールの活用 興味のある機能を持つタンパク質を抽出 これらはウェブブラウザを介して解析できる! この配列の中で 遺伝子のコード領域 (CDS ORF) はどこか? その機能に関係のあるタンパク質をコードする遺伝子 DNA 断片をクローニング 遺伝子 DNA の塩基配列を決定 TACACACGAATAAAAGATAACAAAGATGAGTAAAGGAGA AGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATT AGATGGCGATGTTAATGGGCAAAAATTCTCTGTCAGTGG AGAGGGTGAAGGTGATGCAACATACGGAAAACTTACCCT TAAATTTATTTGCACTACTGGGAAGCTACCTGTTCCATG GCCAACACTTGTCACTACTTTCTCTTATGGTGTTCAATG CTTTTCAAGATACCCAGATCATATGAAACAGCATGACTT TTTCAAGAGTGCCATGCCCGAAGGTTATGTACAGGAAAG AACTATATTTTACAAAGATGACGGGAACTACAAGACACG TGCTGAAGTCAAGTTTGAAGGTGATACCCTTGTTAATAG AATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAA CATTCTTGGACACAAAATGGAATACAACTATAACTCACA TAATGTATACATCATGGCAGACAAACCAAAGAATGGAAT CAAAGTTAACTTCAAAATTAGACACAACATTAAAGATGG AAGCGTTCAATTAGCAGACCATTATCAACAAAATACTCC AATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTA CCTGTCCACACAATCTGCCCTTTCCAAAGATCCCAACGA AAAGAGAGATCACATGATCCTTCTTGAGTTTGTAACAGC TGCTGGGATTACACATGGCATGGATGAACTATACAAATA AATGTCCAGACTTCCAATTGACACTAAAGTGTCCGAACA ATTACTAAATTCTCAGGGTTCCTGGTTAAATTCAGGCTG AGACTTTATTTATATATTTATAGATTCATTAAAATTTTA TGAATAATTTATTGATGTTATTAATAGGGGCTATTTTCT TATTAAATAGGCTACTGGAGTGTAT コードするタンパク質はどのような機能を持っていると推測されるか? この遺伝子の発現制御にかかわる DNA 配列には どのようなものがあるか? このタンパク質が持つ活性に関係のある配列モチーフには どのようなものがあるか? このタンパク質の立体構造はどうなっているのか? この遺伝子やタンパク質に関する過去の知見 ( 文献 ) にはどのようなものがあるか? 4

さまざまな生物情報データベース 塩基配列データベース : GenBank EMBL DDBJ アミノ酸配列データベース : SWISS-PLOT TrEMBL GenPept タンパク質の立体構造データベース : PDBj SCOP など タンパク質機能データベース : PROSITE Pfam InterPro など 代謝データベース : KEGG MetaCyc 酵素データベース : BREBDA ENZYME 各種生物のゲノムデータベース : EcoCyc ( 大腸菌 ) GenoBase ( 大腸菌 ) SGD ( 酵母 ) など 微生物ゲノムの統合データベース : MBGD トランスクリプトームデータのデータベース : GEO など 文献データベース : Entrenz PubMed Google Scholar など これらのデータベース名を Google 等で検索し どういうデータベースかを調べてみよう これらのデータベースから情報を入手し さまざまなバイオインフォマティクスの解析を行うことができる これらのデータベースの情報を活用した さまざまなツールがインターネット上に存在する 5

本日の内容 1. 塩基配列 アミノ酸配列の入手 2. KEGG データベースを用いた代謝経路設計 6

配列の表記は核酸塩基 アミノ酸ともに左から右へ DNA RNA の塩基配列 5 3 ATGTGCGGCCTTCTTGGCATATTGACTGCA 左から右へ 5 3 となるように記述する タンパク質のアミノ酸配列 N 末端 C 末端 MCGLLGILTANGNAEAFVPALERALPCMRH 左から右へ N 末端 C 末端となるように記述する 7

配列の表記は核酸塩基 アミノ酸ともに 1 文字表記 核酸塩基の 1 文字表記 アミノ酸の 1 文字表記 Code Description A Adenine C Cytosine G Guanine T Thymine U Uracil R Purine (A or G) Y Pyrimidine (C, T, or U) M C or A K T, U, or G W T, U, or A S C or G B C, T, U, or G (not A) D A, T, U, or G (not C) H A, T, U, or C (not G) V A, C, or G (not T, not U) N Any base (A, C, G, T, or U) 1-letter A R N D C Q E G H I L K M F P S T W Y V B Z X Description Alanine Arginine Asparagine Aspartic acid Cysteine Glutamine Glutamic acid Glycine Histidine Isoleucine Leucine Lysine Methionine Phenylalanine Proline Serine Threonine Tryptophan Tyrosine Valine Aspartic acid or Asparagine Glutamine or Glutamic acid Any amino acid 8

塩基配列データベース 国際塩基配列データベース DDBJ ( 国立遺伝学研究所 DDBJ) EMBL ( ヨーロッパ EBI) GenBank ( アメリカ NCBI) 全世界の研究者が取得した塩基配列データを 3 機関が定めた統一の基準によって収集 編纂したもの データの登録は 配列データを取得した研究者自身が行う ( 国際学術論文に新規取得した配列を掲載する際には これらのうちいずれかのデータベースに登録することが義務 ) [ 問題点 ] 統一基準を用いているとはいえ さまざまな種類のデータが混在している データの由来は異なるが 配列としては同一と見なせるデータが多数混在しており 冗長性を招いている 9

アミノ酸配列データベース SWISS-PROT 研究者が人手でハイレベルのアノテーション ( 付加情報 ) をつけたタンパク質 / アミノ酸配列データベース TrEMBL コンピュータにより ハイレベルのアノテーション ( 付加情報 ) をつけたタンパク質 / アミノ酸配列データベース GenPept 塩基配列データベースに登録されている配列を 自動的にアミノ酸配列に翻訳したものを登録 PIR 国際的なタンパク質 / アミノ酸配列データベース日本 (JPID) アメリカ (NBRF) ヨーロッパ (MIPS) の共同で開発 SWISS-PROT TrEMBL GenPept などの情報を統合し 重複を除いた PIR-NREF も開発 10

配列の記述形式 DNA の塩基配列やタンパク質のアミノ酸配列を用いて解析する際には 配列を適切な形式で記述する必要がある (1) GenBank 形式 ( アミノ酸配列は GenPept 形式 ) 文献情報 配列の機能情報 mrna やコード領域の位置 重要な変異の位置などの情報を配列とともに記述 (2) FASTA 形式配列の名前や由来に関する情報と配列のみを記述 DNA の塩基配列やタンパク質のアミノ酸配列には それぞれに固有の Accession number が付与されている 11

配列の記述形式 1 GenBank 形式 LOCUS 遺伝子座の名前 配列の長さと種類 生物分類 登録の日付 DEFINITION 配列の名前 ACCESSION アクセッション番号 VERSION 配列のバージョン KEYWORDS この配列を相互参照するためのキーワード SOURCE 由来となる生物 識別子と呼ばれ 解析プログラム ORGANISM 生物の詳細な記述 がこれらを認識して配列を扱う REFERENCE 文献情報 AUTHORS 著者名 TITLE タイトル JOURNAL 雑誌名 巻 号 ページ 出版年 PUBMED PubMed ID FEATURES 位置あるいは領域ごとの配列についての情報 FEATURESにはほかに source 配列の範囲 由来となる生物 intron ( イントロンの範囲 ) misc_signal 配列の範囲 機能やシグナルの種類 promoter ( プロモーターの範囲 ) mrna 配列の範囲 mrna mutation ( 変異の位置 ) gene 配列の範囲 遺伝子 等の情報を入力できる CDS 配列の範囲 コード領域 ORIGIN 配列の始まり 1 atgtgcggcc ttcttggcat attgactgca aatgggaacg ctgaagcatt cgttcctgca 61 ctcgagcggg ccttgccatg catgcgccac cgtggtcctg acgatgccgg cacttggcat // 配列の終わり 12

GenBank 形式で記述した配列 ( 例 ) LOCUS AB029550 1923 bp DNA linear BCT 23-MAY-2000 DEFINITION Corynebacterium glutamicum genes for LtsA, ORF1, complete cds. ACCESSION AB029550 REGION: 815..2737 VERSION AB029550.1 GI:6714539 配列の由来となる生物種 KEYWORDS ORF1; LtsA. SOURCE Corynebacterium glutamicum ORGANISM Corynebacterium glutamicum Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Corynebacteriaceae; Corynebacterium. REFERENCE 1 AUTHORS TITLE Hirasawa,T., Wachi,M. and Nagai,K. A mutation in the Corynebacterium glutamicum ltsa gene causes susceptibility to lysozyme, temperature-sensitive growth, and L-glutamate production JOURNAL J. Bacteriol. 182 (10), 2696-2701 (2000) PUBMED 10781535 REFERENCE 2 (bases 1 to 1923) AUTHORS TITLE JOURNAL Accession number Wachi,M. and Hirasawa,T. Direct Submission Submitted (03-JUL-1999) Masaaki Wachi, 配列に関連する文献の情報 Tokyo Institute of Technology, Department of Bioengineering; 4259 Nagatsuta Midori-ku, Yokohama, Kanagawa 226-8501, Japan (E-mail:mwachi@bio.titech.ac.jp, Tel:81-45-924-5770, Fax:81-45-924-5820) 13

FEATURES Location/Qualifiers source 1..1923 /organism="corynebacterium glutamicum" /mol_type="genomic DNA" /strain="ky9611" /db_xref="taxon:1718" gene Coding sequence 1..1923 (ORFに相当) の略 /gene="ltsa" CDS 1..1923 /gene="ltsa" /codon_start=1 CDSの位置 ( この場合は1から1923 番目まで ) /transl_table=11 /product="ltsa" /protein_id="baa89484.1" CDSに関する情報 /db_xref="gi:6714540" /translation="mcgllgiltangnaeafvpaleralpcmrhrgpddagtwhdada AFGFNRLSIIDIAHSHQPLRWGPADEPDRYAMTFNGEIYNYVELRKELSDLGYTFNTS 配列 < 途中省略 > DELFGWAQDTIKESGTEDIFNKQAVLDMLNEHRDGVSDHSRRLWTVLSFMVWHGIFVE NRIDPQIEDRSYPVEL ORIGIN 5 末端 1 atgtgcggcc ttcttggcat attgactgca aatgggaacg ctgaagcatt cgttcctgca 61 ctcgagcggg ccttgccatg catgcgccac cgtggtcctg acgatgccgg cacttggcat < 途中省略 > 1861 atttttgtgg aaaaccgcat tgatccacag attgaggacc gctcctaccc ggtcgagctt 1921 taa // 3 末端 14

アミノ酸配列 (GenPept 形式 ) アミノ酸配列 LOCUS BAB96652 588 aa linear BCT 20-NOV-2008 DEFINITION transpeptidase involved in septal peptidoglycan synthesis [Escherichia coli str. K-12 substr. W3110]. ACCESSION BAB96652 VERSION BAB96652.1 GI:21321965 Accession number DBSOURCE accession AP009048.1 KEYWORDS. SOURCE Escherichia coli str. K-12 substr. W3110 ORGANISM Escherichia coli str. K-12 substr. W3110 Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia. REFERENCE 1 AUTHORS TITLE Musso,R., Di Lauro,R., Rosenberg,M. and de Crombrugghe,B. Nucleotide sequence of the operator-promoter region of the galactose operon of Escherichia coli JOURNAL Proc. Natl. Acad. Sci. U.S.A. 74 (1), 106-110 (1977) PUBMED 319453 一部省略 REFERENCE 142 (residues 1 to 588) AUTHORS TITLE JOURNAL Mori,H., Hirai,A., Morooka,N. and Horiuchi,T. Direct Submission Submitted (22-AUG-2005) Contact:Hirotada Mori Graduate School of Biological Sciences, Nara Institute of Science and Technology; 8916-5 Takayama, Ikoma, Nara 630-0101, Japan FEATURES Location/Qualifiers source 1..588 /organism="escherichia coli str. K-12 substr. W3110" /strain="k-12" /sub_strain="w3110" /db_xref="taxon:316407" Protein 1..588 /product="transpeptidase involved in septal peptidoglycan synthesis" Region 2..579 /region_name="prk15105" /note="peptidoglycan synthase FtsI; Provisional" /db_xref="cdd:185060" Region 71..222 /region_name="pbp_dimer" /note="penicillin-binding Protein dimerisation domain; pfam03717" /db_xref="cdd:190723" Region 260..554 /region_name="transpeptidase" /note="penicillin binding protein transpeptidase domain; cl01039" /db_xref="cdd:154162" CDS 1..588 /gene="ftsi" /coded_by="ap009048.1:91413..93179" /note="eck0085:jw0082:b0084; penicillin-binding protein 3" /transl_table=11 ORIGIN N 末端 1 mkaaaktqkp krqeehanfi swrfallcgc illalafllg rvawlqvisp dmlvkegdmr // 61 slrvqqvsts rgmitdrsgr plavsvpvka iwadpkevhd aggisvgdrw kalanalnip 一部省略 481 gvkaaikgyr iaiktgtakk vgpdgryink yiaytagvap asqprfalvv vindpqagky 541 yggavsapvf gaimggvlrt mniepdaltt gdknefvinq gegtggrs C 末端 タンパク質の名称 由来となる生物種 この配列に関連する文献の情報 71 番目から 222 番目までのアミノ酸領域が penicillin-binding protein の二量体化 (dimerization) に関与する 261 番目から 554 番目までのアミノ酸領域が transpeptidase ドメインとして機能する 1 番目から 588 番目まで ( 全長 ) が coding sequences (CDS) である ftsi という遺伝子がコードしている

配列の記述形式 2 FASTA 形式 >gi 6714539:815-2737 Corynebacterium glutamicum genes for LtsA, ORF1, complete cds ATGTGCGGCCTTCTTGGCATATTGACTGCAAATGGGAACGCTGAAGCATTCGTTCCTGCACTCGAGCGGG CCTTGCCATGCATGCGCCACCGTGGTCCTGACGATGCCGGCACTTGGCATGACGCCGATGCAGCGTTTGG ATTCAACCGCCTCTCCATCATTGATATTGCACACTCCCACCAACCACTGCGTTGGGGACCTGCGGATGAA CCCGACCGCTACGCAATGACTTTCAACGGTGAGATCTACAACTACGTTGAGCTGCGTAAAGAGCTCTCGG ATTTGGGATATACCTTTAATACTTCTGGCGATGGCGAGCCAATTGTTGTCGGTTTCCACCACTGGGGCGA GTCCGTGGTCGAGCATCTCCGCGGAATGTTCGGCATTGCCATTTGGGATACAAAGGAAAAGTCGCTTTTC CTTGCGCGTGATCAGTTCGGCATCAAGCCACTGTTCTACGCAACCACCGAGCATGGCACCGTGTTCTCCT CAGAGAAGAAGACCATCTTGGAGATGGCCGAGGAGATGAATCTAGATCTGGGCCTTGATAAGCGCACCAT TGAGCACTACGTGGACCTGCAGTACGTGCCCGAGCCAGATACCCTTCACGCGCAGATTTCCCGCTTGGAG TCAGGCTGCACCGCAACAGTTCGTCCGGGCGGCAAGCTGGAACAGAAGCGTTACTTCAAGCCTCAGTTCC (1) 1 行目は > という文字とその後に配列の名前が続く注釈行 CAGTACAGAAGGTCGTAAAGGGTAAGGAGCAGGACCTCTTCGATCGCATTGCCCAGGTGTTGGAGGATAG CGTCGAAAAGCATATGCGTGCCGACGTGACCGTAGGCTCGTTCCTTTCCGGCGGCATTGACTCAACCGCA ( > と文字の間にスペースを入れてはいけない ) ATTGCGCCGCTTGCAAAGCGCCACAACCCTGACCTGCTCACCTTCACCACCGGTTTCGAGCGTGAAGGCT ACTCGGAGGTCGATGTGGCTGCGGAGTCCGCCGCTGCGATTGGCGCTGAGCACATCGTGAAGATTGTCTC (2) 2 行目以降は1 文字記号で表される配列 GCCTGAGGAATACGCCAACGCGATTCCTAAGATCATGTGGTACTTGGATGATCCTGTAGCTGACCCATCA TTGGTCCCGCTGTACTTCGTGGCAGCGGAAGCACGTAAGCACGTCAAGGTTGTGCTGTCTGGCGAGGGCG CAGATGAGCTGTTCGGTGGATACACCATTTACAAAGAGCCGCTATCGCTTGCTCCATTTGAGAAGATCCC TTCCCCACTACGTAAAGGCCTGGGAAAGCTCAGCAAGGTTCTGCCAGACGGCATGAAGGGCAAGTCCCTT CTTGAGCGTGGCTCCATGACCATGGAAGAGCGCTACTACGGCAACGCTCGCTCCTTCAATTTCGAGCAGA TGCAACGCGTTATTCCATGGGCAAAGCGCGAATGGGACCACCGCGAAGTCACTGCACCGATCTACGCACA ATCCCGCAACTTTGATCCAGTAGCCCGCATGCAACACCTGGATCTGTTCACCTGGATGCGCGGCGACATC CTGGTCAAGGCTGACAAGATCAACATGGCGAACTCCCTTGAGCTGCGAGTTCCATTCTTGGATAAGGAAG TTTTCAAGGTTGCAGAGACCATTCCTTACGATCTGAAGATTGCCAACGGTACCACCAAGTACGCGCTGCG CAGGGCACTCGAGCAGATTGTTCCGCCTCACGTTTTGCACCGCAAGAAGCTGGGCTTCCCTGTTCCCATG CGCCACTGGCTTGCCGGCGATGAGCTGTTCGGTTGGGCGCAGGACACCATTAAGGAATCCGGTACTGAAG ATATCTTCAACAAGCAGGCTGTGCTGGATATGCTGAACGAGCACCGCGATGGCGTGTCAGATCATTCCCG TCGACTGTGGACTGTTCTGTCATTTATGGTGTGGCACGGCATTTTTGTGGAAAACCGCATTGATCCACAG 塩基配列 :5 末端アミノ酸配列 :N 末端 ATTGAGGACCGCTCCTACCCGGTCGAGCTTTAA 塩基配列 :3 末端アミノ酸配列 :C 末端 配列名 16

配列の入手 NCBI (National Center for Biotechnology Information) Gene http://www.ncbi.nlm.nih.gov/gene/ Protein http://www.ncbi.nlm.nih.gov/protein/ KEGG (Kyoto Encyclopedia of Genes and Genomes) http://www.genome.jp/kegg/ 17

配列の入手塩基配列の入手 NCBI Gene http://www.ncbi.nlm.nih.gov/gene/ 生物種名 遺伝子名 Accession number 等を入力して Search ボタンをクリック 例えば 大腸菌 Escherichia coli k12 株の dnaa 遺伝子の配列を入手する Escherichia coli K12 and dnaa と入力し Search ボタンをクリック 18

配列の入手塩基配列の入手 発見 Accession number [ 今後の検索のために ] 1) 検索の際に複数のワードを AND もしくは OR でつなぐことができる スペースでワードをつなげると AND と同じ結果になる 2) 大文字 小文字の区別はない 19

配列の入手塩基配列の入手 遺伝子の機能に基づく名前 遺伝子がコードする酵素の機能 遺伝子のゲノム上の位置などに基づく名前 20

配列の入手塩基配列の入手 ゲノム上での近傍の遺伝子を含む位置情報 FASTA 形式の塩基配列 GenBank 形式の塩基配列 21

配列の入手塩基配列の入手 FASTA 形式の塩基配列の獲得に成功 22

配列の入手アミノ酸配列の入手 同じようにして タンパク質のアミノ酸配列も入手してみる Entrez Protein: http://www.ncbi.nlm.nih.gov/protein aequorea victoria AND gfp と入力して Search ボタンをクリックする 23

それらしいものを見つけたら 配列名のリンクをクリック 直接 目的の形式でタンパク質配列を取得できる 24

GenePept 形式で表示される ここをクリックすると FASTA 形式に表示が変わる 立体構造を調べることが可能 25

配列の入手 個々の生物のゲノム情報のデータベースも存在する 生物種 大腸菌 酵母 シロイヌナズナ ヒト 全般 データベース Encyclopedia of Escherichia coli K-12 Genes and Metabolism (EcoCyc) GenoBase 6.0 Profiling of E. coli Chromosome (PEC) Saccharomyces genome database (SGD) The Arabidopsis Information Resource (TAIR) Human Genome Project Information Ensembl Human Kyoto Encyclopedia of Genes and Genomes (KEGG) Entrez Genome Entrez Gene BioCyc Genome Information Broker (GIB) 26

配列の入手 KEGG を使ってゲノム配列が決定されている生物種の配列情報を入手する KEGG: http://www.genome.jp/kegg/ 配列 代謝経路 代謝物質 酵素 酵素反応などを統合的 横断的に解析することができるデータベース 例 ) パン酵母 (Saccharomyces cerevisiae) の ADH 遺伝子の配列を入手する KEGG Organisms をクリックする 27

この表の中から 生物種を選ぶ 下へ移動して Saccharomyces cerevisiae をクリック 28

ここに 検索キーワード ADH を入力し Go ボタンをクリックする 29

ここをクリック 酵母には複数の ADH 遺伝子が存在する 30

各種データベースへのリンク NCBI の ADH5 遺伝子の情報へ移動 下へ移動すると 31

配列が現れる ここをクリックすると 配列が FASTA 形式で表示される アミノ酸配列 表示されている配列はそのままコピペできる CDS (ORF) の塩基配列 ここに数字を入れて NT seq ボタンをクリックすると CDS の上流 (+upstream) 下流 (+downstream) の配列を付加した配列が FASTA 形式で表示される 32

ADH5 遺伝子が関連する代謝経路の情報 解糖系をクリックする 33

ADH5 遺伝子がコードするタンパク質の酵素番号が赤で示される AcetaldehydeをEthanolに変換することが図から読み取れる 34

本日の内容 1. 塩基配列 アミノ酸配列の入手 2. KEGG データベースを用いた代謝経路設計 35

代謝経路の情報収集 KEGG データベースの利用 KEGG データベース 代謝ネットワークの情報を含む統合データベース KEGG Pathway : 代謝ネットワーク情報 KEGG Genes : 遺伝子の情報 KEGG Ligand : 化合物の情報 KEGG Pathway (http://www.kegg.jp/kegg/pathway.html) 目的 各生物の代謝反応の違いを調べる 目的物質の生産に必要な遺伝子を探索する 36

KEGG Pathway 大きなカテゴリの代謝経路リスト Metabolic pathways 全代謝経路 Biosynthesis of amino acids 全アミノ酸の合成系路 上記のカテゴリを細分化した代謝経路リスト Glycolysis / Gluconeogenesis 解糖系 / 糖新生 Lysine biosynthesis リジン合成経路 37

KEGG Pathway 解析対象の生物を選択する小技 : 生物名の頭文字をキーボードで入力してみる ( 三文字目まで認識される ) 例 ) 大腸菌 (Escherichia coli) を調べたいときは E や Esc と素早く入力する 拡大できる 38

大腸菌 (Escherichia coli MG1655) の代謝反応全体図 39

酵母 (Saccharomyces cerevisiae (budding yeast)) の代謝反応全体図 大腸菌にはない 大腸菌にはある 40

解糖系 生物種を選択することで その生物種がもつ代謝反応がわかる は酵素反応や遺伝子の情報 は代謝物質の情報にリンクがある 酵素番号クリックすると酵素反応や遺伝子の情報へ 代謝物質の情報へ Escherichia coli K-12 MG1655 を選択 緑色が大腸菌が有する反応 41

反応番号 :R number 化学反応 ( 代謝反応 ) 固有の番号 物質名による反応 化合物番号による反応 酵素番号 この反応が含まれる代謝経路 42

化合物番号 :C number 化合物固有の番号 17,096 の化合物が登録されている C00001 H 2 O C00002 ATP C00003 など NAD + C00469 の例 化合物名 この化合物が関与する反応番号 この化合物が関与する代謝経路 この化合物が関与する酵素番号 43

酵素番号 :EC number 酵素反応の種類をグループ化した物 EC 1.X.X.X : オキシドレダクターゼ ( 酸化還元酵素 ) EC.1.1.X.X : CH-OHの結合に対し働く EC.1.1.1.X : NAD 又はNADPを用いる EC.1.1.2.X : チトクロムを用いる EC.1.1.3.X : 酸素を用いる EC 2.X.X.X : トランスフェラーゼ ( 転移酵素 ) EC 3.X.X.X : ヒドロラーゼ ( 加水分解酵素 ) EC 4.X.X.X : リアーゼ ( 脱離酵素 ) EC 5.X.X.X : イソメラーゼ ( 異性化酵素 ) EC 6.X.X.X : リガーゼ ( 合成酵素 ) 44

酵素番号 :EC number EC 1.1.1.1 の例 酵素反応の名称 代表的な反応 EC 1.1.1.1 の反応に分類された反応番号 EC 1.1.1.1 の反応を持つ生物種とその遺伝子名 45

代謝経路設計 大腸菌でブタノールを生産したい ( レポート問 5) ブタノールが関連する代謝経路を探す その経路で大腸菌が持つ 持たない遺伝子を調べる ブタノール生産に必要な遺伝子の内 大腸菌が持たない遺伝子を持つ他の生物を探すまずは検索してみましょう 46