Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

Similar documents

7-1(DNA配列から遺伝子を探す).ppt

A Constructive Approach to Gene Expression Dynamics

PowerPoint Presentation

5_motif 公開版.ppt

バイオインフォマティクスⅠ

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

生命情報学

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

Microsoft PowerPoint - BI_okuno_

PowerPoint プレゼンテーション

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史

GWB

Bioinformatics2


PowerPoint プレゼンテーション

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について


Microsoft PowerPoint - プレゼンテーション1

Slide 1

核内受容体遺伝子の分子生物学

アルゴリズム入門

分子系統解析における様々な問題について 田辺晶史

「組換えDNA技術応用食品及び添加物の安全性審査の手続」の一部改正について

GeneWebⅡ利用の手引き

人工知能補足_池村

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

AJACS_komachi.key

生命情報学

GeneWebⅡ利用の手引き

Slide 1

配列検索 よくあるご質問

分子系統樹推定の落とし穴と回避法 筑波大 生命環境 田辺晶史

13FG-生物-問題_H1.indd

今後の展開現在でも 自己免疫疾患の発症機構については不明な点が多くあります 今回の発見により 今後自己免疫疾患の発症機構の理解が大きく前進すると共に 今まで見過ごされてきたイントロン残存の重要性が 生体反応の様々な局面で明らかにされることが期待されます 図 1 Jmjd6 欠損型の胸腺をヌードマウス

GWB

生物学入門

<4D F736F F D E95F14E565F838C D955F907D90E096BE5F8F4390B394C5816A2E646F63>

本成果は 以下の研究助成金によって得られました JSPS 科研費 ( 井上由紀子 ) JSPS 科研費 , 16H06528( 井上高良 ) 精神 神経疾患研究開発費 24-12, 26-9, 27-

進捗状況の確認 1. gj も gjp も動いた 2. gj は動いた 3. gj も動かない 2

11yama

Microsoft PowerPoint - 3rd-jikken-vscreen [互換モード]

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

共起関係解析によるタンパク質の機能モジュール探索法の開発

PowerPoint プレゼンテーション

Microsoft PowerPoint - DNA1.ppt [互換モード]

ヒトゲノム情報を用いた創薬標的としての新規ペプチドリガンドライブラリー PharmaGPEP TM Ver2S のご紹介 株式会社ファルマデザイン

Microsoft Word doc

Nakamura

第2章 生物有機化学実験及び実験法

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

MB-lecture12.pptx

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

Perl + α. : DNA, mrna,,

タンパク質の合成と 構造 機能 7 章 +24 頁 転写と翻訳リボソーム遺伝子の調節タンパク質の構造弱い結合とタンパク質の機能

<4D F736F F F696E74202D AA8E7188E293608A7782CC8AEE D8EAF81698DB791D682A694C5816A>

バイオインフォマティクスⅠ

第4回バイオインフォマティクスアルゴリズム実習

報道発表資料 2007 年 8 月 1 日 独立行政法人理化学研究所 マイクロ RNA によるタンパク質合成阻害の仕組みを解明 - mrna の翻訳が抑制される過程を試験管内で再現することに成功 - ポイント マイクロ RNA が翻訳の開始段階を阻害 標的 mrna の尻尾 ポリ A テール を短縮

ver

GWB

Microsoft Word - MacVector_Align_OP.doc

PowerPoint Presentation

研究最前線 HAL QCD Collaboration ダイオメガから始まる新粒子を予言する時代 Qantm Chromodynamics QCD 1970 QCD Keiko Mrano QCD QCD QCD 3 2

Microsoft PowerPoint - lecture a.pptx

CiRA ニュースリリース News Release 2014 年 11 月 20 日京都大学 ips 細胞研究所 (CiRA) 京都大学細胞 物質システム統合拠点 (icems) 科学技術振興機構 (JST) ips 細胞を使った遺伝子修復に成功 デュシェンヌ型筋ジストロフィーの変異遺伝子を修復

Microsoft PowerPoint - lecture a.pptx

<4D F736F F F696E74202D2090B696BD979D8D488A778EC08CB F31947A957A8E9197BF205B8CDD8AB B83685D>

毎回変動し, 必ずしも良い結果を出力するとは限らない. 理由の一つとして,GS 法は配列データごとに, ランダムに与えた初期値に基づいて類似部分配列の位置を確率的に更新している為, 計算途中でそれらの位置が常に変動し, 結果が安定しないという問題が発生する. 本稿では, この問題を解決する為に, 配

( 図 ) 自閉症患者に見られた異常な CADPS2 の局所的 BDNF 分泌への影響

研究成果報告書

Hi-level 生物 II( 国公立二次私大対応 ) DNA 1.DNA の構造, 半保存的複製 1.DNA の構造, 半保存的複製 1.DNA の構造 ア.DNA の二重らせんモデル ( ワトソンとクリック,1953 年 ) 塩基 A: アデニン T: チミン G: グアニン C: シトシン U

 

連続講演会 東京で学ぶ京大の知 シリーズ 16 社会に浸透する情報技術第 2 回 ゲノム情報のコンピュータ解析 高校数学 +α による先端的解析手法 京都大学が東京 品川の 京都大学東京オフィス で開く連続講演会 東京で学ぶ京大の知 のシリーズ 16 社会に浸透する情報技術 9 月 22 日の第 2

生物時計の安定性の秘密を解明

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム

分子系統解析における様々な問題について 田辺晶史

PowerPoint プレゼンテーション

バイオインフォマティクスⅠ

井上先生 報告書 清水


Microsoft Word - Seminar14.doc

nagasaki_GMT2015_key09

大学院委員会について

NGSデータ解析入門Webセミナー

KEGG.ppt

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

Untitled

PowerPoint プレゼンテーション

1 研究開発のねらい 糖鎖は 細胞表面のタンパク質や脂質に結合し 血液型の決定 細胞接着 抗原抗体反応 ウイルス感染などの生体反応で重要な役割を果たす生体分子である 糖鎖による多様な生物学的機能のうち 糖鎖結合タンパク質による糖鎖の特異的認識があり 糖鎖 - タンパク質間の相互作用の解析に糖鎖アレイ

Microsoft PowerPoint - ????????????2016_01P.ppt [?????]

ナノの技術をバイオに応用

配付資料 自習用テキスト 解析サンプル配布ページ 2

ス H95) は EF-G の GTP 結合部位と明確に相互作用しており このループが GTP 加水分解に直接関与していることが示唆されました ( 図 4 右 ) 本研究成果は わが国で推進している タンパク 3000 プロジェクト の一環として行われたものです 本研究成果の詳細は 米国の学術雑誌

Quick guide_GeneArt Primer and Construct Design Tool_v1(Japanese)


共起関係解析によるタンパク質の機能モジュール探索法の開発

Microsoft Word - Gateway technology_J1.doc

Transcription:

遺伝子配列解析の基礎 genome=gene+ome DNA 配列からタンパク質へ cgtgctttccacgacggtgacacgcttccctggattggccagactgccttccgggtcactgccatggaggagccgcagtcagatcctagcgtcgagccccctctga gtcaggaaacattttcagacctatggaaactacttcctgaaaacaacgttctgtcccccttgccgtcccaagcaatggatgatttgatgctgtccccggacgatattga acaatggttcactgaagacccaggtccagatgaagctcccagaatgccagaggctgctccccgcgtggcccctgcaccagcagctcctacaccggcggcccctg caccagcccctcctggcccctgtcatcttctgtcccttcccagaaaacctaccagggcagctacggtttccgtctgggcttcttgcattccgggacagccaagtctg DNAの塩基配列 tgacttgcacgtactcccctgccctcaacaagatgttttgccaactggccaagacctgccctgtgcagctgtgggttgattccacacccccgcccggcacccgcgt ccgcgccatggccatctacaagcagtcacagcacatgacggaggttgtgaggcgctgcccccaccatgagcgctgctcagatagcgatggtctggcccctcctca atg gag agc cgc agt cag gcatcttatccgagtggaaggaaatttgcgtgtggagtatttggatgacagaaacacttttcgacatagtgtggtggtgccctatgagccgcctgaggttggctctgact M E E P Q S gtaccaccatccactacaactacatgtgtaacagttcctgcatgggcggcatgaaccggaggcccatcctcaccatcatcacactggaagactccagtggtaatct actgggacggaacagctttgaggtgcatgtttgtgcctgtcctgggagagaccggcgcacagaggaagagaatctccgcaagaaaggggagcctcaccacgagctg タンパク質のアミノ酸配列遺伝子配列の個人差 cccccagggagcactaagcgagcactgtccaacaacaccagctcctctccccagccaaagaagaaaccactggatggagaatatttcacccttcagatccgtggg cgtgagcgcttcgagatgttccgagagctgaatgaggccttggaactcaaggatgcccaggctgggaaggagccaggggggagcagggctcactccagccacctga 正常型 cgg gac agc agtccaaaaagggtcagtctacctcccgccataaaaaactcatgttcaagacagaagggcctgactcagactgacattctccacttcttgttccccactgacagcct cccacccccatctctccctcccctgccattttgggttttgggtctttgaacccttgcttgcaataggtgtgcgtcagaagcacccaggacttccatttgctttgtcccg R D S gggctccactgaacaagttggcctgcactggtgttttgttgtggggaggaggatggggagtaggacataccagcttagattttaaggtttttactgtgagggatgtttggg 変異型 cgg aac agc agatgtaagaaatgttcttgcagttaagggttagtttacaatcagccacattctaggtaggggcccacttcaccgtactaaccagggaagctgtccctcactgttgaat R N S tttctctaacttcaaggcccatatctgtgaaatgctggcatttgcacctacctcacagagtgcattgtgagggttaatgaaataatgtacatctggccttgaaaccacct tttattacatggggtctagaactgacccccttgagggtgcttgttccctctccctgttggtcggtgggttggtagtttctacagttgggcagctggttaggtagagggagtt gtcaagtctctgctggcccagccaaaccctgtctgacaacctcttggtgaaccttagtacctaaaaggaaatctcaccccatcccacaccctggaggatttcatctc ttgtatatgatgatctggatccaccaagacttgttttatgctcagggtcaatttcttttttctttttttttttttttttctttttctttgagactgggtctcgctttgttgcccagg ctggagtggagtggcgtgatcttggcttactgcagcctttgcctccccggctcgagcagtcctgcctcagcctccggagtagctgggaccacaggttcatgccacca tggccagccaacttttgcatgttttgtagagatggggtctcacagtgttgcccaggctggtctcaaactcctgggctcaggcgatccacctgtctcagcctcccagagt gctgggattacaattgtgagccaccacgtccagctggaagggtcaacatcttttacattctgcaagcacatctgcattttcaccccacccttcccctccttctcccttt 病気のなりやすさ ttatatcccatttttatatcgatctcttattttacaataaaactttgctgccaaaaaaaaaaaaaaaaaaaa 薬の効きやすさと副作用タンパク質の立体構造 単純な文字列配列として扱えない原因 配列決定時の読み取りエラー 遺伝子の定義は 転写規則の例外 スプライシング コドン暗号表は 20 種類以上 例外処理の実態 ゲノム配列の解析はどこまで進んでいるか? 遺伝子とは? Genomic DNA exon1 intron1 exon2 exon3 intron2 promoter enhancer terminator exon1 exon2 exon3 intron1 intron2 上図は Nature 記事より無断掲載 Science 記事より無断掲載 2001.2 ドラフト配列 (99.9% の精度 ) 2003.4 完成配列 (99.99% 精度 ) mrna CAP exon1 exon2 exon3 Poly A 1

抗体の遺伝子 選択的スプライシング (alternative splicing) 転写産物と翻訳配列の対応は 1 対多の関係である RNA エディティング トリパノソーマ ( 原鞭毛虫類 睡眠病の原虫 ) のキネトプラスチド DNA の転写過程に見出された そこではウリジンの挿入や欠失が見出され つくられるタンパク質の 1 次構造が変えられていた トリパノソーマ キネトプラスチド ( ミトコンドリアに相当 ) のシトクロムオキシダーゼ遺伝子 (CO III)RNA(731 塩基 ) において 45 ヶ所で計 407 個のウリジンが挿入され 9 ヶ所で計 19 個のウリジンが欠失していた このように RNA の塩基配列を変えることにより 翻訳されるタンパク質に変化をもたらす現象を RNA エディティング RNA editing) と呼ぶ イントロンで最も一般的なタイプは ' 端にGT ' 端にAGをもち これは GT-AG 則と呼ばれる 長さは様々で長いものでは数 University 100 of Science kb 2

trna のゆらぎ G-U の結合 イノシンの導入による A,C,U との結合 その結果 45 種の trna で 64 種のコドンに対応している それでも比べたいー DNA 配列比較の留意点ー 類似性 はあっても 同一 は期待できない 同じ文字であっても距離は0とせず 文字種に応じて異なる数値を与える工夫が必要 違う文字であっても類似性が高いものもある すなわち 距離が小さくなる 隠れた変異を見込む 配列比較の効能 遺伝子 配列構造を分類するー > 相同性検索 局所アライメント 活性部位 機能部位の予測ー > 大域アライメント 進化系統解析 変異の予測 相同性検索による遺伝子解析 配列アライメント入門 配列アライメントについて 相同性検索の概要 Blast 入門 パラメータの意味 目的に応じた blast 選択 orthorogu と paralogu 演習 相同性検索 遺伝子を見つける 長さの違う 2 つの配列を整列化するやり方 ローカルアライメント ( もっとも良く似た部分列を探す ) グローバルアライメント ( 違いが明確になるように長さをあわせる ) *** * * * 3

2 つのアミノ酸配列 MENMMNE と MMEYE 対して 大域的アライメント ( グローバルアライメント ) は MENMMNE M -MEYE 局所的アライメント ( ローカルアライメント ) は ***MMN*** ***MME*** アライメントを評価するための仕組み アミノ酸対あるいは塩基対の距離 ( 類似性 ) を示す距離行列 ( 類似度行列 ) を準備しておく 仮のアライメントをつくり 距離行列を用いてアライメントを数値化 可能なすべてのアライメントのすべてを数値化し ( 距離の場合は ) 最小 ( 類似度の場合は最大 ) の数値 ( アライメントスコア ) をもつアライメントを結果とする 距離行列によってアライメント結果が異なる 距離行列の一例 代表的なスコア行列 PAM(Percent Accepted Mutation) 行列 祖先の共通性が保証されているタンパク質ファミリーのアミノ酸配列を網羅的に集め アミノ酸の置換頻度から計算した BLOSUM(Blocks Amino Acid Substitution Matrices) 行列 機能機知のタンパク質配列を BLAST によりアライメントしアミノ酸対間の相違を再計算したもの PAM とは? 1PAM(Percentage of accepted point mutation) はアミノ酸配列で 100 残基あたり 1 個のアミノ酸の置換が起こるのに必要な進化上の時間単位を指す 250PAM 行列は 100 残基あたり 250 個のアミノ酸置換がおこるような変異を仮定した場合に アミノ酸 i がアミノ酸 j に置換される相対的な頻度を表したもの 相同性検索の概要 遺伝子配列をキーにして データベースを検索し 与えた遺伝子の機能を類推したい そのために 遺伝子配列をキーにして 配列データベースを検索することを考える 遺伝子の機能は 配列の一部分から類推可能である そこで ローカルアライメントのスコアが高くなるようにデータベース内の配列を取り出す 取り出された配列は キー配列と局所的に配列類似性が高い部分をもっているはずである 4

相同性検索アルゴリズム Basic Local Alignment Search Tool(BLAST) アルゴリズム Smith-Waterman アルゴリズム BLAST アルゴリズム ヒューリスティック法 ( 経験的手法 ) であり 結果が最適解であることが保証されていない 検索速度が速く 大量のデータを処理できる 米国 国立医学図書館の NCBI(National Center for Biotechnology Information, National Institute of Medicine) の研究者が考案した プログラム問い合わせ配列データベース特徴 BLASTP タンパク質タンパク質ギャップあり BLASTN 核酸核酸ギャップあり BLASTX 翻訳された核酸タンパク質各フレームを考慮 TBLASTN タンパク質翻訳された核酸各フレームを考慮 TBLASTX 翻訳された核酸翻訳された核酸ギャップなし FASTA タンパク質 / 核酸タンパク質 / 核酸ギャップあり TFASTA タンパク質翻訳された核酸ギャップあり FASTX 翻訳された核酸 タンパク質 コドン間でフレームシフト考慮 FASTY 翻訳された核酸 タンパク質 コドン内で置換 フレームシフトを考慮 TFASTX タンパク質 翻訳された核酸 コドン間でフレー ムシフト考慮 TFASTY タンパク質 翻訳された核酸 コドン内で置換 フレームシフトを考慮 FASTF/TFASTF 短いペプチド断片 タンパク質 / 翻訳 電気泳動によって された核酸 分離されたデータ FASTS/TFASTS 短いペプチド断片 タンパク質 / 翻訳 質量分析による解 された核酸 析結データ e-value について HSP の長さが短い場合 意味の無い配列が偶然に見つけられただけかもしれない そこで HSP がある値 S をもつ確率を計算し 配列が偶然にみつかってしまう期待値 を求める --->e-value 検索パラメータとして e-value を操る 距離行列の一例 タンパク質のドメイン構造を考慮した検索 問い合わせ <10-20 10-8 ~<10-20 10-8 ~<10-20 10-6 ~<10-8 <10-4 5

分子進化距離の考え方 配列比較から分子進化を捉える GTTCTAGTCC ATTCTTGTCT * * * 上記の 2 つの配列の進化距離 =3/10 とするのは危険!!! GTTCTAGTCC GTACTAGTCC ( 祖先 ) G ATTCTTGTCT 実際の置換数は 2T 時間で 6 個かもしれない 主要な配列関連データベース一次データベース国際塩基配列データベース (INSDC) タンパク質立体構造データベース (PDB) 二次データベース ( 付加価値データベース ) Uniprot/SWISSprot ( タンパク質 ( アミノ酸 ) 配列 ) PROSITE( 配列モチーフ ) SCOP( タンパク質立体構造分類 ) Interpro( 配列モチーフ 相同領域 ) H-inv( ヒトの転写産物配列 ) FANTOM( マウスの転写産物配列 ) ENCODE( ヒトゲノム配列の総合情報 ) ネット上には約 1000 種の有用な生物学的 DB がある 6