スライド 1

Similar documents
090825_Sakate_for_dist.pptx

AJACS_komachi.key

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日


プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

Slide 1


KEGG.ppt



NGSデータ解析入門Webセミナー

1. VarySysDB 1.1 VaryGene2 1.2 LD Search system 1.3 Genome Browser (GBrowse)

研究成果報告書

Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

nagasaki_GMT2015_key09

Microsoft PowerPoint _生物配列解析基礎_3回目.pptx

Untitled

KEGG_PATHWAY.ppt

130712AJACS40

分子系統解析における様々な問題について 田辺晶史

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

GWB

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

Powered by TCPDF ( Title ダウン症における心奇形発症の原因遺伝子の同定 Sub Title Identification of the responsible gene(s) for congenital heart defect in Down

別添 2 SQL インジェクション ぜい弱性診断で最低限行うべき項目 1 ( ' ( 検索キー )''-- ( 検索キー ) and 'a'='a ( 検索キー ) and 1=1 は最低限 行うこと ) OS コマンドインジェクション 2 (../../../../../../../bin/sle

A Constructive Approach to Gene Expression Dynamics

プレゼンテーション3

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

GWB

Microsoft PowerPoint - T07 豊田先生.pptx

PrimerArray® Analysis Tool Ver.2.2

名古屋大学農学部 生物情報工学 II 11 月 29 日

Microsoft PowerPoint - 3_TS-705(TaqMan_GeneExpressionAssays_製品情報及び検索方法修整10.pptx

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

生物物理 Vol. 45 No. 1 (2005) だけ正確なアラインメントが必要な方 (4) 立体構造とアミノ酸配列の関係, あるいは立体構造と機能との関係に興味がある方 2. おもなサービス 2.1 ペアワイズ3Dアラインメントこれは2つの構造をアラインメントする基本的な機能であり,MATRAS

核内受容体遺伝子の分子生物学

Microsoft PowerPoint - 4_河邊先生_改.ppt

Bioinformatics2

DNAFORM Clone Search Engine ユーザーズガイド

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

bb-8

プレゼンテーション2.ppt

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

バイオインフォマティクスⅠ

Microarray Data Analysis Tool Ver3.0 Manual.doc

PowerPoint プレゼンテーション

bioinfo pptx

第2章 生物有機化学実験及び実験法

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

機能ゲノム学(第6回)

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

Microsoft PowerPoint - 6_TS-0891(TS-0835(Custom TaqMan Assay Design Tool利用方法修正5.pptx

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

シーケンサー利用技術講習会 第10回 サンプルQC、RNAseqライブラリー作製/データ解析実習講習会

配付資料 自習用テキスト 解析サンプル配布ページ 2

分子系統樹作成方法

[Business Communication]

ver

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

Microsoft Word - MacVector_Align_OP.doc

<907D945D F D C789C195CF8D5888EA97978CF68A4A97702E786C7378>

<4D F736F F D D83808FEE95F1939D8D87504A8E968BC695F18D908F915F8E968CE3955D89BF97702E646F63>

GWB_RNA-Seq_

バイオインフォマティックス概論授業予定

PowerPoint プレゼンテーション


Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

アルゴリズム入門

研究機関事務代表者向け操作マニュアル 2. 研究者手続き編 2 研究者手続き編 研究者手続きとは 自機関に所属する研究者に係る手続きや他機関に所属する研究者の転入処理等を行う手続きです 操作の概要 研究者の新規登録 e-rad に登録されていない研究者を新規登録します 2.1 研究者の新規登録 所属

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

7-1(DNA配列から遺伝子を探す).ppt

相同性配列検索ツール:GHOST-MPと ヒト口腔内メタゲノム解析

<4D F736F F D2088EA89B9918A88E181458C8B8D878FA E E838A C E646F6378>

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

Amazon 広告レポート君ソフト Ver.1904 Copyright PBSupport. All rights reserved.

本成果は 以下の研究助成金によって得られました JSPS 科研費 ( 井上由紀子 ) JSPS 科研費 , 16H06528( 井上高良 ) 精神 神経疾患研究開発費 24-12, 26-9, 27-

PowerPoint Presentation


Microsoft PowerPoint - lecture a.pptx

Sequence Read Archive 2013 年年 10 月 25 日 第 10 回シーケンサー利利 用技術講習会 ( 理理研横浜 ) 1

GWB

サカナに逃げろ!と指令する神経細胞の分子メカニズムを解明 -個性的な神経細胞のでき方の理解につながり,難聴治療の創薬標的への応用に期待-

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史

記載例 : ウイルス マウス ( 感染実験 ) ( 注 )Web システム上で承認された実験計画の変更申請については 様式 A 中央の これまでの変更 申請を選択し 承認番号を入力すると過去の申請内容が反映されます さきに内容を呼び出してから入力を始めてください 加齢医学研究所 分野東北太郎教授 組

CBRC CBRC DNA

バイオインフォマティクスⅠ

別紙

Microsoft PowerPoint - T05_田畑先生【CC-BY】.pptx

インドネシアにおける意匠を対象にした出願前調査 Q 自社製品の意匠権をインドネシアで取得したい 出願する前にや っておいた方が良いことはあるか? 1) 調査ツールの選択インドネシアにおける意匠は インドネシア知的財産総局 ( 以下 DGIP) が提供する e-status Kekay

Easy Sep

分子系統解析における様々な問題について 田辺晶史

大学院博士課程共通科目ベーシックプログラム

Microsoft PowerPoint - 理研豊田_JST統合DB資料

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

基礎遺伝学

Slide 1

PowerPoint プレゼンテーション

リード・ゲノム・アノテーションインポート

Transcription:

平成 23 年度第 2 回データベース講習会 創薬研究における統合データベースの活用 比較ゲノムデータベース Evola, G-compass の活用法 http://hinv.jp/evola/ http://hinv.jp/g-compass/ 産業技術総合研究所バイオメディシナル情報研究センター 原雄一郎 2012 年 1 月 20 日 ( 金 ) 於 : 産業技術総合研究所関西センター

本日の概要 H-InvDB が提供する 2 つの比較ゲノムデータベースの紹介およびデモ 分子進化データベース Ver7.5 ゲノムアラインメントブラウザ Ver3.0 2

1. 進化学 比較ゲノム学の基礎 2. Evola G-compass が提供するデータ 3. Evola G-compass のデータを用いて行える解析 4. 実習 3

創薬と進化? 生物学的な実験や解析には進化学的な概念が取り込まれている モデル生物 ( 生物は共通祖先から進化した ) 遺伝子配列の類似性 ( 遺伝子の自然選択 中立進化 ) 今日お伝えしたいこと 1: 創薬研究における作業仮説の設定に進化学的思考取りいれてみてはいかがでしょうか? 今日お伝えしたいこと 2: 分子進化 比較ゲノムデータベースを活用しましょう! 4

Nothing in Biology Makes Sense Except in the Light of Evolution Theodosius Dobzhansky 5

似ていること 異なること 生物種間 個体間 同一ゲノムの 2 つの遺伝子間で 似ている : 祖先を共有する ( 相同性 ) 機能において共通のルールを持つ 異なる : 両方 or いずれかの系統で変化した それぞれに特異的な特徴をつくる 例外 収斂進化 : 鳥 コウモリ 昆虫の翼 ズワイガニとタラバガニの形態 6

似ていること 異なること マウスとハエの Hox 遺伝子群 Pearson et al., Nat.Revi.Genet., 7 2005

収斂進化 JT 生命誌研究館 8

進化学から見たモデル生物 モデル生物を用いた実験がヒト遺伝子の機能解析の代替となり得るわけ 現生のあらゆる生物は共通祖先から進化した ヒトとモデル生物は相同なゲノム 遺伝子セットを持つ ヒトとモデル生物で共通する形質は共通祖先から進化的に保存されてきた可能性が高い ヒト遺伝子とモデル生物の相同遺伝子は 共通した機能を持つと考えられる ヒト遺伝子とモデル生物の相同遺伝子には 異なる 箇所もある 生物アイコン : NBDC より 9

比較ゲノム学とは 異種間あるいは同種間におけるゲノム配列や構造の網羅的な比較解析を比較ゲノムという 異種間 : ヒト - モデル生物 同種異株間 ( 集団間 ): ヒト集団 同一個体 : 正常 - ガン細胞 同一ゲノム : 重複領域 X-Y 染色体間 相同性という進化的概念に基づく 比較ゲノム解析の結果は ゲノムの注釈づけ ( アノテーション ) や 進化学的観点に基づく生命現象の解明への基礎データとして用いられる 10

相同遺伝子 : オーソログとパラログ オーソログ : 種分岐によって分かれた相同遺伝子パラログ : 遺伝子重複によって分かれた相同遺伝子 グロビン祖先遺伝子 α グロビン遺伝子 ヒト α ヒト β パラログ オーソログ 遺伝子重複 種分岐 β グロビン遺伝子 マウス α マウス β パラログ オーソログ 11

1. 進化学 比較ゲノム学の基礎 2. Evola G-compass が提供するデータ 3. Evola G-compass のデータを用いて行える解析 4. 実習 12

Evola, G-compass が対象とするデータ ヒト マウス Evola オーソログ群を中心とした遺伝子ファミリー 13

Evola, G-compass が対象とするデータ ヒト マウス G-compass Evola ヒトオーソログ群を - 他生物間におけるオーソロガス領域の中心とした遺伝子ゲノムアラインメントファミリー 14

H-InvDB における Evola, G-compass の関係 サテライトデータベース ツール TACT LEGENDA H-DBAS VarysysDB H-InvDB Web servise etc. 15

Evola, G-compass に用いている生物種 ヒトゲノムおよび 14 種の脊椎動物ゲノムを使用 ヒト hg19* チンパンジー pantro2* オランウータン ponabe2* アカゲザル rhemac2* 霊長類 マウス mm9* ラット rn4* イヌ canfam2* ウマ equcab2* 哺乳類 ウシ bostau4* オポッサム mondom5* ニワトリ galgal3* ゼブラフィッシュ danrer5* メダカ orylat2* ミドリフグ tetnig1* 鳥類 魚類 トラフグ fr2* * UCSC ゲノム http://genome.ucsc.edu/ Evola のみ 16

データ作成の枠組み ヒトゲノム他生物ゲノム ヒト 他生物間の双方向ゲノムアラインメントによる 1:1 アラインメント領域の同定 ヒト 他生物 アラインメント領域の注釈づけ 17

データ作成の枠組み ヒトゲノム他生物ゲノム モデル生物 1 ヒト ヒト 他生物間の双方向ゲノムアラインメントによる 1:1 アラインメント領域の同定 モデル生物 2 ヒト遺伝子 (43,159 HIX) 他生物遺伝子 アラインメント領域の注釈づけ 1:1 ゲノムアラインメントにオーバーラップする相同遺伝子対の同定 相同遺伝子対のクラスタリングによるオーソログ群の同定 18

データ作成の枠組み ヒトゲノム他生物ゲノム ヒトヒト遺伝子 ヒト 他生物間の双方向ゲノムアラインメントによる 1:1 アラインメント領域の同定 他生物 ヒト遺伝子 (43,159 HIX) 他生物遺伝子 アラインメント領域の注釈づけ 分子系統解析に基づくオーソロジー判定を含む (Manual curation) 1:1 ゲノムアラインメントにオーバーラップする相同遺伝子対の同定 相同遺伝子対のクラスタリングによるオーソログ群の同定 遺伝子群の注釈づけ アミノ酸配列の相同性に基づくヒト遺伝子の単結合クラスタリング 両グループの統合による遺伝子ファミリーの同定 19

G-compass 統計データ ( 抜粋 ) 生物種のペア ( ヒト対他生物種 ) ヒトゲノム上のアラインメント長 (Gb) アラインメントブロック数 アラインメント長の中央値 (bp) アラインメントに完全に含まれる遺伝子数 ギャップ無 配列の相違度 ギャップ有 ヒト-チンパンジー 2.36 188,292 6,546 20,196 0.0144 0.0213 ヒト-マカクザル 2.22 420,684 3,473 16,278 0.0631 0.0864 ヒト-マウス 1.06 828,478 776 9,749 0.3158 0.4228 ヒト-イヌ 1.63 760,305 1,317 12,604 0.2512 0.3714 ヒトゲノム 3.11 - - 35,303 * - - *based on H-InvDB 6.2 20

Evola 統計データ * ヒトと他生物種のオーソログの関係は 1 遺伝子対 1 遺伝子 ではなく n 対 m (n 1, m 1) として定義されるため Human genes と ( 他生物 )Genes の数字は一致しない 21

1. 進化学 比較ゲノム学の基礎 2. Evola G-compass が提供するデータ 3. Evola G-compass のデータを用いて行える解析 4. 実習 22

進化学から見たモデル生物 モデル生物を用いた実験がヒト遺伝子の機能解析の代替となり得るわけ 現生のあらゆる生物は共通祖先から進化した ヒトとモデル生物は相同なゲノム 遺伝子セットを持つ ヒトとモデル生物で共通する形質は共通祖先から進化的に保存されてきた可能性が高い ヒト遺伝子とモデル生物の相同遺伝子は 共通した機能を持つと考えられる ヒト遺伝子とモデル生物の相同遺伝子には 異なる 箇所もある 23

Evola G-compass でできること 着目するヒト (or モデル生物 ) の遺伝子 ゲノム領域において モデル生物 (or ヒト ) に相同な遺伝子 ゲノム領域を同定する 相同遺伝子 領域間で よく似ているところ 異なるところ を調べる 相同遺伝子 領域に存在する機能に関するアノテーションを抽出する 相同遺伝子のさらなる進化学的情報を抽出する Evola G-compass は上記のデータ あるいはデータ抽出が簡単に行える環境を提供しています!! 24

Evola, G-compass をどのように研究に活かすか Evola: 対象とする遺伝子 ゲノム領域を種間 ( ヒト モデル生物 ) で比較する オーソログは存在するか ( 対象とするヒト遺伝子においてモデル生物のオーソログを同定する ) パラログはいくつあるか いつ重複したか 相同遺伝子間で 特徴的な自然選択がかかった領域があるか 祖先遺伝子 遺伝子 α ヒト α ヒト β 表現型を知りたいヒト遺伝子 遺伝子重複 種分岐 解析対象とすべきモデル生物遺伝子 遺伝子 β マウス α マウス β 25

Evola, G-compass をどのように研究に活かすか G-copmass: 対象とするゲノム領域を種間 ( ヒト モデル生物 ) で比較する 相同遺伝子の非コード領域や近傍領域 (e.g. 転写調節領域 ) の配列も保存されているか 対象とする保存領域に特徴的な あるいは表現型に関わるゲノム構造は存在するか 遺伝子の並び ( シンテニー ) も種間で保存されているか プロモーターエクソンイントロンエンハンサー 転写調節領域 26

1. 進化学 比較ゲノム学の基礎 2. Evola G-compass が提供するデータ 3. Evola G-compass のデータを用いて行える解析 4. 実習 27

Evola, G-compass を使ってみましょう アクセス方法 1. H-InvDB のメインページ (http://hinv.jp/hinv/ahg-db/index_ja.jsp) クイックガイド 2. 28

実習課題 1. ips 誘導に効果的な因子 Glis1 について (Evola) モデル生物にオーソログはありますか 重複遺伝子はありますか? 重複遺伝子の情報を調べましょう アラインメントを見てみましょう 分子系統樹を見てみましょう いつごろ重複がおきましたか? 2. 山中 4 因子の 1 つ SOX2 について (G-compass) マウスの相同ゲノム領域は何番染色体にありますか? SOX2 上流には転写に関わる構造がありますか? SOX2 近傍には他にどんな特徴がありますか それはヒトとマウスで保存されていますか? 3. 他に興味がある遺伝子があれば調べてみましょう 29

実習課題 (advanced) 4. Evola を軸にした分子系統解析 Glis ファミリーの分子系統解析 ~Glis1, Glis3 は近縁 それでは Glis2 は進化的にどの位置にいるか? 1 Glis ファミリータンパク配列の取得 Glis1,2,3 それぞれのオーソログタンパクセットを Evola から取得 アウトグループの配列を取得 ヒト Glis1,2,3 に対するハエ センチュウなどの相同配列を相同性検索等で取得する 2 分子系統解析 配列セットのアラインメント 分子系統樹作成 配列アラインメントと分子系統樹作成のツールには MEGA( ソフトウェア ) MAFFT Server( オンライン ) などがある 30

実習課題 (advanced) 5. 非 (or Evola にはない ) モデル生物にも Evola は有用? 非モデル生物を用いている場合にも Evola からオーソログ配列を取得して活用できる 例 ) ミシシッピアカミミガメの DNA polymerase alpha タンパク http://goo.gl/hw3tt (GenBank: BAD92008.1) 配列を取得し H-InvDB の BLASTP サーチにかける Top hit をクリックし H-InvDB の Transcript view へ 木のアイコン をクリックし Evola のメイン画面へ 左カラム Data download Sequence Protein をクリックしオーソログ配列セットを取得 アラインメント + 分子系統解析によりオーソログ関係を確認する 31

ダウンロードデータ Evola のデータ ( オーソログ情報 アラインメント 分子系統樹など ) は一括してダウンロード可能 32

d N /d S : 遺伝子が受ける自然選択圧の指標 オーソログ間の d N /d S ( 非同義置換率 / 同義置換率 ) をダウンロードデータとして提供 タブ区切りのテキストとして提供 Excel でも開けられる 33

Evola データの活用例 : リンク自動管理シス テムによる種を超えた ID 変換 Mouse IKMC Drug Drug Compound Human 34

参考文献 Evola: Ortholog database of all human genes in H-InvDB with manual curation of phylogenetic trees. Matsuya A, Sakate R, Kawahara Y, et al. Nucleic Acids Res. D787-792 (2008) A web tool for comparative genomics: G-compass. Fujii Y, Itoh T, Sakate R, et al. Gene 364, 45-52 (2005) G-compass: A web-based comparative genome browser between human and other vertebrate genomes. Kawahara Y, Sakate R, Matsuya A, et al. Bioinformatics 25, 3321-2 (2009) 35

付録 1. Evola チュートリアル http://hinv.jp/hinv/help/help_evola.html 36

Evola の全体像 ヒト遺伝子のオルソログ Alignment Locus maps ヒト遺伝子ファミリーのオルソログ Gene family/group

トップ / 検索ページ Keyword( ヒト ) 遺伝子名 (Definition): Gene symbol( ヒト ) HUGO の遺伝子 ID: 例 lung cancer RHEB Accession number( ヒト 他生物 代表配列以外も含む ) H-Inv transcript ID (HIT): HIT000000011 H-Inv cluster ID (HIX): HIX0004994 DDBJ: AB002303 Ensembl: ENSPTRT00000031580 RefSeq: NM_173392

検索結果ページ

ダウンロードページ

メインページ オーソログ情報 ( 左フレーム )

Alignment アミノ酸配列のアラインメント表示 ( 右フレーム )

Locus maps スプライシングバリアントの種間比較 ( 右フレーム )

Gene family/group 遺伝子ファミリーの種間比較

付録 2. G-compass チュートリアル http://hinv.jp/g-compass/ Help をクリック 45

トップ画面 hinv.jp/g-compass/ 遺伝子 / ゲノム保存領域検索 BLAT 検索 ( 問合せ配列と相同なゲノム領域を検索 ) ヒト染色体地図 ( クリックでそのゲノム領域のメイン画面を表示 )

遺伝子検索 遺伝子検索 (Gene) 検索属性を選択し 検索語を入力して遺伝子を検索 検索属性 Keyword: 下記 3 つすべて Definition (Human): ヒトの遺伝子名 Endosomeなど Gene symbol (Human): ヒトの遺伝子シンボル ZFYVE16など Accession number (All species): ヒトと他の12 生物のアクセッション番号 HIT000000011 AB002303 ENSRNOT00000017705 XM_001920883など

遺伝子検索 検索結果 並び替え項目 昇順 / 降順 検索結果のダウンロード ( テキストファイル ) メイン画面へ ヒト遺伝子情報 他生物オーソログ情報

ゲノム保存領域検索 ゲノム領域検索 (Genome) 条件に一致するゲノムアラインメントを検索 生物種 ( ペアの片方 ) 染色体バンド検索染色体バンド (1p35 など ) を座標に変換可能 ( ヒトのみ ) オプション option 下記の条件により絞り込みが可能 生物種ペア ( ヒト - 他生物 ) 一致度 identity (%) ゲノムアラインメントの配列一致度の範囲 長さ Length (bp) ゲノムアラインメントの長さ 100% 保存領域 UCE 哺乳類種間で共有する UCE の有無 染色体 開始 - 終了塩基座標

ゲノム保存領域検索 検索結果 並び替え項目 昇順 / 降順 検索結果のダウンロード ( テキストファイル ) メイン画面へ ヒトゲノム座標 他生物ゲノム座標 ゲノムアラインメントの一 致度と長さ

メイン画面 2 生物のゲノム領域を平行に表示 ( ヒト表示領域に最も対応する他生物ゲノム領域を表示 ) 移動 拡大 / 縮小 (2 生物同時 ) 移動 拡大 / 縮小 ( ヒト ) 表示範囲 ( 最大 400,000 bp) 移動 拡大 / 縮小 ( 他生物 )

メイン画面 2 生物のゲノム領域を平行に表示 ( ヒト表示領域に最も対応する他生物ゲノム領域を表示 ) 生物種選択 座標選択

メイン画面特定のゲノムアラインメント領域に移動 ( 生物種変更時など )

メイン画面 サブビューアー :CGPLOT (dot plot viewer)

メイン画面 サブビューアー :Comparative Exon Viewer

メイン画面 サブビューアー :Genome Alignment Viewer

ダウンロード