Microsoft PowerPoint - プレシジョン創薬概論 P_ex_velvet.PPT

Similar documents
国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日


AJACS_komachi.key


1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ ( から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

KEGG.ppt

分子系統樹作成方法

Bioinformatics2



AJACS18_ ppt


DNAFORM Clone Search Engine ユーザーズガイド

nagasaki_GMT2015_key09

Contents Logging in 3-14 Downloading files from e-ijlp 15 Submitting files on e-ijlp Sending messages to instructors Setting up automatic

Microsoft PowerPoint - ????????????2016_01P.ppt [?????]

プレゼンテーション2.ppt

スライド 1

分子系統樹作成方法

Microsoft PowerPoint - 6_TS-0891(TS-0835(Custom TaqMan Assay Design Tool利用方法修正5.pptx

KEGG_PATHWAY.ppt

ユーザ デバイス プロファイルの ファイル形式

Introduction Purpose This training course demonstrates the use of the High-performance Embedded Workshop (HEW), a key tool for developing software for

1:.anchors Menubar Sequence Navigation order Plot & Color options Left sidebar ON/OFF Right sidebar ON/OFF History / Bookmark Apply sequence order / p

130712AJACS40

Nakamura

PowerPoint プレゼンテーション

bioinfo pptx

PowerPoint プレゼンテーション


Introduction Purpose This training course describes the configuration and session features of the High-performance Embedded Workshop (HEW), a key tool

GWB_RNA-Seq_

研究成果報告書

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

プレゼンテーション3

GWB

電話機のファイル形式

Microsoft Word - Win-Outlook.docx

国立遺伝学研究所におけるDNAデータバンク:DDBJ

Sequence Read Archive 2013 年年 10 月 25 日 第 10 回シーケンサー利利 用技術講習会 ( 理理研横浜 ) 1

Maser - User Operation Manual

Microsoft PowerPoint - バイオインフォマティクス2017_01P.ppt

GWB

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

ゲートウェイのファイル形式

7-1(DNA配列から遺伝子を探す).ppt

[2] , [3] 2. 2 [4] 2. 3 BABOK BABOK(Business Analysis Body of Knowledge) BABOK IIBA(International Institute of Business Analysis) BABOK 7

HIS-CCBASEver2

第2章 生物有機化学実験及び実験法

LC304_manual.ai

Slide 1

ch2_android_2pri.indd

名古屋大学農学部 生物情報工学 II 11 月 29 日

[Business Communication]

thermofisher.com mirVana miRNA mimics/inhibitors 検索マニュアル

スライド 1

thermofisher.com Silencer Select pre-designed / validated siRNA 検索マニュアル

分子系統解析における様々な問題について 田辺晶史

2

基本的な利用法

GWB

カスタムアレイ作成の流れ Probe x Probe D Probes Probe Groups Microarray Designs Probe 4 Probe 1 Probe C Probe A Probe w Probe 2 アップロード Probe 3 Probe y Probe B プロー

Microsoft PowerPoint - Tutorial_2_upd.ppt

注意 : ネットワークカメラの画像を回転させて表示した場合 モーション検知ウインドウは回転しないまま表示されますが 検知ウインドウは被写体に対して 指定した場所通りに動作します モーション検知ウインドウの縦横のサイズは 8 ピクセルで割り切れるサイズに自動調整されます モーション検知ウインドウを作成

PowerPoint Presentation

Microsoft Word - SSI_Smart-Trading_QA_ja_ doc

Microsoft Word - PrivateAccess_UM.docx

DOUSHISYA-sports_R12339(高解像度).pdf

バクテリアゲノム解析

NGSハンズオン講習会

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

090825_Sakate_for_dist.pptx

ICSD web 簡単ガイド (Ver

受付代行 設定マニュアル このマニュアルでは 恵比寿ボイスプロダクションが Google アシスタントアプリで公開している 受付代行 ( ) を使って Google

2

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

Microsoft PowerPoint - BIセンターセミナー2013.pptx[読み取り専用]

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

Page 1 of 6 B (The World of Mathematics) November 20, 2006 Final Exam 2006 Division: ID#: Name: 1. p, q, r (Let p, q, r are propositions. ) (10pts) (a

ゲートウェイ ファイル形式

はじめに 日本バイオインフォマティクス学会主催のバイオインフォマティクス技術者認定試験の受験を念頭に 出題範囲 g/modules/jsbi/in dex.php/nintei/ind ex.html 赤線 : 本日扱う範囲

MOMW_I_,II 利用ガイド.PDF

Microsoft Word - 基礎編<20>siRNA設計.doc

ゲートウェイのファイル形式

Microsoft Word - GCOEキャリアパス支援テクニカルセミナー090709web.doc

MENU 키를 누르면 아래의 화면이 나타납니다

レポートでのデータのフィルタ

Web Web Web Web Web, i

Microsoft Word - D JP.docx

ゲームプログラミング講習 第0章 導入

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

Microsoft Word - Meta70_Preferences.doc

スライド 1

I

Microsoft Word - HowToSetupVault_mod.doc

ACS電子ジャーナル利用マニュアル

Microsoft PowerPoint - LAB-03-SR18-ã…Łã‡¡ã‡¤ã…«ã…ªã‡¹ã…‹ã‡¢-v1

..,,,, , ( ) 3.,., 3.,., 500, 233.,, 3,,.,, i

任意の間隔での FTP 画像送信イベントの設定方法 はじめに 本ドキュメントでは AXIS ネットワークカメラ / ビデオエンコーダにおいて任意の間隔で画像を FTP サー バーへ送信するイベントの設定手順を説明します 設定手順手順 1:AXIS ネットワークカメラ / ビデオエンコーダの設定ページ

Microsoft Word - KUINS-Air_W10_ docx

Transcription:

プレシジョン創薬概論第 4 回 2019/05/13 オミクス 医療情報の統計 情報学的解析法 医薬保健研究域薬学系活性相関物理化学 髙橋広夫 授業計画 Ensembl を使った遺伝情報の取得 (5/13) UniProt を用いた配列情報取得や解析 (5/13) DDBJ を用いた解析 (5/13) velvet を用いた de novo assembly (for Windows) (5/13) 1 2 講義の資料置き場 Internet Explorerを起動しGoogleを使って 高橋広夫 で検索 (Launch Internet Explorer and search Takahashi Hiro Kanazawa ) インターネット上のプログラムを利用したバイオインフォマティクス入門編 Google (not bing) 1~9 つ目にあるはず 3 4 講義の資料置き場 講義の資料置き場 プレシジョン創薬概論を (Click Introduction to Precision Medicine) 講義の資料置き場 を (Click lecture materials) 5 6

ENSEMBL を使った遺伝子情報の検索 Google で ENSEMBL ( 大 小文字は区別無し ) と入力 (enter ENSEMBL )(No case-insensitive) Ensembl 7 8 Ensembl (https://www.ensembl.org/index.html) EnsemblはEBI( 欧 ) とサンカ ーセンターが1999 年に立ち上げたDB (Ensembl genome database project is a joint scientific project between the European Bioinformatics Institute and the Wellcome Trust Sanger Institute, which was launched in 1999) ゲノムが解読された生物に関する包括的自動アノテーション情報 (Comprehensive information of automatic annotation on sequenced genomes) Ensembl のサイト - 種分類ごとにサイト ENSEMBL <http://www.ensembl.org/> 150 種 (150 species for Ensembl Release 96) 酵母やショウジョウバエも含む (Including yeast and fruit fly) BLAST BioMart Ensembl Plants ( 植物 ) <http://plants.ensembl.org/> 61 種 (61 species for Ensembl plant Release 43) Ensembl Metazoa ( 後生動物 ) <http://metazoa.ensembl.org/> BioMart は Ontario Institute for Cancer Research (OiCR) と European Bioinformatics Institute (EBI) が共同で開発しているコミュニティ駆動型プロジェクトで遺伝情報の一元的なアクセス法を提供している (BioMart is a community-driven project to provide unified access to distributed research data) Ensembl Fungi ( 菌類 ) <http://fungi.ensembl.org/> Ensembl Bacteria ( 真正細菌 ) <http://bacteria.ensembl.org/> Ensembl Protists ( 原生生物 ) <http://protists.ensembl.org/> 9 10 ヒト TP53 遺伝子を調べてみよう (Let s try to search information of human TP53 in ENSEMBL) ヒトを選んで TP53 を入力して (Choose human and input TP53 and click "GO") 11 12

GRCh38.p12 は最新のヒトゲノム (Latest human genome) TP53のスプライスバリアント ENSEMBL stable transcript ID CCDS UniProt RefSeq ENSEMBL stable gene ID 遺伝子の説明染色体番号 座標 HUGO Gene Nomenclature Committee(HGNC) の正式名 転写産物表 Protein coding はコート タンハ ク質 数値が小さいほど 本当に存在 (Transcript Support Level, for transcripts that are not supported at all by either an mrna or an EST) 遺伝子別名 下へスクロール (Scroll down) CCDS (Consensus CDS) 番号 Nonsense mediated decay/processed transcript /Retained intron 不安定な転写産物 (ncrna がコードされている場合あり ) 13 14 TP53 のページのゲノムブラウザ TP53 のページのゲノムブラウザ 17 番染色体 (Chr17) Exon(CDS) ( 塗りつぶされたボックス ) TP53の splice variant Intron Exon(UTR) Promotor TP53 Back 1 window Forward 1 window Genome position 15 Back 1M Zoom in Zoom out Forward 1M 16 17 18

今回はエキソン単位 下へスクロール (Scroll down) 19 20 FASTA ファイル 配列名 ( 必ず > から始まる ) Sequence Name (Each identifier line starts with >) 21 >TP53-222 ENSE00003753508 exon:protein_coding GATGGGATTGGGGTTTTCCCCTCCCATGTGCTCAAGACTGGCGCTAAAAGTTTTGAGCTT CTCAAAAGTCTAGAGCCACCGTCCAGGGAGCAGGTAGCTGCTGGGCTCCGGGGACACTTT GCGTTCGGGCTGGGAGCGTGCTTTCCACGACGGTGACACGCTTCCCTGGATTGG >TP53-222 ENSE00002667911 exon:protein_coding CAGCCAGACTGCCTTCCGGGTCACTGCCATGGAGGAGCCGCAGTCAGATCCTAGCGTCGA GCCCCCTCTGAGTCAGGAAACATTTTCAGACCTATGGAAACT >TP53-222 この配列のどこかにセーブしてください ENSE00002419584 exon:protein_coding ACTTCCTGAAAACAACGTTCTG (Save this sequence) >TP53-222 ENSE00003625790 exon:protein_coding TCCCCCTTGCCGTCCCAAGCAATGGATGATTTGATGCTGTCCCCGGACGATATTGAACAA TGGTTCACTGAAGACCCAGGTCCAGATGAAGCTCCCAGAATGCCAGAGGCTGCTCCCCCC GTGGCCCCTGCACCAGCAGCTCCTACACCGGCGGCCCCTGCACCAGCCCCCTCCTGGCCC CTGTCATCTTCTGTCCCTTCCCAGAAAACCTACCAGGGCAGCTACGGTTTCCGTCTGGGC TTCTTGCATTCTGGGACAGCCAAGTCTGTGACTTGCACG 22 メモ帳を新規で開く (Open a new instance of Notepad) ENSEMBL を使った BLAST 解析 p53 の塩基配列をペースト (Paste base sequence of p53) デスクトップへ (To Desktop) p53.exon.fasta.txt 23 24

ENSEMBL を使った BLAST 解析 ENSEMBL を使った BLAST 解析 先ほどの配列をペースト (Paste the sequence saved) ヒトを選択 (Choose Homo sapiens) 今回は BLASTN を選択 (Choose BLASTN) 25 26 ENSEMBLを使ったBLAST 解析ヒット遺伝子正鎖か逆鎖かゲノムのヒット位置 E 値 染色体マップ上の位置 Choose Ensembl Genes Choose Human genes 27 注 : BioMart を使う時は Internet explorer ではうまく動作しない (BioMart does not work properly on Internet Explorer) 28 遺伝子の属性 付加情報 配列を取得したいとき (Retrieve sequences) データの受け取り方法 ファイル形式 e.g. GO term accession GO term name HGNC symbol e.g. Gene stable ID Transcript stable ID Gene description Gene name Strand Gene start (bp) Gene end (bp) 必要な属性を選んで Results を ( 例 : HGNC symbol ) (Choose attributes and click Results. ) 29 この機能はときどき壊れる (This feature sometimes breaks). 30

Google で uniprot( 大文字小文字は区別無し ) と入力 (Enter UniProt )(No case-insensitive) UniProt 31 32 目的 (Objective) UniProt から TP53 タンパク質を検索 (Retrieve the amino acid sequence of TP53 from UniProt) UniProt の BLASTp や ClustalΩ( オメガ ) DDBJ の BLAST で対応する塩基配列を見つける (Find the base sequence corresponding to TP53 protein sequence by using DDBJ BLAST) アクセッション番号 タンパク質名遺伝子名属種名アミノ酸長 Query として TP53 を入力して Search ボタンを押す (Enter TP53 and push Search button) 33 アクセッション番号 P04637 をすると ヒトの p53 タンパク質の詳細情報を閲覧可能 34 アクセッション番号 P04637 ( ヒトの p53 タンパク質 ) の詳細情報 Protein names > タンパク質名 Gene names (Synonyms) > 遺伝子名 ( 別名 ) Organism > 属種名 Taxonomic identifier > 種名番号 Taxonomic lineage > 系統情報 ( 界門綱目科属種等 ) Sequence status > 完全長かなどなど Advanced で実行した場合 前のページで見ていたタンパク質のアクセッション番号 アミノ酸データを入力しても ok (Accssion no. selected in the previous slide) Click ギャップありアライメント (Gapped alignment) E 値の閾値 ( 小さいほど厳しい ) BLAST ボタンをしてデフォルト設定で Go で実行 (Click the BLAST button and execute it with default) 35 (The smaller the stricter) 36

UniProt での BLASTp の実行結果 p53 での検索結果 4 つ前のスライド Align を (ClustalΩ 実行 ) (click here) マルチプルアライメントを実行 (perform multiple alignment) ゴリラ (Gorilla) チンパンジーは 100% ゴリラとは 99% 一致 チンパンジー (chimpanzee) 2 つ以上のエントリを選択 (Choose over 1 entry) 37 38 p53 での検索結果を選択して 配列データを抽出 2 つ以上のエントリを選択 FASTA ( ファストエー ) 2 つ前のスライド 標準的な配列データ表記法 Download Go を * 完全に保存. 部分的に保存 39 40 (FASTA 形式 ) > 配列名 ( 任意 ) アミノ酸配列 ( 改行は 無視される ) CTRL+A と CTRL+C でコピー 41 CTRL+V でメモ帳にペースト (Paste with CTRL+V to Notepad) 名前をつけて保存 (Save as) 42

するDDBJでtBLASTnを使った解析目的 p53(human) のタンパク質から 当該塩基配列を予測する GoogleでDDBJで検索 マルチプルアライメント BLAST 43 44 1Human の p53 のアミノ酸配列をペーストする 3 ここをして実行 2Human にだけチェックを入れて その他の項目のチェックを外す Primate: 霊長類, Rodent: 齧歯類, Mammal: ほ乳類, Vertebrate: 脊椎動物 45 しばらく待ちましょう!!(2~3 分 ) Wait 2-3 minutes 46 中略 当該エントリの詳細情報を参照 Best Hit のエントリ ( 一番上 ) をして開く E=0 なので完全一致とと推測できる 47 48

塩基配列のフラットデータ アミノ酸配列データ ( 無い場合もある ) 塩基配列 49