GBS(Genotyping by Sequencing)によるアグリゲノミクス解析

Similar documents
PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

次世代シークエンサーを用いたがんクリニカルシークエンス解析

NGSデータ解析入門Webセミナー

SVS_training_slide_

GWB

アノテーション・フィルタリング用パイプラインとクリニカルレポートの作成

GWB

内容 検索及びアクセス方法 P3-4 Gene Expression Assay 検索 P6-28 SNP Genotyping Assay 検索 P30-39 Copy Number Assay 検索 P

国立遺伝学研究所におけるDNAデータバンク:DDBJ

Qlucore_seminar_slide_180604

Microsoft PowerPoint - 1_新アッセイ検索(TaqMan).pptx

GWB

Microsoft PowerPoint - T05_田畑先生【CC-BY】.pptx

Microsoft PowerPoint - Ion Reporter?ソフトウェアを用いた変異解析4.6.pptx

分子系統樹作成方法

やぶなべ会報 第16号

2012 年 2 月 3 日第 5 回アグリ技術シーズセミナー 植物ゲノム研究の育種への利用 - 世界の最先端と育種への利用状況 その可能性 - コムギ遺伝資源の持つ表現型 遺伝子型多型の評価 : ゲノム情報活用の現状と課題 京都大学大学院農学研究科応用生物科学専攻植物遺伝学分野那須田周平

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

分子系統樹作成方法

Microsoft PowerPoint - 8_TS-0894(TaqMan_SNPGenotypingAssays_製品情報及び検索方法再修正.pptx

PrimerArray® Analysis Tool Ver.2.2

名古屋大学農学部 生物情報工学 II 11 月 29 日

Chapter 1 Epidemiological Terminology

nagasaki_GMT2015_key09

Microsoft PowerPoint - 遺伝統計学夏の学校2018_Webツール入門.pptx

統合失調症発症に強い影響を及ぼす遺伝子変異を,神経発達関連遺伝子のNDE1内に同定した

Microsoft PowerPoint ppt

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

記載例 : ウイルス マウス ( 感染実験 ) ( 注 )Web システム上で承認された実験計画の変更申請については 様式 A 中央の これまでの変更 申請を選択し 承認番号を入力すると過去の申請内容が反映されます さきに内容を呼び出してから入力を始めてください 加齢医学研究所 分野東北太郎教授 組

GWB_RNA-Seq_

ThermoFisher

Presentation Title Arial 28pt Bold Agilent Blue

Agilent 1色法 2条件比較 繰り返し実験なし

人工知能補足_池村

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

MiSeq Reporter Software Overview

PowerPoint プレゼンテーション

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

PowerPoint プレゼンテーション

ic3_cf_p1-70_1018.indd

0.0 Excelファイルの読み取り専用での立ち上げ手順 1) 開示 Excelファイルの知的所有権について開示する数値解析の説明用の Excel ファイルには 改変ができないようにパスワードが設定してあります しかし 読者の方には読み取り用のパスワードを開示しますので Excel ファイルを読み取

リード・ゲノム・アノテーションインポート

Untitled

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

第 10 回シーケンス講習会 RNA-seq library 調製法の特徴と選び方 理化学研究所 (RIKEN) ライフサイエンス技術基盤研究センター (CLST) 機能性ゲノム解析部門 (DGT) ゲノムネットワーク解析支援施設 (GeNAS) 野間将平

基礎遺伝学

報道関係者各位 プレスリリース 2019 年 01 月 15 日 株式会社ネオジャパン グループウェア desknet's NEO バージョン 5.2 を 1 月 15 日に提供開始 ~ 業務アプリ作成ツール AppSuite との連携を強化 他にも AppSuite 連携 API 公開など多数の機

IonTorrent RNA-Seq 解析概要 サーモフィッシャーサイエンティフィックライフテクノロジーズジャパンテクニカルサポート The world leader in serving science

CBRC CBRC DNA

<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>

GWAS GWAS GWAS 2 GWAS

.\..2-3.iRETIO 85...j

PowerPoint プレゼンテーション

Microsoft PowerPoint - 3_TS-705(TaqMan_GeneExpressionAssays_製品情報及び検索方法修整10.pptx

Microsoft PowerPoint - FormsUpgrade_Tune.ppt

第 20 講遺伝 3 伴性遺伝遺伝子がX 染色体上にあるときの遺伝のこと 次代 ( 子供 ) の雄 雌の表現型の比が異なるとき その遺伝子はX 染色体上にあると判断できる (Y 染色体上にあるとき その形質は雄にしか現れないため これを限性遺伝という ) このとき X 染色体に存在する遺伝子を右肩に

大学院博士課程共通科目ベーシックプログラム

Microsoft PowerPoint - SNGS_Ana講習会5月29日.pptx

Microsoft PowerPoint - GLMMexample_ver pptx

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

記載例 : 大腸菌 ウイルス ( 培養細胞 ) ( 注 )Web システム上で承認された実験計画の変更申請については 様式 A 中央の これまでの変更 申請を選択し 承認番号を入力すると過去の申請内容が反映されます さきに内容を呼び出してから入力を始めてください 加齢医学研究所 分野東北太郎教授 ヒ

Slide 1

ドリルダウン棒グラフを右クリックすると ドリルダウン が選択でき ドリルダウンすることで更に細かな視点で構成比を確認できます 例えば グラフの出力値を 品種 にしてドリルダウンで メーカー を設定すると 選択された品種の中でどのメーカーが売上に貢献しているかを確認することが可能です 該当商品の確認棒

IBIS

WebARENA SuiteX V2 EC-CUBE 2.13 インストールマニュアル ( 標準 MySQL+ 非 SSL ) 作成 :2014 年 2 月 Ver.1.1

統計的データ解析

PowerPoint プレゼンテーション

目次 はじめに... 2 動作環境... 2 ユーザーサポートについて... 2 セットアップ ( インストール ) 手順... 3 セットアップ手順 1 ソフトウェアのダウンロード... 4 セットアップ手順 2 Firebird データベースのインストール... 5 セットアップ手順 2 Fir

iNFUSE インフューズ

Microsoft Word - BMDS_guidance pdf_final

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

パソコン決裁7 サービスリリース1 リリースノート

Taro-参考資料1.jtd

カイ二乗フィット検定、パラメータの誤差

スライド 1

Microsoft PowerPoint - 原稿案(QS3D アプリ集表紙).pptx

Rの基本操作


分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

Infinium BeadChip COGS BeadChip 4 * iselect 3 SNP 25 1 SNP NGS Sequencing by Synthesis SBS HiSeq MiSeq WGS 1 RNA-Seq ChIP-Seq 1 1 * icogs BCAC OCAC PR

基本的な利用法

.\ /......

tokyo_t3.pdf

<4D F736F F D20838C837C815B836789DB91E890E096BE2E646F6378>

The world leader in serving science OMNIC ユーザーライブラリベーシックマニュアル サーモフィッシャーサイエンティフィック株式会社

UTF8対応日本語簡易マニュアル

Fujitsu Standard Tool

二加屋様 Web B2B システム 商品 CSV データ取込マニュアル 2012 年 10 月 19 日 株式会社アイル 概要 このマニュアルは二加屋様の Web B2B システムに商品 CSV データから商品情報を登録す るための手順を示すものです マニュアル内で利用するツール このマニュアル内で

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Microsoft Word - manual doc

SIサイエンス株式会社 standard plant product Algal

Easy Sep

東京医科歯科大学医歯学研究支援センター illumina Genome Analyzer IIx 利用基準 平成 23 年 10 月 1 日医歯学研究支援センター長制定 ( 趣旨 ) 第 1 条次世代型シークエンサーはヒトを含むあらゆる生物種の全ゲノム配列の決定 全エキソンの変異解析 トランスクリプ

66. ウシの有角 無角の遺伝 ( ア ) 遺伝的に異なる 個体間の交配をとくに交雑という したがって, 検定交雑 も正解 ( イ ) 優性形質である無角との検定交雑で, 表現型がすべて有角となることは大学入試生物では ありえない 問 独立の法則に従う遺伝子型 AaBb の個体の配偶子の遺伝子型は,

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft PowerPoint - 資料04 重回帰分析.ppt

<4D F736F F D F4390B394C5816A8C B835E C835A AA90CD82A982E78CA982E990B68A888F4B8AB595618AC7979D312D332E646F63>

Transcription:

GBS (Genotyping by Sequencing) によるアグリゲノミクス解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1

研究の背景 多数サンプルの SNP データを統計的に比較し 表現型と関連する SNP を見つけ 農作物や家畜などの育種に役立てる ハイスループットな SNP ジェノタイピングには 従来はマイクロアレイが多く利用されていた 現在では コストの低下などにより 次世代シークエンサーを利用した DNA シークエンスによるジェノタイピング (Genotyping by Sequencing : GBS) も利用されるようになった OR SNP ジェノタイピング AGTACGAGCTCACTGCA AGTACGATCTCACTGCA AGTACGAACTCACTGCA 2

育種への応用 GBS データから育種に有用なマーカーを見つけるために 関連解析という手法が使われる 関連解析を行うことで 各サンプルのジェノタイプデータと表現型データを比較し 表現型のマーカーを見つけることができ 家畜や農作物の育種に応用できる グループ 1 表現型との関連が高いマーカー グループ 2 3

関連解析の種類 ゲノムワイド関連解析 (GWAS) ゲノムレベルのデータ量を扱う 基本的な関連解析の手法 Chi-squared test Fisher s exact test Armitage test Correlation/Trend test Odd ratios Logistic or Linear regression etc 線形混合モデル解析おもにサンプルの血縁関係による偏りを除外し 関連解析を行う場合に用いられる手法 育種分野で 近交系サンプルなどの解析に用いられる Mixed Model GWAS using a single locus (EMMAX) Multi-locus mixed model GWAS (MLMM) Genomic Best Linear Unbiased Predictors (GBLUP) 4

データ解析を行うには 次世代シークエンサーやマイクロアレイから作成された 大容量のジェノタイプデータや表現型データを扱うことができる これらデータを処理するための 強力な統計解析機能が搭載されている 一般的なモデル生物の他 多様な生物種のゲノムデータを扱うことができる それら生物種の 各種アノテーションデータを利用できる 5

SNP & Variation Suite (SVS) 1. 各メーカー (Affymetrix, Illumina など ) の SNP / CNV マイクロアレイデータ および次世代シークエンサー解析の VCF ファイルをインポート可能 2. Golden Helix 社のサーバーから 各種アノテーションデータを容易に取得可能 3. 変異解析以外に 様々なアプリケーションを搭載 ゲノムワイド関連解析 (GWAS) コピー数 (CNV) 解析 少数サンプルの NGS 変異解析 Genomic Prediction RNA-Seq 解析 多数サンプルの NGS 変異解析... など 4. 高度な統計学的計算アルゴリズムを多数搭載 カイ二乗検定 フィッシャー検定 トレンド検定 ハーディ ワインベルグ平衡の計算 ハプロタイプブロックの検出 線形混合モデル (mixed linear model) CNV 領域の検出および関連解析 DE-SeqによるRNA-Seq 発現解析 5. 有償モジュールの追加により 家系情報に基づいた解析が可能 線形 / ロジスティック回帰解析 LD( 連鎖不平衡 ) 解析 Runs of homozygosity (ROH) の検出 Genomic BLUP (GBLUP) による Genomic Prediction Collapsing Method によるレアバリアント関連解析 メタアナリシス... など 6. 様々なグラフ表示機能 6

SNP & Variation Suite (SVS) アノテーションデータ 表現型データ ジェノタイプデータ サンプルの表現型データとジェノタイプデータを統合表示し 各種データ解析を行う 7

SNP & Variation Suite (SVS) 遺伝統計学の様々な解析アルゴリズムを搭載 8

SNP & Variation Suite (SVS) 専用のデータ管理ツールを使用し 様々なデータソースのアノテーションデータを 容易にデータ解析に使用が可能 9

SNP & Variation Suite (SVS) 解析データの様々なグラフ表示が可能 10

SNP & Variation Suite (SVS) 対応生物種一覧 哺乳動物 Bos taurus( ウシ ) Canis familiaris( イヌ ) Capra hircus( ヤギ ) Cricetulus griseus( チャイニーズハムスター ) Equus caballus( ウマ ) Felis catus( ネコ ) Gallus gallus( ニワトリ ) Heterocephalus glaber( ハダカデバネズミ ) Homo sapiens( ヒト ) Macaca mulatta( アカゲザル ) Mus musculus( マウス ) Nomascus leucogenys( ホロジロテナガザル ) Ovis aries( ヒツジ ) Rattus norvegicus( ラット ) Sus scrofa( ブタ ) Vicugna pacos( アルパカ ) 植物 Arabidopsis thaliana( シロイヌナズナ ) Brassica rapa( アブラナ ) Capsicum annuum( トウガラシ ) Carica papaya( パパイア ) Citrullus lanatus( スイカ ) Eucalyptus grandis( ユーカリ ) Glycine max( ダイズ ) Gossypium raimondii( ワタ ) Oryza sativa( イネ ) Prunus persica( モモ ) Setaria italica( アワ ) Solanum lycopersicm( トマト ) Solanum tuberosum( ジャガイモ ) Sorghum bicolor( モロコシ ) Zea mays( トウモロコシ ) 魚類 Danio retio( ゼブラフィッシュ ) Medaka( メダカ ) Oncorhynchus mykiss( ニジマス ) その他 Anopheles gambiae( ハマダラカ ) Caenorhabditis elegans( 線虫 ) Drospphila melanogaster( ショウジョウバエ ) E.coli( 大腸菌 ) Leishmania infantum JPCM5( リーシュマニア寄生虫 ) Mycobacterium tuberculosis H37Rv( 結核菌 ) Plasmodium falciparum 3D7( マラリア ) Saccharomyces cerevisiae( 出芽酵母 ) Schizosaccharomyces pombe( 分裂酵母 ) Staphylococcus aureus( 黄色ブドウ球菌 ) 11

解析の流れ 使用するジェノタイプデータ : 生物種 : トウモロコシ (Zea mays) NGSサンプルデータ数 : 281 例 ファイルフォーマット :VCFファイル 変異数 : 3,096 個 データのインポート ジェノタイプデータファイル 表現型データファイルのインポート クオリティコントロール 各種クオリティデータに基づくフィルタリングと サンプル間相関データの作成 関連解析の実行 線形混合モデルを用いた ジェノタイプ関連解析の実行 ビジュアライゼーション マンハッタンプロットの表示 12

データのインポート データファイル 表現型データファイル (Excel ファイル Text ファイル ) 表現型データファイルには 疾患 / 正常などのグループ分類の他に 身長 体重などの連続値のデータも使用できる ジェノタイプデータファイルは バリアントコール用ツールなどで作成した VCF ファイルを使用する ジェノタイプデータファイル (VCF ファイル ) 13

データのインポート SVS へのインポート 表現型データファイル (Excel ファイル ) のインポート ジェノタイプデータファイル (VCF ファイル ) のインポート 14

データのインポート データの統合 表現型データシート ジェノタイプデータシート シートの結合 15

クオリティコントロール 評価項目 SNP & Variation Suite で使用可能なクオリティコントロール SNP Call Rateの検証 Hardy Weinberg 平衡 (HWE) の計算 Minor Allele Frequency (MAF) に基づくフィルタリング 連鎖不平衡を示すSNPの除去 集団の階層化 (Population stractification) 性別誤認 (Gender misidentification) の検出 メンデルエラーの検証 常染色体のヘテロ接合性 Principal Component Analysis(PCA) Identity by Descent (IBD) の計算 多次元解析による異常値検出 染色体異常スクリーニング... など 16

クオリティコントロール 処理の実行 以下項目で SNP のフィルタリングを実行 Call Rate 検出された SNP の割合 Number of allele 検出されたアレル数 Alternate allele frequency 変異アレルの頻度 Linkage disequilibrium (LD) SNP 間の連鎖不平衡 17

クオリティコントロール サンプル間の相関データ フィルタリングを行った SNP データを使用し GBLUP モデルでサンプル間の相関を計算 18

関連解析 サンプルの問題点 Inbred lines( 近交系 ) サンプルを解析に使用する場合は 関連解析実行時に 血縁関係によるバイアスを取り除く必要がある 今回使用する線形混合モデルでは サンプル間の相関データを使って 血縁関係にあるデータを補正することができる 血縁関係の他 民族の違いによるバイアスも補正が可能 19

関連解析 線形混合モデルの種類 Mixed Model GWAS using a single locus (EMMAX) ジェノタイプデータによるサンプル間の相関データを用いて 血縁関係の偏りを補正する 1 か所の SNP ごとに表現型との関連を計算する Multi-locus mixed model GWAS (MLMM) ジェノタイプデータによるサンプル間の相関データを用いて 血縁関係の偏りを補正する 複数か所の SNP をまとめて 表現型との関連を計算する Genomic Best Linear Unbiased Predictors (GBLUP) ジェノタイプデータによるサンプル間の相関データを用いて 血縁関係の偏りを補正する サンプルごとのランダム効果と SNP ごとのアレル代替効果を計算する 農学分野における 育種価の計算に用いられる 20

関連解析 解析の実行 最初に 検定に使用するサンプルの表現型データの種類を指定する 線形混合モデルのパラメータで クオリティコントロールで計算しておいた サンプル間相関データを選択する 21

関連解析 解析結果 計算が終了すると 使用した計算手法ごとに別のデータとして 各 SNP を評価した P-Value などのデータが出力される 22

ビジュアライゼーション GenomeBrowse Golden Helix 社より無償で提供されているゲノムブラウザー GenomeBrowse が SVS に組み込まれており BAM ファイルデータ VCF ファイルデータ 各種数値データやアノテーションデータなどを統合表示が可能 23

ビジュアライゼーション 表示データの選択 関連解析で計算したシートの 各 SNP ごとの -log10(p-value) を選択してプロットする 同時に 各種データベースのアノテーションデータや ユーザー作成データのプロットも可能 24

ビジュアライゼーション 表示結果 プロット上の各ポイントをクリックすると 画面左下に SNP の詳細情報が表示される 25

オプション解析 変異の分類 多数サンプルデータによる統計処理以外にも 各種データベースのアノテーションデータを利用した解析も可能 タンパク質アミノ酸配列の変化による 非同義変異の抽出や コモン SNP の除去などが可能 26

ソフトウェアの詳細は 以下の弊社 Web サイトをご覧ください SNP & Variation Suite (SVS): http://www.filgen.jp/product/bioscience21-software/goldenhelix/index.html お問い合わせ先 : フィルジェン株式会社 TEL 052-624-4388 (9:00~17:00) FAX 052-624-4389 E-mail: biosupport@filgen.jp 27