R で QTL 解析 以下で R への入力コマンドはゴシック赤字で表記しています # より右はコメントなの で入力の必要はありません 操作を再現する際 タイプミスに注意しましょう データの読み込み qtl ライブラリーを起動し ファイル IN-RIL.csv を読み込みます library(qtl)

Similar documents
します つまり 操 作 をなぞる 場 合 は 赤 字 部 分 をコピー&ペーストします 入 力 コマンドの 各 行 の# 以 降 右 はコメントで なくても 操 作 に 影 響 しません library(qtl) # qtl ライブラリーを 起 動 する testmap <- read.cross(

クローニングのための遺伝学

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

クローニングのための遺伝学

Microsoft Word - apstattext04.docx

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

< 染色体地図 : 細胞学的地図 > 組換え価を用いることで連鎖地図を書くことができる しかし この連鎖地図はあくまで仮想的なものであって 実際の染色体と比較すると遺伝子座の順序は一致するが 距離は一致しない そこで実際の染色体上での遺伝子の位置を示す細胞学的地図が作られた 図 : 連鎖地図と細胞学

WingneoINFINITY 公図自動結合 簡易マニュアル

パッケージのインストール Rには 複雑な解析を便利に行うためのパッケージが容易されています ( 世界中の研究者達が提供してくれる ) 今回は例として多重比較検定用のmultcomp パッケージをインストールしてみます ( 注意 ) 滋賀県立大学のようにプロキシ経由でインターネットに接続する環境で R

基礎統計

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - Stattext12.doc

分子系統解析における様々な問題について 田辺晶史

PowerPoint プレゼンテーション

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

OpRisk VaR3.2 Presentation

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

統計的データ解析

Microsoft PowerPoint - e-stat(OLS).pptx

データ科学2.pptx

日心TWS

Microsoft PowerPoint - sc7.ppt [互換モード]

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

数値計算法

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

円筒面で利用可能なARマーカ

ビジネス統計 統計基礎とエクセル分析 正誤表

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

立ち読みページ

情報工学概論

PrimerArray® Analysis Tool Ver.2.2

ANOVA

不偏推定量

様々なミクロ計量モデル†

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

EBNと疫学

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

C3 データ可視化とツール

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

データ解析

Microsoft Word - Stattext13.doc

読取革命Ver.15 かんたん操作ガイド

Medical3

講義「○○○○」

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Microsoft Word - å“Ÿåłžå¸°173.docx

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Microsoft Word - Stattext11.doc

解析センターを知っていただく キャンペーン

経済統計分析1 イントロダクション

SAP11_03

Medical3

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

10. 全体の流れ ( 参加者 ) < 参加者 > < 起案者 > 起案者にて日程調整の有無 あり Ⅰ. 起案者が参加者の日程調整をしたうえで 会議の予約を行う場合退院カンファレンスの判断 なし 1 カンファレンス内容を確認 回答 起案者より会議案内のメールを受信 院内スタッフの予定確認 カンファレ

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

66. ウシの有角 無角の遺伝 ( ア ) 遺伝的に異なる 個体間の交配をとくに交雑という したがって, 検定交雑 も正解 ( イ ) 優性形質である無角との検定交雑で, 表現型がすべて有角となることは大学入試生物では ありえない 問 独立の法則に従う遺伝子型 AaBb の個体の配偶子の遺伝子型は,

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

Microsoft Word - lec_student-chp3_1-representative

3.3 導入ポテンシャルの簡易シミュレーション シミュレーションの流れ導入ポテンシャルの簡易シミュレーションは 河川上の任意の水路 100m セグメント地点で取水し 導水管を任意の箇所に設定して 任意の放水地点に発電施設を設置して発電する場合の導入ポテンシャル値 ( 設備容量 ) 及び概

因子分析

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

上手くん α シリーズ移行手順 上手くん α シリーズ移行手順 上手くん α シリーズ移行手順 1 処理の流れ 1 2 古い PC で行う操作 2 3 新しい PC で行う操作 /09/10 第 2 版

Probit , Mixed logit

Microsoft Word - appendix_b

第 20 講遺伝 3 伴性遺伝遺伝子がX 染色体上にあるときの遺伝のこと 次代 ( 子供 ) の雄 雌の表現型の比が異なるとき その遺伝子はX 染色体上にあると判断できる (Y 染色体上にあるとき その形質は雄にしか現れないため これを限性遺伝という ) このとき X 染色体に存在する遺伝子を右肩に

TREND CA Ver.3 手順書

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

数値計算法

Microsoft Word - manual doc

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

やってみようINFINITY-写真管理 編-

Microsoft PowerPoint ppt

カイ二乗フィット検定、パラメータの誤差

PowerPoint プレゼンテーション

編集する ファイルを開く マイクロデータの設定を行うファイルまたはファイルを開きます 開かれたファイルは編集画面に表示されて ブラウザ表示した時のプレビューも同時に表示されます HTML ファイルの選択 編集する ファイルを開くためにメインメニューから ファイル 開く を選びます ファイル選択ダイア

410_道路規制図の作成

2 / 14 第 7 講データ処理 ブック ( ファイル ) を開く第 6 講で保存したブック internet.xlsx を開きましょう 1. [Office ボタン ] から [ 開く ] をクリックします 2. [ ファイルの場所 ] がデータを保存している場所になっていることを確

Android スマートフォンの使用 使用方法 1 SS-one コントローラ本体の電源を入れます 2 Andorid の [ 設定 ]->[WiFi] で SS-one コントローラ本体に接続します 3 SS1 アプリを起動します カメラ画面 操作前にキーロックを左にスライドし キーロックを解除し

ソフトウェア基礎 Ⅰ Report#2 提出日 : 2009 年 8 月 11 日 所属 : 工学部情報工学科 学籍番号 : K 氏名 : 當銘孔太

Cacoo - いいねタウン店舗管理画面マニュアル

The world leader in serving science OMNIC ユーザーライブラリベーシックマニュアル サーモフィッシャーサイエンティフィック株式会社


<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

PRONETA

Microsoft Word - 補論3.2

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

511_平面図の編集例

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

道路規制情報登録システム 平成 25 年 5 月 13 日 GIS 大縮尺空間データ官民共有化推進協議会 支援グループ

カルテダウンロード 操作マニュアル

第10章 OCR設定

1

<4D F736F F D E7382CC944D8AC28BAB91CE8DF4955D89BF B838B91808DEC B A B D8D A2E646F63>

次の病院 薬局欄は 氏名 欄に入力された値によって入力すべき値が変わります 太郎の行く病院と花子の行く病院が必ずしも同じではないからです このような違いを 設定 シートで定義しておきましょう 太郎の行く病院のリストを 太郎 花子の行く病院のリストを 花子 として 2 つのリストが定義されています こ

Transcription:

R で QTL 解析 以下で R への入力コマンドはゴシック赤字で表記しています # より右はコメントなの で入力の必要はありません 操作を再現する際 タイプミスに注意しましょう データの読み込み qtl ライブラリーを起動し ファイル IN-RIL.csv を読み込みます library(qtl) # ライブラリー起動 testmap <- read.cross("csvr", file="in-ril.csv", estimate.map=false)# データ読み込み testmap <- convert2riself(testmap) # RI self としてデータを処理する summary(testmap) # 交配タイプ 個体数 マーカー数 表現型数 を確認する 読み込んだデータを plot.rf 関数で確認します plot.rf(testmap, alternate.chrid=true) # マーカー間連鎖の確認 出力される図は 連鎖地図上に並べたマーカー間の連鎖の程度に応じて色分けされていて 赤色が連鎖 青色が独立であることを意味します 連鎖地図上の位置に問題がない場合 隣接するマーカーが連鎖するので図の対角線上のみが赤くなります イネの 12 種類の染色体は 上端および右端の 1~12 で示した区画に分かれて配置されています

読み込んだデータを plot 関数で確認します plot(testmap) # 欠損データ 連鎖地図 形質別ヒストグラムを表示 一般的な QTL 解析は 形質が正規分布に従う統計モデルを仮定しています 分布が大き くズレる場合は 外れ値の有無や 形質値データの精度 再現性に問題がないか確認します 欠損データの確認遺伝子型が判別できなかった欠損データを確認しておきます plot.missing(testmap) # 欠損データをプロットする

par(mfrow=c(1,2), las=1) plot(ntyped(testmap), ylab="no. typed markers", main="no. genotypes by individual") plot(ntyped(testmap, "mar"), ylab="no. typed individuals", main="no. genotypes by marker") 欠損データの多い 1 マーカーや個体は とりあえず解析から外します 必要に応じて ジェノタイピングし直すか近傍マーカーを作り直します データの削除は以下の通りです 2 例えばデータ数が 50 以上の個体のみを採用する場合 testmap <- subset(testmap, ind=(ntyped(testmap)>50)) 例えば個体数が 70 未満のマーカーを解析から除外する場合 nt.bymar <- ntyped(testmap, "mar") todrop <- names(nt.bymar[nt.bymar < 70]) testmap <- drop.markers(testmap, todrop) 遺伝子型情報のチェック分離比の歪んだマーカーを検出する 各マーカー遺伝子座の分離比が期待値から大きくずれる場合 3 遺伝子型の判別方法に問題 4 がある可能性が高い 期待比からのズレは geno.table 関数を使って調べることができ ボン フェローニ補正 5 した 5% 水準以下のマーカーは以下のように検出できる gt <- geno.table(testmap) gt[gt$p.value < 0.05/totmar(testmap),] 1 明確な基準はありませんが データの 20% 以上が欠損する場合は怪しいと考えましょう 2 入力ファイルを編集してもよいでしょう 3 F2 分離集団では 共優性マーカーの遺伝子型の分離が A:H:B=1:2:1 に 優性マーカーは A:C または B:D=1:3 に分離することが期待でされる 4 マーカーが単一遺伝子座由来でない場合や ホモ ヘテロの判別が難しく誤った遺伝子型を含んでいる場合などが考えられる 5 ボンフェローニ補正は χ 2 適合度検定による p 値に 調査した全マーカー数を掛ける

p 値が極端に小さいマーカーは 分離比が理論値よりも大きく歪 んでおり 誤判定している可能性があります それらのマーカーは 再度ジェノタイピングする または代替マーカーを使用するなど対 処する必要があるでしょう ただし 例データのように 同一染色 体上の隣接するマーカーごと歪む場合 ( 染色体 4 の RM307, RM261, RM185) や 分離比が歪む原因が遺伝的なものである場合はそのま ま使用すべきでしょう 例えばボンフェローニ補正前の p 値が 1 10-10 以下の歪みの激し いマーカーを削除する場合には以下のようにします todrop <- rownames(gt[gt$p.value < 1e-10,]) testmap <- drop.markers(testmap, todrop) 連鎖地図の検定 プロット plot.map() 関数で 引数に show.marker.names=true を用いると マーカー名付きの 連鎖地図でギャップ ( 連鎖地図のマーカー密度が低い箇所 ) を表示できます plot.map(testmap, show.marker.names=true) single-qtl スキャン 連鎖地図の隣接マーカー間 ( マーカー インターバル ) に着目し QTL を検定します LOD スコアが高いほど そのインターバル間に QTL が存在する確率が高いと考えます

testmap <- calc.genoprob(testmap, step=1) #1cM 毎に QTL 検索 #interval mapping(im) を行う (Haley-Knott 回帰に基づく method="hk") #1 番目の形質を解析する場合に pheno.col=1 とする 2 番目の形質なら pheno.col=2 out.simhk <- scanone(testmap, pheno.col=1, method="hk") QTL の有意水準 (pval) は 対象形質の分布の形 ( 遺伝様式を反映 ) や連鎖地図の大きさによって変動し 各形質の並替え検定によって推定するのが一般的です QTL 解析のような多重比較検定では マーカー毎に有意確率を決めると連鎖地図全体の有意確率が不当に高くなってしまう ( 本当は有意でない QTL を検出してしまう ) ため 地図全体の有意確率を適切に制御する必要があります 並べ替え検定では形質値の無作為な並べ替えを 1000 回以上行い それぞれ最も有意確率が低くなる値を集めた分布の α% 点の LOD スコアを水準 α の閾値とみなします # 計算時間の都合上 実習の中では 100 回のシミュレート (n.perm=100) とする # もしくは マルチタスク機能が使える PC の場合は (n.perm=1000,n.cluster=2~) とする operms <- scanone (testmap, n.perm=100, method="hk") #operms <- scanone (testmap, n.perm=1000, method="hk",n.cluster=2) summary(out.simhk, perms=operms, alpha=0.05, pvalues=true) #composite interval mapping(cim) を行う out.cimhk <- cim(testmap, n.marcovar=5, pheno.col=1, method="hk") # 並べ替え検定を行う,IM と同じ取扱い operm <- cim(testmap,n.perm=100,n.marcovar=5,method="hk") #operm <- cim(testmap,n.perm=1000,n.marcovar=5,method="hk",n.cluster=2) #5% 水準で有意な QTL ピークを書き出す summary(out.cimhk, perms=operm, alpha=0.05, pvalues=true) #IM と CIM の結果を表示する plot(out.simhk, out.cimhk, col=c("blue", "red"),show.marker.names=true)

有意になったマーカー間の相互作用効果をプロットしてみます インターバルマッピングで有意になった 2 地点 ( 染色体 3 の 147cM と染色体 4 の 22cM) の遺伝子型別に表現型値をプロットし 線分が平行でないとき交互作用があるとみなします effectplot(testmap, mname1="3@147", mname2="4@22") # 交互作用 Two-QTL スキャン scantwo 関数を用いると 一度に2 領域のスキャンを行い インターバル間の相互作用を探索することができます 以下のモデルに対してそれぞれ対数尤度 (LOD) を計算し その差を LODスコアとして検定に用います Fullモデル : y q q q 1 1 2 2 3 1 q2 1q1 2q2 3 q1 q2 q 1 1 Addモデル : y Full-Addモデル : y Oneモデル : y Nullモデル : y testmap <- calc.genoprob(testmap, step=1) #1cM 毎に QTL を検索する out2.hk <- scantwo(testmap, method="hk") # two QTL のスキャン summary(out2.hk) # 染色体対毎の最大 LOD ピークを表示

( 注 )lod.full は Full モデル lod.fv1 は Full モデル -One モデル lod.int は Full モデル - Add モデル lod.add は Add モデルの lod.av1 は Add モデル -One モデルの LOD スコア 上三角に相互作用モデル (Full-Add) 下三角は Full モデルの LOD をプロットするには 以下のコマンドを使います カラーマップが赤いほど LOD スコアが高く 連鎖地図上の位 置を表す横軸の点と縦軸の点 plot(out2.hk, zscale=true) # 下三角を Full-One( 条件付き相互作用モデル ) 上三角を Add-One( 条件付き add モデル ) に plot(out2.hk, lower="fv1", upper="av1", zscale=true)

# 並べ替え検定で有意水準を推定する operm2 <- scantwo(testmap, method="hk", n.perm=10) #operm2 <- scantwo(testmap, method="hk", n.perm=1000,n.cluster=2) summary(out2.hk, perms=operm2, alpha=0.05, pvalues=true)