機能ゲノム学(第6回)

Size: px
Start display at page:

Download "機能ゲノム学(第6回)"

Transcription

1 トランスクリプトーム データの解析戦略とそ の周辺 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) hp://.u.a.u-okyo.ac.jp/~kadoa/ kadoa@u.a.u-okyo.ac.jp

2 オーム (Ome) 研究 ome : 総体 DN 遺伝子 (Gene) + ome Genome ゲノム研究 : ヒトのもつ遺伝子情報の総体を研究 RN 転写 (Transcrpon) + ome Transcrpome 転写 : 遺伝子 DN の情報を RN に写すこと タンパク質 翻訳 (Translaon) + ome Translaome 翻訳 : 転写された RN 情報をもとにタンパクを作ること ( タンパク質 (Proen) + ome Proeome)

3 転写レベルの情報量は豊富 DN 転写 RN 翻訳 タンパク質 全ゲノムショットガン法 DN マイクロアレイ 二次元電気泳動法 Translaome Transcrpome Genome ( 遺伝子数 : 数万種類 ) 3

4 トランスクリプトームとは ある特定の状態の組織や細胞中に存在する全 mrn( ないしは一次転写産物 ranscrps) の総体 様々なトランスクリプトーム解析技術 マイクロアレイ cdn マイクロアレイ ffymerx GeneChp など 配列決定に基づく方法 EST SGE など 電気泳動に基づく方法 Dfferenal Dsplay FLP など 調べたい組織でどの遺伝子がどの程度発現しているのかを一度に観察 4

5 内容 様々なトランスクリプトーム解析技術 概要 特徴 長所短所 全て共通の 遺伝子発現行列 形式で取り扱いが可能 遺伝子発現行列 データ解析戦略 発現変動遺伝子の同定 Gene Se Enrchmen nalyss クラスタリング 分類 ネットワーク推定 5

6 トランスクリプトーム解析技術 マイクロアレイ 配列既知遺伝子を搭載した チップ 上に 調べたいサンプルから抽出 合成した蛍光標識済み cdn をハイブリダイゼーションさせることによって 得られる蛍光シグナル強度を mrn の発現量として観測 比較する条件間で発現の異なる遺伝子の同定などの目的に利用される ゲノム配列決定済みの生物種を対象 6

7 得られる遺伝子発現データのイメージ 二色法の場合 一色法の場合 目的試料中の遺伝子 4 の発現レベルは対照試料に比べて - 倍高い 目的試料中で遺伝子 3 は沢山発現している 7

8 遺伝子発現行列 二群間比較様々な組織 ( 条件 ) 時系列データ x x x x x x x x x x x x x 3 x 3 x 4 x 4 x x x x x 3 x 3 x 4 x 4 x x x x x x x 3 x 4 x x x 3 x 4 xn xn xn xn x n x n x n3 x n4 x n x n x n3 x n4 発現変動遺伝子の同定 クラスタリング Gene Onology 解析 パスウェイ解析 8

9 トランスクリプトーム解析技術 配列決定に基づく方法 調べたい目的サンプルから抽出 合成した cdn の一部を sequencer で読みまくる その配列をもつ転写物が沢山発現しているほど その配列が多数読まれることを利用 EST(Expressed Sequence Tag) 3 or 5 側から数百塩基程度の配列を読んだもの SGE(Seral nalyss of Gene Expresson) 特定の位置から数十塩基の配列 (SGE タグ ) を分離し 他の転写物由来のタグを sequencer で読める程度まで連結して配列決定 ゲノム配列未知のサンプルを対象 新規遺伝子の発見が原理的に可能 9

10 得られる発現データのイメージ TTCGGTCG という配列が 5 回 sequence された 0

11 トランスクリプトーム解析技術 3 電気泳動に基づく方法 目的サンプルから得られた転写物由来 DN 配列 ( 断片 ) を PCR 増幅して電気泳動にかける サンプルの状態によって得られる電気泳動パターンが異なる ( フィンガープリント ) 得られるバンドの濃さ ( シグナル強度の高さ ) が転写物の発現レベルに ( 大まかに ) 対応 ゲノム配列未知のサンプルを対象 新規遺伝子の発見が原理的に可能

12 得られる発現データのイメージ サンプル サンプル サンプル サンプル 電気泳動の波形データ 460 bp の長さの転写物はサンプル でのみ発現している サンプル サンプル サンプル バンドの濃淡をシグナル強度で表すと サンプル 配列断片長 (bp)

13 長所 短所 解析対象の広さ 目的生物種の DN マイクロアレイが用意されていないものは解析不可能 例 ) バクテリア 柿 桃などのマイクロアレイはない マイクロアレイがあったとしても アレイ上に搭載されていない ( 未知 ) 遺伝子の発現は観測不可能 3

14 長所 短所 アノテーション情報 配列決定 ( ) 目的の配列情報をもとに las 検索などを行う必要性あり 配列長が短いため 候補遺伝子群の中からの特定が難しい 4

15 サンプル サンプル 長所 短所 アノテーション情報 電気泳動 ( ) 目的遺伝子の塩基配列情報を得る作業が ( 配列決定に基づく方法に比べて ) 余分に必要 バンドの切り出し 抽出 PCR 増幅 クローニング ( 塩基配列決定 ) 得られた塩基配列を las 検索 5

16 長所 短所 データ解析の簡便さ 配列決定 ( ) Sequence コストがかかるため それほど多くの sequence ができるわけではない 統計的なデータ解析が難しい 6

17 長所 短所 データ解析の簡便さ 電気泳動 ( ) ピークアラインメント ( 同一遺伝子の認識 ) が難しい 7

18 他のトランスクリプトーム解析技術 改良に向けた取り組み : マイクロアレイ 短所 : マイクロアレイがあったとしても アレイ上に搭載されていない ( 未知 ) 遺伝子の発現は観測不可能 タイリングアレイの開発により 未知遺伝子の発現も検出可能に タンパク質をコードする遺伝子 の解析から ゲノム全体 の発現解析へ 8

19 様々なトランスクリプトーム解析技術 タイリングアレイによる具体的な成果 ヒト 番染色体の解析により 従来よりはるかに多くの転写物が存在することを確認 (Kapranov e al. Scence 00) シロイヌナズナの解析により 既知の約 7000 遺伝子領域以外に約 500 の領域で発現している新たな遺伝子構造を発見 (Toyoda e al. Plan J. 005) 次期ヒトゲノム計画 (ENCODE 計画 ) でも採用され ゲノム中の大部分の塩基が タンパク質をコードしない転写産物や重複転写産物を含む 一次転写産物になることが示唆 ( The ENCODE Projec Consorum Naure 007) 9

20 様々なトランスクリプトーム解析技術 改良に向けた取り組み : 配列決定 短所 : Sequence コストがかかるため それほど多くの sequence ができるわけではない そのため 統計的なデータ解析が難しい 新型 ( 次世代 ) シーケンサーの開発によりコストを大幅に削減可能に マイクロアレイ 配列決定 マイクロアレイ 配列決定 現在 近未来 0

21 新型 ( 次世代 ) シーケンサー パンダ ( 大熊猫 ) ゲノム解読 (008/0) ヒトゲノム解読に 0 年 半年 猫よりも犬 熊に近い動物 アジア人 ( 中国人 ) 一個体の全ゲノム配列決定 ( 008//6 Naure) 36 倍のカバー率 個人ゲノムとしては J.D. Wason と J.C. Vener に次いで 3 人目 国際プロジェクト 000 人ゲノム計画 ( 人 人の遺伝情報の違いを詳細に調査 ) 国際癌ゲノムプロジェクト 感染症の同定

22 トランスクリプトーム解析例 出芽酵母のトランスクリプトームの全体像 Nagalakshm e al. Scence poly RN のトランスクリプトームデータ (RN-seq) Illumna 社の平均 35bp の塩基配列 公共遺伝子発現データベース (GEO) に登録済 GSE09 新型 ( 次世代 ) シーケンサー

23 新型 ( 次世代 ) シーケンサー トランスクリプトームデータ解析戦略 ゲノム配列へのマッピング ゲノム配列 新規転写物の同定 Unranslaed regon (UTR) の同定 予測されていたイントロンの確認 選択的開始コドンの同定 ec... GEO ID: GSM SRR :7::446:60 lengh=33 :7::883:74 lengh=33 TTCTTTTTTGGTTTT +SRR :7::883:74 lengh=33 :7::568:594 lengh=33 TCGGGGCTCGTTGCCGTCTTCTGCTTTC +SRR :7::568:594 lengh=33 :7::845:77 lengh=33 TTTTTTTGTGCGCCTTGGTTT +SRR :7::845:77 lengh=33 :7::303:68 lengh=33 TCTTGCCCTCGTGCTGGCCTT... 大量の短い配列 (shor read) をいかに正しく高速にゲノム配列にマップするか? 3

24 新型 ( 次世代 ) シーケンサー トランスクリプトームデータ解析戦略 大量の短い配列 を 一つのゲノム配列 にマップするための専用のアルゴリズム開発の必要性 LST(lschul e al. 997) などは非現実的 単一のクエリ配列 を 多数の配列データ に問い合わせることを想定 LT(Ken 00) なども非現実的 大量のそこそこ長い配列 を 一つのゲノム配列 にマップすることを想定 新型シーケンサーデータ解析専用アルゴリズム PaMaN (Prufer e al. onformacs 008) RMP (Smh e al. MC onformacs 008) MQ (L e al. Genome Res. 008) SeqMap (Jang and Wong onformacs 008) SOP (L e al. onformacs 008) PSS (Campagna e al. onformacs 009) SOP (L e al. onformacs 009) 4

25 マップできた read 数 計算時間 Campagna e al. onformacs 009 どのアルゴリズムを採用するか? PSS(P) vs. SOP(S) PSS のほうがより多くマッピング可能 PSS のほうが高速 日進月歩 5

26 解析技術 ( 実験側 ) も日進月歩 現在のマイクロアレイや市販の新型シーケンサーは 逆転写酵素を用いた cdn 合成などいくつかのステップを経る必要があるためバイアスが入り込む恐れがあった RN を直接配列決定する方法の開発 (009 年 0 月 ) Ozsolak e al. Naure RN 分子 個の塩基配列を (cdn 合成などのステップを挟まずに ) 直接決定 今後のスケールアップにより バイアスのないハイスループットトランスクリプトーム解析法になりうると期待 6

27 様々なトランスクリプトーム解析技術 改良に向けた取り組み : 電気泳動 短所 : ピークアラインメント ( 同一遺伝子の認識 ) が難しい 遺伝子発現行列 C D E F G H I J K L M N H I 実験技術の開発も重要だがバイオインフォマティクス ( 解析手法の開発 ) も重要 7

28 Kadoa e al. MC onformacs 005 Kadoa e al. M 007 様々なトランスクリプトーム解析技術 バイオインフォマティクス技術の適用によりアラインメント精度の大幅な向上を達成 遺伝子発現行列 C D E F G H I J K L マイクロアレイ解析用に開発された手法が電気泳動波形データ解析にも利用可能 8

29 Ish e al. J. Mcrobol. Mehods 009 Cluserng-based peak algnmen 計算例 9

30 全てのトランスクリプトームデータは 遺伝子発現行列 の形式に変換可能 電気泳動波形データ 新型シーケンサーデータ 刺激前 ゲノム配列 遺伝子発現行列 h 後 4h 後 ゲノム配列 ゲノム配列 30

31 様々な遺伝子発現行列 二群間比較様々な組織 ( 条件 ) 時系列データ x x x x x x x x x x x x x 3 x 3 x 4 x 4 x x x x x 3 x 3 x 4 x 4 x x x x x x x 3 x 4 x x x 3 x 4 xn xn xn xn x n x n x n3 x n4 x n x n x n3 x n4 発現変動遺伝子の同定 クラスタリング Gene Onology 解析 パスウェイ解析 3

32 Golub e al. Scence 999 二群間比較解析 例 ) 急性白血病 群 : リンパ性 (7 サンプル ) 群 : 骨髄性 (サンプル) 白血病のタイプで発現の異なる遺伝子群を同定 3

33 Golub e al. Scence 999 参考資料 二群間比較解析戦略 二群間の平均の差が大きく 群内のばらつきが小さい 遺伝子 を抽出 a sgnal-o-nose(sn) 統計量 R( ) U U 二群間の平均の差 群内のばらつき 群内のばらつき 対数変換 (log 変換 ) 後のデータ 標本平均 標本分散 不偏分散 j R() R() R(3) S U n n j n n j n ( j n 6 n 5 n n 統計量の絶対値が大きい 候補発現変動遺伝子 n j n ( j ) ) 33

34 参考資料 二群間比較解析戦略 検定 ( 不等分散を仮定 ) の統計量 R( ) U n U n 対数変換 (log 変換 ) 後のデータ 二群間の平均の差ばらつき R() R() R(3) ( U U ) ( n ( U ) 統計量の絶対値が大きい 候補発現変動遺伝子 3 検定統計量 は 自由度 ν ( にゅー ) の 分布に従う 0.8 / n n / / / U n / n ) ( n 5.7 / / / 5 ) 34

35 Kadoa K Naka Y Shmzu K M. 3:8 008 参考資料 二群間比較解析戦略 WD:log 比を基本としつつ 全体的にシグナル強度の高い遺伝子が上位にくるように重みをかけた統計量 unlogged daa log -ransformed daa verage Dfference (D) 統計量 D xを (0~) の範囲に規格化 x mn( x) max( x) mn( x) 平均シグナル強度 x / WD 統計量 WD D D D gene6 より (6 7) / ( ) / x x gene6 (6 7) / ( ) / 3 / 4.08 / より 統計量の絶対値が大きい 候補発現変動遺伝子 x mn( x) より max( x) mn( x) gene

36 二群間比較解析 ( 様々な検出法 ) 倍率変化 (Fold change; FC) に基づくランキング法 -fold 3-fold (FC) The lm fold change model (Much e al. MC onformacs 00) Rank produc (RP; relng e al. FES Le. 004) WD (Kadoa e al. lgorhm. Mol. ol. 008) - 統計量に基づくランキング法 a sgnal-o-nose sasc (Golub e al. Scence 999) Suden s (or Welch) -es SM (samt; Tusher e al. PNS 00) Samroc (roberg P. Genome ol. 003) a moderaed sasc (Smyh GK. Sa. ppl. Gene. Mol. ol. 004) Inensy-based moderaed sasc (IMT; Saror e al. MC onformacs 006) Shrnkage sasc (Opgen-Rhen and Srmmer Sa. ppl. Gene. Mol. ol. 007) その他 Probably of Posve LogRao (PPLR; Lu e al. onformacs 006) FCPC (Qn e al. onformacs 008) 個々の遺伝子の発現変動の度合いを調べる研究 36

37 二群間比較解析戦略 発現変動遺伝子 ( マーカー遺伝子 ) の同定 個々の遺伝子について統計量を算出し ランキング 手法選択のガイドライン (Kadoa e al. M 009) 感度 特異度重視の場合 再現性重視の場合 Gene Se Enrchmen nalyss (GSE) アノテーション情報が豊富な生物種用の解析手段 同じセットに属する遺伝子をひとまとめにして解析 例 : 酸化的リン酸化に関係する遺伝子セット (KEGG: hsa0090) 例 : 脂肪酸 β 酸化に関係する遺伝子セット ( GO: ) 比較する二群間でその遺伝子セットが動いたかどうかを評価 帰無仮説 : 動いてない 対立仮説 : 動いた 沢山の遺伝子セットについて解析を行い 動いた遺伝子セットを列挙 posonal gene ses pahay gene ses mof gene ses 様々な視点での解析が可能 GO gene ses ec... 37

38 様々な遺伝子セットは MSgD からゲット 例 :KEGG Pahay 遺伝子セット Pahay ID Name Gene symbols 行につき セット 38

39 様々な GSE 系の解析手法 GSE (Subramanan e al. PNS 005) PGE (Km and Volsky MC onformacs 005) Hoellng s T -es (Kong e al. onformacs 006) GS (Efron and Tbshran nn. ppl. Sa. 007) GeneTral (ackes e al. NR 007) SM-GS (Dnu e al. MC onformacs 007) GSE-P (Subramanan e al. onformacs 007) GlobalNCOV (Hummell e al. onformacs 008) 39

40 Km and Volsky MC onformacs 005 PGE 法 Paramerc nalyss of Gene se Enrchmen の略. 各遺伝子 について対数変換後のデータのverage Dfference (D ) を計算 D (.... D の平均 μ と標準偏差 σ を計算 3. 興味ある遺伝子セット ( 例 := に相当する計 m 個の遺伝子 ) のDの平均 S m を計算 S m ( D D D D...) / m 4. Z スコアを計算 Z ( Sm ) m / Z スコアの絶対値が大きい遺伝子セットほど二群間でより発現変動している と解釈 a) 40

41 a genes GSE 以前の解析手段 例 : 酸化的リン酸化関連遺伝子セット. verage Dfferenceのような統計量を各遺伝子について算出. 上位 x 個を抽出し 酸化的リン酸化関連遺伝子群のバックグラウンド (b/a) に対する濃縮度合い (c/x) を評価 群 群 群 群 酸化的リン酸化関連遺伝子 ( チップ中に b 個 ) の位置 帰無仮説 : チップ中の全遺伝子数 (a) に対する酸化的リン酸化関連遺伝子数 (b) の割合 (b/a) と 酸化的リン酸化関連遺伝子数 (b) に対する上位 x 個の中に占める酸化的リン酸化関連遺伝子数 (c) の割合 (c/x) は等しい 4

42 a genes GSE 以前の解析手段の問題点 上位 x 個の x 次第で結果が変わる 群 群 群 群 酸化的リン酸化関連遺伝子 ( チップ中に b 個 ) の位置 4

43 a genes GSE 以前の解析手段の問題点 下図のように 全体としては酸化的リン酸化関連遺伝子セットが有意差があるといえるような場合でも 上位 x 個の中に一つも含まれないので有意差があるといえなくなる 現実の解析では酸化的リン酸化関連遺伝子セットが動いていることを見落とす 群 群 群 群 酸化的リン酸化関連遺伝子 ( チップ中に b 個 ) の位置 43

44 様々な GSE 系手法 なぜ次々と提案されるのか? ns.: 発現変動遺伝子のランキング法 (gene-level sascs) はいくらでもある PGE:verage Dfference (D) 倍率変化そのもの GSE:SN 統計量など その他 :Rank producs WD SM など ns.: 興味ある遺伝子セットの偏り度合い ( 濃縮度 ) を見積もる統計量 (gene se sascs) はいくらでもある PGE:Z 検定 GSE:Enrchmen Score その他 : 平均 % 順位 UC medan など ns.3: 有意性を評価する手段もいくつか考えられる sample label permuaon gene resamplng 極論 : 論文になっていない組合せを 新規手法だ! とすることも可能... 44

45 ckermann and Srmmer MC onformacs 009 手法選択のガイドラインはない ( に等しい ) どの遺伝子セットが動いている いないという正解情報 ( 地上の真実 ) を知るすべがない 論文でありがちなプレゼンテーション 既知の遺伝子セットはちゃんと上位にあった 我々はさらに他に動いている遺伝子セットを見つけた ( 感度の高さをアピール ) 感度の高さ という点については正しいのかもしれないが 特異度 は低いのかも... ( 本当は動いていない遺伝子セットまで動いていると判断してしまうこと ) シミュレーションで本当は動いていないデータセットを作成することはできるが その結果と現実の結果には相当のギャップがある 45

46 GSE 系手法を使えるのはごく一部の生物種 アノテーション情報が豊富な生物種は Gene Onology やパスウェイの情報が豊富 多くの遺伝子セットを用意できる GSE 系手法を適用可能 それ以外の生物種は まずは様々な発現変動遺伝子をひたすら同定しまくるなどして地道にアノテーション情報を増やしていく以外にない ( のではないだろうか ) 46

47 クラスタリング ( 教師なし学習 ) サンプルの属性情報 ( 癌 or 正常など ) を使わずに 発現情報のみを用いて発現パターンの類似した遺伝子 ( またはサンプル ) をクラスター ( 群 ) にしていく手法 (Unsupervsed learnng 二群間比較多サンプル時系列解析 x x x x x x x x x x x x x 3 x 3 x 4 x 4 x x x x x 3 x 3 x 4 x 4 x x x x x x x 3 x 4 x x x 3 x 4 009/08/9 xn xn 基礎生物学研究所 xn xn x n x n x n3 x n4 x n x n x n3 x n

48 Esen e al. PNS 998 クラスタリング ( 教師なし学習 ) 例 : 遺伝子間クラスタリング Tme 似た機能をもつものは同じクラスターに属すことを確認 48

49 ner e al. Naure 000 クラスタリング ( 教師なし学習 ) 例 : サンプル間クラスタリング 悪性度の高い癌のサブタイプを発見 49

50 クラスタリング ( 教師なし学習 ) 階層的クラスタリング 発現パターンの類似した遺伝子を集めて系統樹を作成 非階層的クラスタリング K-means クラスタリング K 個のクラスターに分割 (K の数は主観的に決定 ) する と予め指定し 各クラスター内の遺伝子 ( サンプル ) 間の距離の総和が最小になるような K 個のクラスターを作成 自己組織化マップ (SOM) 主成分分析 (PC) 50

51 距離 ( 類似度 ) の定義 遺伝子 (or サンプル )x と y の発現パターンの距離 D ) ( ) ( ) ( ) )( ( xy xy y x y x r y n x n y x n r n n n 相関係数 0 r r r y x y x y x との発現パターンがほぼ正反対との発現パターンがばらばらとの発現パターンが酷似 ) (0 D r 距離 D ) ( D r D r D r 5

52 階層的クラスタリング. 遺伝子間距離を計算 例 :4 遺伝子の場合 距離 D r (0 D ) 相関係数 r 相関係数 r 相関係数 r 距離 D 距離 D 距離 D r 距離 D 3 4 (0 D ) ( 0.0) 0.50 ( 0.78)

53 階層的クラスタリング. 距離行列を作成 距離 D 距離 D 距離 D ( 0.0) 0.50 ( 0.78) 0.89 距離行列 3 4 イメージ 53

54 階層的クラスタリング 3. 樹形図を作成 距離行列 3 4 距離 D D 34 二つのクラスター間の距離?!

55 階層的クラスタリング 3. 樹形図を作成 平均連結法の場合 D ( D D D 4) / D ( ) / 単連結法の場合 mn( D 3 D 4 D 3 D 4) 0.47 完全連結法の場合 max( D 3 D 4 D 3 D 4)

56 Naka e al. 008 階層的クラスタリング例 肝臓 (LIV) 白色脂肪 (WT) 褐色脂肪 (T) 最適なクラスター数 K は? K= K=3 K=5 K= K= K=4 K=

57 en-hur e al. PS 00 最適なクラスター数を見積もる方法 様々な K について ( 例えば K=) 全サンプル (n) のクラスタリング結果を K 個に分割した結果とサブサンプル ( 例えば n*0.7) のクラスタリング結果を K 個に分割した結果の類似度を計算 全サンプルの結果 回目 00 回の結果全て LIV とそれ以外を分割できた場合 回目 サブサンプリングデータでクラスタリング を例えば 00 回繰り返し 00 回目 57

58 en-hur e al. PS 00 最適なクラスター数を見積もる方法 K の値をいくつか試して ( 例では ~9) 最適な K の値を同定 この場合は K= 3 が最適なクラスター数 58

59 分類 ( 教師あり学習 ) 未知サンプルを分類するための様々な方法 K-Neares Neghbor (K-NN; K- 最近傍法 ) Suppor Vecor Machne (SVM) Neural Neork (NN) Naïve ayesan (N) 冬学期開講科目 : ゲノム知識情報処理論 Mul-Layer Percepron (MLP; 多層パーセプトロン ) Weghed Vong (WV; 重みつき多数決法 ) Decson Tree ec 59

60 K-Neares Neghbor (K-NN) 法 未知サンプル X からの距離がもっとも近い K 個のサンプルのうち 所属するクラスが最も多いクラスに分類 K= ササニシキ コシヒカリ X X は 群だと分類 ( コシヒカリ ) K=3 ササニシキ コシヒカリ X X は 群だと分類 ( ササニシキ ) 60

61 発現レベル 遺伝子の発現制御ネットワーク推定 時系列データ 遺伝子 D の発現を抑制し 他の遺伝子の挙動を観察 C D D ネットワーク推定 C 6

62 発現レベル 参考資料 遺伝子の発現制御ネットワーク推定 時系列データ 遺伝子発現行列の作成 例 ) 0 に対する log 比などで表現 C D

63 参考資料 遺伝子の発現制御ネットワーク推定 時系列データ ( 基本的な ) 線形モデル法 で解いてみる 仮定 : 遺伝子 x k の時間 における発現レベル x k は 時間 - における他のすべての遺伝子発現レベルの線形結合で表される x k N x k k : x の発現レベルが x k の発現レベルに及ぼす影響を示す重み係数 63

64 ( 基本的な ) 線形モデル法 で解く 行列で表すと以下のような感じになる D D D C D D D C C C C C D C D C D C D C 遺伝子発現行列 ( 時系列データ ) 目的 :4 個の未知の k を決める重み行列 相互作用行列 64 参考資料

65 ( 基本的な ) 線形モデル法 で解く 計算結果 N k k x x D D D C D D D C C C C C D C D C D C D C 遺伝子発現行列 ( 時系列データ ) 遺伝子間相互作用行列 C D 65 参考資料

66 ( 基本的な ) 線形モデル法 で解く 目的 : 重み係数 k を解として得る 例 ) 遺伝子 の発現調節を支配している方程式を解く N k k x x D C D C 3 D C D C D C D C D C D C 66 参考資料

67 参考資料 ( 基本的な ) 線形モデル法 で解く 目的 : 重み係数 k を解として得る 例 ) 遺伝子 の発現調節を支配している方程式を解く ( ) (0) C () D ( ) ( ) (0) C (0) D ( ) (0) (0) C (0) D ( ) C D (0) (0) C (0) D (0) D は をプラスに制御 67

68 参考資料 問題点 例題の時系列データ 4 遺伝子 5 me pons ネットワークが解けた! 一般論 N 個の遺伝子間相互作用の可能性は N 通り存在する N 個の未知のパラメータ ( 重み係数 k ) を一意に求めるためには 最低でも N 個の線形独立な方程式が必要 ( 例題のように ) 時点数 > 遺伝子数であれば 68

69 問題点 次元の問題 ( 劣決定性の問題 ) 理想 : 遺伝子数 時点数 現実 : 遺伝子数 >> 時点数 例 : 数万遺伝子 ( せいぜい ) 数十時点 のデータ N 個あるパラメータを解くための方程式が足りない! ( 解が多数得られてしまう ) 時間解像度の問題 相互作用イベントの起こる順番を明確に分離できる時点間隔となっているか? 3 69

70 まとめ 様々なトランスクリプトーム解析技術 概要 特徴 長所短所 全て共通の 遺伝子発現行列 形式で取り扱いが可能 遺伝子発現行列 データ解析戦略 発現変動遺伝子の同定 ( 二群間 ) Gene Se Enrchmen nalyss クラスタリング 分類 ネットワーク推定 70

71 マイクロアレイ解析に特化したセミナーは /0 or /4 に開催予定 7

72 アグリバイオインフォマティクス教育研究 プログラムのフォーラム活動について 本プログラムでは 研究課題ごとにフォーラムを形成し セミナー シンポジウムの開催から 企業との共同研究 学位論文の指導などを行い 当該課題の研究 教育の活性化を図ります フォーラムのメンバーは 本研究科の教員のほか 他大学 企業 試験研究機関の方々から構成されます これらのメンバーから 農学生命情報科学実習 II の受講を通して学位論文の研究におけるバイオインフォマティクスに関係した研究の指導を受けることができます バイオインフォマティクスを利用した農学生命科学の研究 あるいは バイオインフォマティクスそのものの研究を行って学位を取得した人には 修了認定証 を発行します 修了の認定は 各専攻の学位審査とは別にフォーラムのメンバーが審査会を開いて行います 研究指導は 研究室の指導教員との合意に基づいて行いますので 希望する人は 指導教員と相談の上 アグリバイオインフォマティクス教育研究プログラム事務局までご連絡下さい 現在のところ 以下の 4 つのフォーラムが形成されています : 微生物インフォマティクス フォーラム 基盤バイオインフォマティクス フォーラム アグリ / バイオ センシングと空間情報学フォーラム 食品インフォマティクス フォーラム 7

機能ゲノム学(第6回)

機能ゲノム学(第6回) トランスクリプトーム 解析手法の開発 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス人材養成ユニット門田幸二 2008/12/08 トランスクリプトーム (transcrptome) とは 細胞中に存在する転写物全体 (transcrpt + ome) トランスクリプトーム解析技術 DNA マイクロアレイ Affymetrx GeneChp, cdna アレイ, 電気泳動に基づく方法

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) トランスクリプトーム解析の今昔 なぜマイクロアレイ? なぜRNA-Seq? 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 Contents トランスクリプトーム解析の概要 各手法の長所 短所 マイクロアレイ

More information

バイオインフォマティクスⅠ

バイオインフォマティクスⅠ バイオインフォマティクス ( 第 5 回 ) 慶應義塾大学生命情報学科 榊原康文 多重アライメントの解 0 2 3 4 5 6 7 j Q T S Y T R Y Q T - Y T R K 0 0-9 -20-44 -52-63 -72-90 Q -6 2 0-6 -4-25 -34-52 2 S -32 5 30 4 6-5 -4-32 3 Y -48-4 2 38 27 8 0 4 P -64-27

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) RNA-Seqデータ解析における正規化法の選択 :RPKM 値でサンプル間比較は危険?! 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 よりよい正規化法とは? その正規化法によって得られたデータを用いて発現変動の度合いでランキングしたときに

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) マイクロアレイを用いた 遺伝子発現解析 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) 1 自己紹介 2002 年 3 月 東京大学 大学院農学生命科学研究科博士課程修了 学位論文 : cdn マイクロアレイを用いた遺伝子発現解析手法の開発 ( 指導教官 : 清水謙多郎教授 ) 2002/4/1~ 産総研 生命情報科学研究センター産総研特別研究員

More information

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析

論文題目  腸管分化に関わるmiRNAの探索とその発現制御解析 論文題目 腸管分化に関わる microrna の探索とその発現制御解析 氏名日野公洋 1. 序論 microrna(mirna) とは細胞内在性の 21 塩基程度の機能性 RNA のことであり 部分的相補的な塩基認識を介して標的 RNA の翻訳抑制や不安定化を引き起こすことが知られている mirna は細胞分化や増殖 ガン化やアポトーシスなどに関与していることが報告されており これら以外にも様々な細胞諸現象に関与していると考えられている

More information

NGSデータ解析入門Webセミナー

NGSデータ解析入門Webセミナー NGS データ解析入門 Web セミナー : RNA-Seq 解析編 1 RNA-Seq データ解析の手順 遺伝子発現量測定 シークエンス マッピング サンプル間比較 機能解析など 2 CLC Genomics Workbench 使用ツール シークエンスデータ メタデータのインポート NGS data import Import Metadata クオリティチェック Create Sequencing

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) マイクロアレイデータ解 析結果の正しい?! 解釈 について 東京大学 大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 自己紹介 2002 年 3 月 東京大学 大学院農学生命科学研究科博士課程修了 学位論文 : cdna

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展

プロジェクト概要 ー ヒト全遺伝子 データベース(H-InvDB)の概要と進展 個別要素技術 2 疾患との関連情報の抽出 予測のための 技術開発 平成 20 年 11 月 18 日産業技術総合研究所バイオメディシナル情報研究センター分子システム情報統合チーム 今西規 1 個別要素技術 2 課題一覧 1 大量文献からの自動知識抽出と文献からの既知疾患原因遺伝子情報の網羅的収集 2 疾患遺伝子情報整備と新規疾患遺伝子候補の予測 3 遺伝子多型情報整備 1 大量文献からの自動知識抽出と

More information

Untitled

Untitled 上原記念生命科学財団研究報告集, 25 (2011) 86. 線虫 C. elegans およびマウスをモデル動物とした体細胞レベルで生じる性差の解析 井上英樹 Key words: 性差, ストレス応答,DMRT 立命館大学生命科学部生命医科学科 緒言性差は雌雄の性に分かれた動物にみられ, 生殖能力の違いだけでなく形態, 行動などそれぞれの性の間でみられる様々な差異と定義される. 性差は, 形態や行動だけでなく疾患の発症リスクの男女差といった生理的なレベルの差異も含まれる.

More information

生命情報学

生命情報学 生命情報学 5 隠れマルコフモデル 阿久津達也 京都大学化学研究所 バイオインフォマティクスセンター 内容 配列モチーフ 最尤推定 ベイズ推定 M 推定 隠れマルコフモデル HMM Verアルゴリズム EMアルゴリズム Baum-Welchアルゴリズム 前向きアルゴリズム 後向きアルゴリズム プロファイル HMM 配列モチーフ モチーフ発見 配列モチーフ : 同じ機能を持つ遺伝子配列などに見られる共通の文字列パターン

More information

機能ゲノム学(第6回)

機能ゲノム学(第6回) バイオインフォマティクス次世代シーケンサー (NGS) 編 東京大学大学院農学生命科学研究科アグリバイオインフォマティクス教育研究ユニット門田幸二 ( かどたこうじ ) http://www.iu.a.u-tokyo.ac.jp/~kadota/ kadota@iu.a.u-tokyo.ac.jp 1 バイオインフォマティクス人材育成講座 スタンダードコース 2 自己紹介 1995 年 3 月 高知工業高等専門学校

More information

KEGG_PATHWAY.ppt

KEGG_PATHWAY.ppt KEGG: Kyoto Encyclopedia of Genes and Genomes KEGG: Kyoto Encyclopedia of Genes and Genomes 様々な種類のデータを 生命現象の総体 として再構築 ツールの提供 EGassembler KAAS GENIES ネットワークの知識 ツールの提供 e-zyme pathcomp 高次機能 機能の階層分類 相互参照用データ

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

A Constructive Approach to Gene Expression Dynamics

A Constructive Approach to Gene Expression Dynamics 配列アラインメント (I): 大域アラインメント http://www.lab.tohou.ac.jp/sci/is/nacher/eaching/bioinformatics/ week.pdf 08/4/0 08/4/0 基本的な考え方 バイオインフォマティクスにはさまざまなアルゴリズムがありますが その多くにおいて基本的な考え方は 配列が類似していれば 機能も類似している というものである 例えば

More information

Qlucore_seminar_slide_180604

Qlucore_seminar_slide_180604 シングルセル RNA-Seq のための 情報解析 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 シングルセル RNA-Seq シングルセル RNA-Seq のデータ解析では 通常の RNA-Seq データの解析手法に加え データセット内の各細胞の遺伝子発現プロファイルの違いを俯瞰できるような 強力な情報解析アルゴリズムと データのビジュアライズ機能を利用する必要がある

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

大学院博士課程共通科目ベーシックプログラム

大学院博士課程共通科目ベーシックプログラム 平成 30 年度医科学専攻共通科目 共通基礎科目実習 ( 旧コア実習 ) 概要 1 ). 大学院生が所属する教育研究分野における実習により単位認定可能な実習項目 ( コア実習項目 ) 1. 組換え DNA 技術実習 2. 生体物質の調製と解析実習 3. 薬理学実習 4. ウイルス学実習 5. 免疫学実習 6. 顕微鏡試料作成法実習 7. ゲノム医学実習 8. 共焦点レーザー顕微鏡実習 2 ). 実習を担当する教育研究分野においてのみ単位認定可能な実習項目

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

ChIP-seq

ChIP-seq ChIP-seq 1 ChIP-seq 解析原理 ChIP サンプルのフラグメントでは タンパク質結合部位付近にそれぞれ Forward と Reverse のリードがマップされることが予想される ChIP のサンプルでは Forward と Reverse のリードを 3 側へシフトさせ ChIP のピークを算出する コントロールサンプルでは ChIP のサンプルとは異なり 特定の場所に多くマップされないため

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

配付資料 自習用テキスト 解析サンプル配布ページ 2

配付資料 自習用テキスト 解析サンプル配布ページ   2 分子系統樹推定法 理論と応用 2009年11月6日 筑波大 院 生命環境 田辺晶史 配付資料 自習用テキスト 解析サンプル配布ページ http://www.fifthdimension.jp/documents/molphytextbook/ 2 参考書籍 分子系統学 3 参考書籍 統計的モデル選択とベイジアンMCMC 4 祖先的な形質 問題 OTU左の の色は表現型形質の状態を表している 赤と青

More information

るが AML 細胞における Notch シグナルの正確な役割はまだわかっていない mtor シグナル伝達系も白血病細胞の増殖に関与しており Palomero らのグループが Notch と mtor のクロストークについて報告している その報告によると 活性型 Notch が HES1 の発現を誘導

るが AML 細胞における Notch シグナルの正確な役割はまだわかっていない mtor シグナル伝達系も白血病細胞の増殖に関与しており Palomero らのグループが Notch と mtor のクロストークについて報告している その報告によると 活性型 Notch が HES1 の発現を誘導 学位論文の内容の要旨 論文提出者氏名 奥橋佑基 論文審査担当者 主査三浦修副査水谷修紀 清水重臣 論文題目 NOTCH knockdown affects the proliferation and mtor signaling of leukemia cells ( 論文内容の要旨 ) < 要旨 > 目的 : sirna を用いた NOTCH1 と NOTCH2 の遺伝子発現の抑制の 白血病細胞の細胞増殖と下流のシグナル伝達系に対する効果を解析した

More information

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ

我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標 ゲノム育種 ( グリーンサイエンス ): ブルーベリー オオムギ イネ モンテカルロ法による分子進化の分岐図作成 のための最適化法 石井一夫 1 松田朋子 2 古崎利紀 1 後藤哲雄 2 1 東京農工大学 2 茨城大学 2013 9 9 2013 1 我々のビッグデータ処理の新しい産業応用 広告やゲーム レコメンだけではない 個別化医療 ( ライフサイエンス ): 精神神経系疾患 ( うつ病 総合失調症 ) の網羅的ゲノム診断法の開発 全人類のゲノム解析と個別化医療実現を目標

More information

■リアルタイムPCR実践編

■リアルタイムPCR実践編 リアルタイム PCR 実践編 - SYBR Green I によるリアルタイム RT-PCR - 1. プライマー設計 (1)Perfect Real Time サポートシステムを利用し 設計済みのものを購入する ヒト マウス ラットの RefSeq 配列の大部分については Perfect Real Time サポートシステムが利用できます 目的の遺伝子を検索して購入してください (2) カスタム設計サービスを利用する

More information

KEGG.ppt

KEGG.ppt 1 2 3 4 KEGG: Kyoto Encyclopedia of Genes and Genomes http://www.genome.jp/kegg/kegg2.html http://www.genome.jp/kegg/kegg_ja.html 5 KEGG PATHWAY 生体内(外)の分子間ネットワーク図 代謝系 12カテゴリ 中間代謝 二次代謝 薬の 代謝 全体像 制御系 20カテゴリ

More information

21世紀型パラメータ設計―標準SN比の活用―

21世紀型パラメータ設計―標準SN比の活用― 世紀のパラメータ設計ースイッチ機構のモデル化ー 接点 ゴム 変位 スイッチ動作前 スイッチ動作後 反転ばねでスイッチの クリック感 を実現した構造 世紀型パラメータ設計 標準 SN 比の活用 0 世紀の品質工学においては,SN 比の中に, 信号因子の乱れである 次誤差 (S res ) もノイズの効果の中に加えて評価してきた.のパラメータ設計の例では, 比例関係が理想であるから, 次誤差も誤差の仲間と考えてもよかったが,

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

nagasaki_GMT2015_key09

nagasaki_GMT2015_key09 Workflow Variant Calling 03 長崎は遺伝研 大量遺伝情報研究室の所属です 国立遺伝学研究所 生命情報研究センター 3F 2F 欧州EBIと米国NCBIと密接に協力しながら DDBJ/EMBL/GenBank国際塩基配列データ ベースを構築しています 私たちは 塩基配列登録を支援するシステムづくり 登録データを活用するシステムづくり 高速シーケンス配列の情報解析 を行なっています

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 復習 ) 時系列のモデリング ~a. 離散時間モデル ~ y k + a 1 z 1 y k + + a na z n ay k = b 0 u k + b 1 z 1 u k + + b nb z n bu k y k = G z 1 u k = B(z 1 ) A(z 1 u k ) ARMA モデル A z 1 B z 1 = 1 + a 1 z 1 + + a na z n a = b 0

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

第13章  テキストのクラスター分析

第13章  テキストのクラスター分析 第 13 章 テキストのクラスター分析 茨城大学工学部 高木真 概要 複数のテキストを分析する際に テキストの何らかの特徴にもとづいて似ているものごとにグループ分けする必要がある場合がある 本章ではテキスト間の類似度 ( または距離 ) にもとづいてテキストをグルーピングする方法やその応用例を説明する テキストのクラスター分析 テキストのクラスター分析 テキストの分散 相関 類似度や距離の情報を用いてグループ分けすること

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

SAP11_03

SAP11_03 第 3 回 音声音響信号処理 ( 線形予測分析と自己回帰モデル ) 亀岡弘和 東京大学大学院情報理工学系研究科日本電信電話株式会社 NTT コミュニケーション科学基礎研究所 講義内容 ( キーワード ) 信号処理 符号化 標準化の実用システム例の紹介情報通信の基本 ( 誤り検出 訂正符号 変調 IP) 符号化技術の基本 ( 量子化 予測 変換 圧縮 ) 音声分析 合成 認識 強調 音楽信号処理統計的信号処理の基礎

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史

分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史 分子進化モデルと最尤系統推定法 東北大 院 生命科学田邉晶史 まずはじめに, 最尤系統推定とは 多重モデル選択 である. 最尤系統推定の手順 1. 樹形を固定しての 2. 分子進化モデルの選択 1. 分子進化モデルを固定しての 2. 系統モデル ( 樹形 ) の選択 = 多重モデル選択 分子進化モデル超入門 とりあえず塩基置換モデルで 塩基置換モデルの 3 大要素 塩基置換確率行列 (nucleotide

More information

結果 この CRE サイトには転写因子 c-jun, ATF2 が結合することが明らかになった また これら の転写因子は炎症性サイトカイン TNFα で刺激したヒト正常肝細胞でも活性化し YTHDC2 の転写 に寄与していることが示唆された ( 参考論文 (A), 1; Tanabe et al.

結果 この CRE サイトには転写因子 c-jun, ATF2 が結合することが明らかになった また これら の転写因子は炎症性サイトカイン TNFα で刺激したヒト正常肝細胞でも活性化し YTHDC2 の転写 に寄与していることが示唆された ( 参考論文 (A), 1; Tanabe et al. 氏名 ( 本籍 ) 田辺敦 ( 神奈川県 ) 学位の種類博士 ( 学術 ) 学位記番号学位授与年月日学位授与の要件学位論文題名 甲第 64 号平成 28 年 3 月 15 日学位規則第 3 条第 2 項該当 RNA ヘリカーゼ YTHDC2 の転写制御機構と癌転移における YTHDC2 の 役割についての解析 論文審査委員 ( 主査 ) 佐原弘益 ( 副査 ) 村上賢 滝沢達也 代田欣二 論文内容の要旨

More information

PrimerArray® Analysis Tool Ver.2.2

PrimerArray® Analysis Tool Ver.2.2 研究用 PrimerArray Analysis Tool Ver.2.2 説明書 v201801 PrimerArray Analysis Tool Ver.2.2 は PrimerArray( 製品コード PH001 ~ PH007 PH009 ~ PH015 PN001 ~ PN015) で得られたデータを解析するためのツールで コントロールサンプルと 1 種類の未知サンプル間の比較が可能です

More information

Microsoft Word doc

Microsoft Word doc . 正規線形モデルのベイズ推定翠川 大竹距離減衰式 (PGA(Midorikawa, S., and Ohtake, Y. (, Attenuation relationships of peak ground acceleration and velocity considering attenuation characteristics for shallow and deeper earthquakes,

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン

計画研究 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシン 計画研究 2005 2009 年度 定量的一塩基多型解析技術の開発と医療への応用 田平 知子 1) 久木田 洋児 2) 堀内 孝彦 3) 1) 九州大学生体防御医学研究所 林 健志 1) 2) 大阪府立成人病センター研究所 研究の目的と進め方 3) 九州大学病院 研究期間の成果 ポストシークエンシング時代のゲノム科学研究では 多因子性 遺伝性疾患の関連解析による原因遺伝子探索が最重要課題であ 1.

More information

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B> クラスター分析に関するノート 情報学部堀田敬介 2004/7/32008/7/ 改訂, 2009/0/3 改訂 ) 類似度の測定 まずはじめに, 各データ間の距離を測るが, 尺度毎に様々な方法が提案されている. 尺度に対応した類似度測定の距離を示す.. 間隔尺度による類似度の測定 n 個の対象があり, 各対象は間隔尺度で m 個の属性 変量 ) が測定されているとする. このとき対象 と q を x

More information

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを

れており 世界的にも重要課題とされています それらの中で 非常に高い完全長 cdna のカバー率を誇るマウスエンサイクロペディア計画は極めて重要です ゲノム科学総合研究センター (GSC) 遺伝子構造 機能研究グループでは これまでマウス完全長 cdna100 万クローン以上の末端塩基配列データを 報道発表資料 2002 年 12 月 5 日 独立行政法人理化学研究所 遺伝子の機能解析を飛躍的に進める世界最大規模の遺伝子情報を公開 - 遺伝子として認知されていなかった部分が転写されていることを実証 - 理化学研究所 ( 小林俊一理事長 ) は マウスの完全長 cdna 160,770 クローンの塩基配列および機能アノテーション ( 機能注釈 ) 情報を公開します これは 現在までに人類が収得している遺伝子の約

More information

リアルタイムPCRの基礎知識

リアルタイムPCRの基礎知識 1. リアルタイム PCR の用途リアルタイム PCR 法は 遺伝子発現解析の他に SNPs タイピング 遺伝子組み換え食品の検査 ウイルスや病原菌の検出 導入遺伝子のコピー数の解析などさまざまな用途に応用されている 遺伝子発現解析のような定量解析は まさにリアルタイム PCR の得意とするところであるが プラス / マイナス判定だけの定性的な解析にもその威力を発揮する これは リアルタイム PCR

More information

分子系統解析における様々な問題について 田辺晶史

分子系統解析における様々な問題について 田辺晶史 分子系統解析における様々な問題について 田辺晶史 そもそもどこの配列を使うべき? そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い そもそもどこの配列を使うべき? 置換が早すぎず遅すぎない (= 多すぎず少なすぎない ) 連続長は長い方が良い 遺伝子重複が起きていない

More information

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - Econometrics pptx 計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: kkarato@eco.u-toyama.ac.p webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます

More information

解析法

解析法 1.Ct 値の算出方法 Ct 値の算出方法には 閾値と増幅曲線の交点を Ct 値とする方法 (Crossing Point 法 ) の他に 増幅曲線の 2 次導関数を求めてそれが最大となる点を Ct 値とする方法がある (2nd Derivative Maximum 法 ) 前者では 閾値を指数関数的増幅域の任意の位置に設定して解析するが その位置により Ct 値が変化するので実験間の誤差が大きくなりやすい

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

人工知能補足_池村

人工知能補足_池村 私くしにとって 生涯の指針となっている木村先生の教え 1. 想定外の発見の重要性 à unsupervised data mining for big data 2. 技術への信頼と技術開発の重要性 2D gel à BLSOM trna の二次元分離 : Methods in Enzymology 長さに依存する分離 想定外の 米国での Post Doc の時代 高分離能 長さに依存しない分離 29

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

1

1 < 参考資料 1> 想定最大規模降雨に関する地域区分について 我が国は 東西南北に広い上 脊梁山脈など地形特性もあり 例えば日本海側 太平洋側等といった地域ごとに気温や降雨などの気象の状況は異なる このため これまで観測された降雨データを用いて想定最大規模降雨を設定するにあたり 降雨の特性の類似する地域に区分することとする 気象現象に関する地域区分については 例えば地域別比流量図 ( クリーガー曲線

More information

CBRC CBRC DNA

CBRC CBRC DNA 2001 3 2001 4 2004 4 CBRC CBRC DNA 生命現象のシステム的理解のために 生命の単位 細胞は非常に複雑 システム バイオロジー 生命現象を記述するモデル 細胞はいつ なにをするのか 生命現象は遺伝子が制御している 遺伝子ネットワーク 遺伝子発現を記述するモデル 構造解明 医療技術 創薬 シミュレーション 2001 2002 2003 2004 2005 1. 2001-2005

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

Microsoft Word - FMB_Text(PCR) _ver3.doc

Microsoft Word - FMB_Text(PCR) _ver3.doc 2.PCR 法による DNA の増幅 現代の分子生物学において その進歩に最も貢献した実験法の1つが PCR(Polymerase chain reaction) 法である PCR 法は極めて微量の DNA サンプルから特定の DNA 断片を短時間に大量に増幅することができる方法であり 多大な時間と労力を要した遺伝子クローニングを過去のものとしてしまった また その操作の簡便さから 現在では基礎研究のみならず臨床遺伝子診断から食品衛生検査

More information

PowerPoint Presentation

PowerPoint Presentation パターン認識入門 パターン認識 音や画像に中に隠れたパターンを認識する 音素 音節 単語 文 基本図形 文字 指紋 物体 人物 顔 パターン は唯一のデータではなく 似通ったデータの集まりを表している 多様性 ノイズ 等しい から 似ている へ ~ だ から ~ らしい へ 等しい から 似ている へ 完全に等しいかどうかではなく 似ているか どうかを判定する パターンを代表する模範的データとどのくらい似ているか

More information

核内受容体遺伝子の分子生物学

核内受容体遺伝子の分子生物学 核内受容体遺伝子の分子生物学 佐賀大学農学部 助教授和田康彦 本講義のねらい 核内受容体を例として脊椎動物における分子生物学的な思考方法を体得する 核内受容体遺伝子を例として脊椎動物における遺伝子解析手法を概観する 脊椎動物における核内受容体遺伝子の役割について理解する ヒトや家畜における核内受容体遺伝子研究の応用について理解する セントラルドグマ ゲノム DNA から相補的な m RNA( メッセンシ

More information

航空機の運動方程式

航空機の運動方程式 可制御性 可観測性. 可制御性システムの状態を, 適切な操作によって, 有限時間内に, 任意の状態から別の任意の状態に移動させることができるか否かという特性を可制御性という. 可制御性を有するシステムに対し, システムは可制御である, 可制御なシステム という言い方をする. 状態方程式, 出力方程式が以下で表されるn 次元 m 入力 r 出力線形時不変システム x Ax u y x Du () に対し,

More information

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日

国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日 生物情報工学 BioInforma*cs 3 遺伝子データベース 16/06/09 1 国際塩基配列データベース n DNA のデータベース GenBank ( アメリカ :Na,onal Center for Biotechnology Informa,on, NCBI が運営 ) EMBL ( ヨーロッパ : 欧州生命情報学研究所が運営 ) DDBJ ( 日本 : 国立遺伝研内の日本 DNA データバンクが運営

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション V1 次世代シークエンサ実習 II 本講義の内容 Reseq 解析 RNA-seq 解析 公開データ取得 クオリティコントロール マッピング 変異検出 公開データ取得 クオリティコントロール マッピング 発現定量 FPKM を算出します 2 R N A - s e q とは メッセンジャー RNA(mRNA) をキャプチャして次世代シーケンサーでシーケンシングする手法 リファレンスがある生物種の場合

More information

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 スペクトルデータの特徴 1 波 ( 波数 ) が近いと 吸光度 ( 強度 ) の値も似ている ノイズが含まれる 吸光度 ( 強度 ) の極大値 ( ピーク ) 以外のデータも重要 時系列データの特徴 2 時刻が近いと プロセス変数の値も似ている ノイズが含まれる プロセス変数の極大値

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

GWB_RNA-Seq_

GWB_RNA-Seq_ CLC Genomics Workbench ウェブトレーニングセミナー : RNA-Seq 編 フィルジェン株式会社バイオサイエンス部 (biosupport@filgen.jp) 1 Advanced RNA-Seq プラグイン CLC Genomics Workbench 9.0 / Biomedical Genomics Workbench 3.0 以降で使用可能な無償プラグイン RNA-Seq

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

PowerPoint Presentation

PowerPoint Presentation エピジェノミクス解析編 2016/08/10 Filgen ChIP-seq (Transfactor & Histone), Bisulfite webex seminar 株式会社キアゲンアプライドアドバンストゲノミクス宮本真理, PhD 1 アジェンダ ChIP-seq 解析 Transcription Factor ChIP-seq Histone ChIP-seq Bisulfite-seq

More information

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View( でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー

1. はじめに 1. はじめに 1-1. KaPPA-Average とは KaPPA-Average は KaPPA-View(  でマイクロアレイデータを解析する際に便利なデータ変換ソフトウェアです 一般のマイクロアレイでは 一つのプロー KaPPA-Average 1.0 マニュアル 第 1.0 版 制作者 : かずさ DNA 研究所櫻井望 制作日 : 2010 年 1 月 12 日 目次 1. はじめに 2 1-1. KaPPA-Average とは 2 1-2. 動作環境 3 1-3. インストールと起動 3 2. 操作説明 4 2-1. メイン機能 - Calc. Average 4 2-1-1. データの準備 4 2-1-2.

More information

<4D F736F F F696E74202D E838A B83805F D B838093FC96E55F E707074>

<4D F736F F F696E74202D E838A B83805F D B838093FC96E55F E707074> トランスクリプトーム解析 プロテオーム解析入門 産業技術総合研究所生命情報工学研究センター 油谷幸代 内容 背景 トランスクリプトーム解析 プロテオーム解析 背景 (1/6) - セントラルドグマとゲノム情報解析 - セントラルドグマ ゲノム情報解析 DNA Genome mrna Transcriptome Protein Proteome Genome とは? 背景 (2/6) - ゲノムとは?-

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

スライド 1

スライド 1 本資料について 本資料は下記論文を基にして作成されたものです. 文書の内容の正確さは保障できないため, 正確な知識を求める方は原文を参照してください. 著者 : 伊藤誠吾吉田廣志河口信夫 論文名 : 無線 LANを用いた広域位置情報システム構築に関する検討 出展 : 情報処理学会論文誌 Vol.47 No.42 発表日 :2005 年 12 月 著者 : 伊藤誠悟河口信夫 論文名 : アクセスポイントの選択を考慮したベイズ推定による無線

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft PowerPoint - DNA1.ppt [互換モード]

Microsoft PowerPoint - DNA1.ppt [互換モード] 生物物理化学 タンパク質をコードする遺伝子 (135~) 本 PPT 資料の作成には福岡大学機能生物研究室のホームページを参考にした http://133.100.212.50/~bc1/biochem/index2.htm 1 DA( デオキシリボ核酸 ) の化学的特徴 シャルガフ則とDAのX 線回折像をもとに,DAの構造が予測された (Watson & Crick 1953 年 ) 2 Watson

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

Microsoft PowerPoint - 4_河邊先生_改.ppt

Microsoft PowerPoint - 4_河邊先生_改.ppt 組換え酵素を用いた配列部位 特異的逐次遺伝子導入方法 Accumulative gene integration system using recombinase 工学研究院化学工学部門河邉佳典 2009 年 2 月 27 日 < 研究背景 > 1 染色体上での遺伝子増幅の有用性 動物細胞での場合 新鮮培地 空気 + 炭酸ガス 使用済み培地 医薬品タンパク質を生産する遺伝子を導入 目的遺伝子の多重化

More information

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム

遺伝子の近傍に別の遺伝子の発現制御領域 ( エンハンサーなど ) が移動してくることによって その遺伝子の発現様式を変化させるものです ( 図 2) 融合タンパク質は比較的容易に検出できるので 前者のような二つの遺伝子組み換えの例はこれまで数多く発見されてきたのに対して 後者の場合は 広範囲のゲノム 2014 年 4 月 4 日 東北大学大学院医学系研究科 染色体転座 逆位による白血病の発症機構を解明 染色体異常に起因する疾病の病因解明に向けた新たな解析手法の確立 東北大学大学院医学系研究科の鈴木未来子講師 ( ラジオアイソトープセンター ) 山㟢博未博士 ( 医化学分野 ) 清水律子教授 ( 分子血液学分野 ) 山本雅之教授 ( 医化学分野 東北メディカル メガバンク機構機構長 ) らは 3

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

Microsoft PowerPoint - lecture a.pptx

Microsoft PowerPoint - lecture a.pptx 本日 (3 時限目 ) の内容 バイオインフォマティクス ( 生命情報学 ) 応用生命科学 情報生命学第 3 回配列解析入門 生物学と情報学の学際領域の学問分野 目的 生物データに対する情報解析技術の開発 情報解析技術を利用した新たな生物学的知識の発見 生物学の実験技術の革新 ( 例 : 次世代シークエンサー ) 大量のデータ ウェット ( 実験 ) とドライ ( 解析 ) の協力が不可欠 2 3

More information