MPP easy guide

Size: px
Start display at page:

Download "MPP easy guide"

Transcription

1 Mass Profiler Professional 簡易マニュアル マニュアル作成環境 : ( 旧版を下記で改定 ) Mass Profiler Professional B12.5 Build MassHunter Qualitative Analysis B SP1 Page 1

2 Mass Profiler Professional の主な機能 機能 特徴 Fold Change t- 検定 (2 群 ) ANOVA(3 群以上 ) Volcano Plot 主成分分析 (PCA) クラスタ分析 Class Prediction ( 判別予測 判別分析 ) Pathway 分析 ( オプション ) グループ間の平均で閾値以上のコンポーネントを抽出します グループ間で平均値とばらつきから グループ間で変動があると判断されるコンポーネントを抽出します Fold Change と t- 検定を同時に行います サンプル全体の大まかな傾向を視覚化します 多変数 ( コンポーネント ) を集約し 各データファイル ( サンプル ) の総合得点 ( スコア ) を算出して 表示します 各コンポーネントの係数 ( ローディング ) とスコアの関係から コンポーネントの考察を行うことができます 似た変動のコンポーネントを集めて視覚化します グループ間の違いを表すコンポーネントと分類の基準値 ( コンポーネントのアバンダンス ) を探し出し サンプルをグループで分類します 分類後にコンポーネントと基準値が妥当かどうかの確認を行います バイオマーカー探索で主に用いられる機能 コンポーネントのライブラリサーチ結果から化合物の代謝経路などを推定し Pathway と呼ばれる化合物の反応経路の地図に落とし込む機能です Page 2

3 MassHunter と MPP 用いた解析の流れ MassHunter MS や RT の再現性良好なデータ xxx.d xxx.cef 変換 cef MPP 1Experiment 作成強度正規化条件選択 1. None 2. Z-Transform 3. Baseline to (median/ mean) of (all/control) 定型 Wizard samples Analysis: Significance Testing and Fold Change Class Prediction: Build and Test Model cef 2Analysis ( 差異の検出 ) Volcano Plot Clustering PCA etc MassHunter 必須 : マスクロマトグラムとマススペクトルで確認 データベースサーチや組成式計算等 3 候補検出後確認 Export for Recursion で化合物リスト作成 ID Browser で化合物検索 Data Import Wizard 任意 Workflow Page 3

4 CEF ファイル作成方法概要 (Agilent MassHunter ユーザーのみ ) 1 該当データ上で右クリックします 2Export as CEF を選択します 3 データ保存先等設定します 4OK をクリックします 処理するデータファイル数と Compounds 数によっては処理に長時間かかります Molecular Feature Extractor 詳細は MassHunter ガイドブックに記載されています Page 4

5 MPP ソフトの概念と用語 1 Project Experiment Sample Entity ユーザーがデータを格納するワークスペースです MPP を複数人で共有する場合など各個人でプロジェクトを作ると 閲覧権限等は設定できませんが データを分けることができます 用途の異なるデータは混乱を招くため異なるプロジェクトにしたほうが無難です エクスペリメントはデータの解析単位になります シグナルデータのインポートを行うとエクスペリメントが 1 つできます ノーマライズはエクスペリメント単位で決定され変更することはできません GC/MS や LC/MS のデータです データファイル名が Sample 名になります LC/MS の場合は MFE で抽出された Feature です サンプルごとの強度変動情報が含まれます Project A Experiment 1 Sample ( データファイルセット ) Condition ( サンプルのグループ化情報 ) Entity List ( クロマトグラムピークリスト ) Object ( クラスタツリー 判別モデル等 ) Experiment 拡大 1 つ 1 つが RT, 分子量, 強度情報を持つデータ = Entity = Feature Experiment 2 Sample ( データファイルセット ) Condition ( サンプルのグループ化情報 ) Entity List ( クロマトグラムピークリスト ) Object ( クラスタツリー 判別モデル等 ) A B C D E F LC/MS 注入 1 回分のデータ = Sample 例 : コーヒー豆種類 = Parameter A, B, C, etc. = Condition Experiment は他の Project へコピーすることもできます Page 5

6 MPP ソフトの概念と用語 2 既にある Experiment を Project に追加する 選択された Entity List の Inspector を表示する 散布図を表示する ヒストグラムを表示する Venn 図を表示する ヒートマップを表示する 各サンプルの統計情報を表示する 新しい Pathway を作成する プロジェクトを閉じる Experiment を作成する 選択された Entity の Entity List を作成する CSV などで作成したファイルを Entity List として Import する Profile Plot を表示する マトリクスプロットを表示する 箱髭図を表示する スプレッドシートを表示する (Normal/Raw Abundance で選択可能 ) Interpretations Analysis Interpretation は MPP で読み込んだ Sample( データファイル ) をグループ化して表示させる方法です Interpretation の元になるのは Parameter です 1 つの Sample に複数の Parameter が設定されている場合に どの Parameter でグループ化して表示し クラスタ分析や t- 検定 PCA などを行うかを決めます 該当する Sample( データファイル ) を選択した Interpretation で解析した結果です Interpretations( グループ定義 ) Analysis(Entity List 及び解析結果のオブジェクト ) Page 6

7 MPP 用語集 1 MPP の用語 意味 アライメントは英語の 位置合わせ の意味で MPP では Entity を作成する際に行われます Alignment ( アライメント ) LC/MS や GC/MS のデータを読み込む際 複数の Sample( データファイル ) からそれぞれの化合物ピークの強度を 1 つのピーク情報としてまとめる必要があります ただ LC/MS も GC/MS も 測定毎に多少リテンションタイムや MS の m/z がずれることがあります アライメントは このような測定誤差を考慮して リテンションタイムや m/z の許容誤差を設定します MPP へ読み込まれた複数のデータファイルのピークリスト (CEF ファイルや ELU ファイル ) に含まれるピークの情報 ( リテンションタイム m/z ピーク強度 ) から アライメントの許容誤差範囲内のピーク同士をまとめて 1 つの Entity とします Condition Entity Hierarchical Cluster ( 階層型クラスタ ) 分析 許容誤差から外れたピークは 別の Entity として MPP で扱われます 設定されたパラメータ内にある各条件です Parameter が経時変化なら 1 時間 2 時間 3 時間 が Condition Parameter が製造場所なら A 工場 B 工場 C 工場 が Condition に相当します MPP 用語集の Parameter も参照 Entity は MPP のデータの取り扱い単位の一つで GC/MS や LC/MS のデータに含まれる化合物ピークのことを指します Entityには 化合物ピークのリテンションタイム モデルイオン (m/z) 各サンプルのピーク強度が含まれます 階層型クラスタツリーは データファイル間の距離を測り 距離の近いもの同士をまとめてクラスタとしてまとめていく手法です 以下の手順で計算されます 1. データファイル間の距離 (MPPではピーク強度の変動パターンの類似度) を全て測定する 2. 距離の近いデータ同士をそれぞれまとめてクラスタを作る 3. それぞれのクラスタの位置 ( 重心など ) を計算する 4. クラスタ同士の位置を測定し 近いものをクラスタとしてまとめる 5. 新しくできたクラスタの位置を計算する 6.4 5を 1つのクラスタになるまで繰り返す 階層型クラスタは 計算が煩雑であるものの k-means 法のような 予めいくつのクラスタに分ける ことが不要なため 適用範囲が広い手法と言えます 階層型クラスタでは データやクラスタ間の距離を デンドログラム というツリーで表します デンドログラムの距離が離れているクラスタやデータ同士は 類似度が低くなります 階層型クラスタ分析では クラスタの位置や クラスタ間の距離をどのように定義するかで 結果が異なることがあります 例えば 距離の位置の定義を クラスタ間の最短距離 とするか 最長距離 とするかで クラスタ間の違いを過小 過大評価することになります また 距離の測定方法も MPP ではいくつかの手法が提供されており デンドログラムのクラスタ間の距離に影響を与えます Page 7

8 MPP 用語集 2 MPPの用語 Indentified Interpretation k-means Parameter Unidentified LC/MS(TOF,Q-TOF) や GC/MSD のデータを MPP に読み込む際に 化合物名が ( ライブラリサーチなどで ) 推定された ピークリストをのことを Identified なピークリストといいます 意味 また GC/QQQ LC/QQQのMRMデータ GC/MSDのスクリーナー結果も Identified の形式でMPPに読み込まれます Interpretationは MPPで読み込んだSample( データファイル ) をグループ化して表示させる方法です Interpretationの元になるのは Parameter(HelpファイルにはConditionとも表記されることあり ) です 1つのSampleに複数のParameterが設定されている場合に どのParameterでグループ化して表示し クラスタ分析やt- 検定 PCAなどを行うかを決めます また 1つのParameterで複数回測定したデータ ( レプリケイト ; 再現性などの確認のために取られたデータ ) の強度を平均化するかどうかも 設定することができます k-meansクラスタ方は 古くから行われているクラスタ分析法で データをあらかじめ k 個 のクラスタに分けることを決めてから 実際にデータを整理していく手法のことです 例えば あるデータの散布図上にある測定データを 4 個 に分類する と決めてクラスタ分析を行う場合 4k-means 法といいます 実際の計算は 以下のとおりです 1. 散布図上にランダムに4 点のポイントを置く 2. データファイルと4 点のポイントとの距離を測り データファイルを一番近いポイントとして分類する ( データファイルは4つのクラスタに分類される ) 3. 各クラスタの重心を計算する (4つの重心が求まる) 4.3で求めた重心と 各データとの距離を測り データファイルを一番近いポイントとして分類する ( データファイルは4つのクラスタに分類される ) 5. 上記 3 4を 重心が移動しなくなるまで繰り返す k-means 法は計算もそれほど煩雑でないため古くから行われていた手法ですが 最初のクラスタ数 (kの値) をどのように決めるかで結果が異なるため kの値が既知の実験でないと妥当性のある結果が得られない と言われております そのため MPPのクラスタ分析は k-means 法よりもHierarchical Cluster ( 階層型クラスタ ) をまず行い その結果から妥当なkの数を見つけてk- means 法でEntityを分類するワークフローが提案されています Parameterは実験条件のことで データを測定した条件のことを指します 1 時間 2 時間 3 時間がConditionなら 経時変化 がParameter A 工場 B 工場 C 工場がConditionなら 製造場所 がParameterに相当します Conditionをまとめる概念です Unidentifiedは MPPにLC/MS(TOF,Q-TOF) やGC/MSDのデータファイルを読み込む際に 化合物名が ( ライブラリサーチなどで ) 推定されていない ピークリストをのことをいいます Unidentified で読み込まれた Entity の Compound Name は m/z@rt の形式で名前が付けられます GC/MSD の AMDIS の場合は ELU ファイルを Unidentified ファイルとして読み込みますが AMDIS の Identified のピークリストである FIN ファイルに含まれるピークは ELU ファイルにも含まれます Page 8

9 Mass Profiler Pro. (MPP) のワークフロー その前に データの準備 分けて見つける 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 9

10 MPP による解析に持ち込むまでの Agilent プラットフォームのデータ処理概略 LC/MS 分析装置 GC/MS Nontarget MFE (.cef) TOF, QTOF TOF, QTOF QQQ ICP-MS SQ SQ QQQ or or QQQ QQQ Target analysis or Non-target analysis Find by Formula (.cef) Unidentified or Combined experiment Target target analysis Quant Report (.xml) Identified experiment Target analysis Quant Report (.xls,.csv) Identified experiment Nontarget AMDIS (.elu) ChemStation Target analysis or Non-target analysis Quant Report (.xml) Unidentified or Combined experiment Target Identified experiment Target analysis Quant Report (.xml) Identified experiment Page 10

11 Mass Profiler Pro. (MPP) のワークフロー データの準備 分けて見つける 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 11

12 Analysis Workflow(Baselining Option 設定後に起動 ) Summary Report Experiment Grouping (Interpretation も作成 ) Filter Flags Significance Analysis/Fold Change QC on samples ( 表示のみ ) Filter By Frequency ID Browser Identification Finish!! Page 12

13 Workflow(Baselining Option 設定後 ) メニュー一覧 主に上から順に設定します Page 13

14 MPP 起動 Page 14

15 Project と Experiment 作成 (1/2) Project は experiment の上位構造です ( 例 :project 名 metabolites Experiment 名 LCMS_positive, negative, GCMS_positive, negaive など ) project Experiment 1 Experiment 2 Page 15

16 Project と Experiment 作成 (2/2) まずは MPP オプションがある場合は Pathway も選択可 同定 未同定混合の場合は Combined MRM データ等 全化合物が同定されている場合は Identified 化合物が全く同定されていない場合は Unidentified 重要 : 正しく選択してください この画面は合成してあります Data Import: データ取り込み Analysis: 限定された解析の流れ Class Prediction: 判別分析 Page 16

17 Data Import Wizard の流れ : MS Experiment Creation Wizard (1/11) TOF LC/MS データ Pathway 解析 (page 155) の場合のみ正しく選択することが必須です Page 17

18 MS Experiment Creation Wizard (2/11) Page 18

19 MS Experiment Creation Wizard (2/11) Page 19

20 MS Experiment Creation Wizard (5/11) Sample の表示順番を変更できます Page 20

21 MS Experiment Creation Wizard (6/11) 最終的に全てにグループ名を付けます Page 21

22 MS Experiment Creation Wizard (7/11) 特定の保持時間領域のみでの比較や一定のイオン強度以上の化合物のみで比較を行いたいときに使用します 一般には全データを使用する設定にします Page 22

23 MS Experiment Creation Wizard (8/11) 化合物のアライメント (LC/MS の場合 ) RT Window= 0.1% min Mass Window= 5.0 ppm mda 既知物質を用いて保持時間の補正を行なう場合 Perform RT correlation をチェックし with standards を選択します CE/MS では MT(MPP 内では RT と表示されます ), m/z によるアラインメントを測定条件によって変化させますが この値を大きくすると異なる化合物を同一と誤認識するフォールスポジティブのリスクが高くなりますので注意が必要です 具体例は後述します Page 23

24 MS Experiment Creation Wizard (9/11) 点の色は Frequency を表します 再現性の悪いものは赤色で 全てのサンプルに共通して存在し アライメントされたものは青色で表示されます アライメント条件が厳しいと Frequency が低い Entity が増えます 結果を見ながら必要に応じて Back ボタンで前画面に戻り アライメント条件や Filter 条件を修正します Page 24

25 MS Experiment Creation Wizard (10/11) 既知物質を用いてイオン強度の補正をする場合に使用します Page 25

26 MS Experiment Creation Wizard (11/11) 化合物強度の正規化を行ないます 次ページから詳しく説明しますが サンプル間の変動の絶対値で比較したい場合は Baseline to (median / mean) of (all / control) across samples サンプル間の変動の比率で比較したい場合は Z-Transform を選択してください 化合物間のダイナミックレンジが広い 生体サンプルなどの分析には Z-Transform を推奨します Page 26

27 正規化 (1) None 各正規化法による化合物強度の差をプロットする例として 左下テーブルの様な実験データが得られたとします Baselining options で None を選択すると 正規化は行われません よって 全て raw data abundance で比較することになるので 直観的には理解しやすいのですが 正規化を行うと Normalized abundance = 0 は必ずしも raw data abundance = 0 を意味しなくなります 他に存在量の多い化合物が存在すると ( ここでは compound 2) 存在量の少ない化合物の変動が相対的に小さなものとされてしまいます compound 1 compound 2 sample A sample B sample C compound 1 compound sample A sample B sample C Page 27

28 正規化 (2) Baseline to (median / mean) of (all / control) across samples 前ページで示された化合物強度を中央値か平均値で正規化します 下記は 各化合物の中央値との間の差に変換する場合の説明です (eg. Compound 1: 中央値 =1000, Normalized abundance of A = = -1000) 中央値を Normalized abundance = 0 とするため 絶対値の変動の大きい化合物が強調されますが 化合物間で広いダイナミックレンジを持つサンプルでは 変動比率が大きくても強度変動の絶対値が小さい化合物は全く変動していないかの様に見えてしまいます compound 1 compound 2 sample A sample B sample C 正規化 median sample A sample B sample C compound 1 compound 2 compound 1 compound sample A sample B sample C Page 28

29 正規化 (3) Z-Transform Z-Transform は強度変動の比率を考慮した正規化方法です Baselining options で Z-Transform を選択すると 各化合物強度は前ページで求めた 各化合物の中央値との差をそれぞれの化合物強度の標本分散で割った値に変換されます 生体由来などの様に存在量の多い化合物 微量な化合物が混在しているサンプルでは有効な手法ですが Quality Control を行い 信頼性の低い ( サンプル群内の繰り返し再現性をチェックすることで除去することが出来ます )entity を除かなければ相対強度 0.1% から 1.0% に増加したノイズを 10 倍に変動した化合物とみなしてしまうことになります compound 1 compound 2 sample A sample B sample C 正規化 compound 1 compound 2 sample A E-05 sample B E-05 sample C sample A sample B sample C compound 1 compound 2 Page 29

30 MS Experiment Creation ( 正規化 None) 全く同一データですが 縦軸の正規化の違いだけで大きく見え方が異なることに注意が必要です Page 30

31 MS Experiment Creation ( 正規化 Z-transform) 全く同一データですが 縦軸の正規化の違いだけで大きく見え方が異なることに注意が必要です Page 31

32 データの準備 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 分けて見つける 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 32

33 サンプル群の定義 p.21 で設定済みの場合は不要です Experiment Grouping を選択し グループを示すパラメーターを与えます 仮に n=4 で測定した場合 その 4 つのファイルが同一の群であることを宣言しなければなりません 群を表すパラメーターは複数設定することができます ( 例 : 男性 or 女性 20 代 or30 代 or40 代 日本人 or アメリカ人 or 中国人 ) Page 33

34 同じパラメーターを繰り返し入力するのは面倒なのですが どうにかなりませんか?? 指定したいサンプルをドラッグで選択後 Assign Values を選択すると 一括でパラメーターを入力することができます Page 34

35 Replicate はどの様に用意したら良いのでしょうか? また 1 つのサンプル群当たりどのくらいの replicate が必要なのでしょうか? T I M E 0 wks 2 wks 6 wks n=3 n=3 n=3 n=3 n=3 E n=3 3 injection Technical replicate A B C 1 injection D F 1 injection 1 injection Biological replicate Technical replicate から得られることが出来るのは測定誤差のみです 個体差を考慮することは出来ません また A を 3 回分析した結果を平均化することは厳密にはサンプル群 0wks, Treated を代表していることにはなりません 例え replicate の数を増やしていったとしても それは個体 A を代表した値になります Biological replicate は replicate 数を増やすことで サンプル群 ( 例 :2wks, Treated) の真値に近づくことが出来ます Replicate の適正数ですが Biological replicate であれば n=10 はほしいところです 実験のコスト ( 時間的なコスト含め ) を考えた上で設定してください 本マニュアルで使用しているデータは Technical replicate, n=3 の実験系になっています Page 35

36 Interpretations (Categorical, Non-averaged) Create Interpretation を選択し Categorical と Non-Averaged では ばらつきを評価しやすい表示です Page 36

37 Interpretations (Categorical, Averaged) Create Interpretation を選択し Categorical と Averaged では各 Condition 毎の平均表示です 4 n x 6 group = 24 群という扱われ方だったのですが 4 回測定を平均化し 1 x 6group = 6 群の比較にまとめました Page 37

38 Interpretations (Numerical, Averaged) Create Interpretation を選択し Numerical と Averaged では各 Condition 毎の平均表示です 各 Condition 内での再現性が良好で計時変化を視覚化したい場合等に有効です 0 日目 1 日目 2 日目 3 日目 4 日目 5 日目 Page 38

39 サンプル群の表示順を並び替えたいのですが どうすればいいでしょうか? Columns タブ上で移動させたいサンプル群を選択し 上下に移動させてください Profile plot もしくは Matrix plot の画面上で右クリックをし Properties を選択してください 表示順の入れ替えは 平均化の前後どちらでも行うことが出来ます Page 39

40 QC: Filter を使って Entity 中から再現性の悪いデータポイントを除きます Filter by Frequency を選択し サンプル群内でシグナルが現れる頻度によってフィルターをかけることができます 具体的には n=3 測定中 2 回以上現れるデータポイントを採用するのであれば この値は 66.6% となります 次ページ参照 100% 66% Filter をかけることで Entity 数が絞り込まれていることを確認してください Page 40

41 Filter by Frequency の例 at least 100% of all samples at least 66% of samples within each condition at least 100% of samples in only one condition at least 100% of samples in at least one condition at least 66% of samples in at least one condition at least 66% of samples in only one condition ( 以下この組合せは省略 ) ( 以下この組合せは省略 ) 凡例 : 検出される : 検出されない Page 41

42 QC: Filter を使って Entity 中から再現性の悪いデータポイントを除きます (2) Filter by Sample Variability を選択し サンプル群内のシグナル強度の CV 値でフィルターをかけることができます 8 6 < 20% < 30% < 40% この項目は 全サンプル群中の何群で上記の再現性条件を満たしたかで Entity をフィルターすることを示しています 例では at least 8 out of 8 conditions となっていますので 8 群全てで CV 値が 30% 以下である化合物を残すことを意味しています Page 42

43 データの準備 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 分けて見つける 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 43

44 統計解析のためのツール 2 群比較 T 検定 ;2つのサンプル群について有意差があるかどうかを検定 Fold 解析 ;2つのサンプル群のデータから 何倍の差があるかでフィルターをかける機能 Volcano Plot ; t 検定と Fold 解析の結果を視覚化したもの t 検定 A 群 B 群 3 群以上比較 ANOVA( 分散分析 ) ; 3 群以上のデータからの有意差があるかどうかを検定 表現方法 主成分 (PCA) 分析 ; 大まかな傾向を視覚化するツール 95% 以上の確率でここに入る クラスタリング ; 差のある化合物どうしをまとめるツール 判別分析 ; 未知試料がどの母集団に属するかを調べるツール Page 44

45 T 検定の限界 2 群間比較のみ実験デザインが 3 群以上の場合 ANOVA が必須 分散 (Variance) が小さい場合 平均差が殆どなくても 統計的に差がある という結果が生じてしまう Fold 解析との組合せが有効 Volcano Plot ( page 95) T 検定だけでは 統計的に偽陽性を排除できない多重検定補正が必要 ( page 71) Page 45

46 PRINCIPAL COMPONENTS ANALYSIS (PCA, 主成分分析 ) Page 46

47 PCA Score Plot( 各サンプルの大まかな傾向を表示 ) 3D 表示 2D 表示 Page 47

48 主成分分析 (PCA) 主成分分析は 一般的に 多くの変量の値をできるだけ情報の損失なしに,1 個または少数個の総合的指標 ( スコア ) で代表させる方法です サンプル間の違いを LC/MS データのクロマトグラムピークの情報を元にして 以下の式でスコア ( 得点 ) で表します サンプルのスコア ( 得点 )=Σ ( 各 Entity の Loading x 各ピークのピーク強度 ) ここで クロマトグラム中の各ピークの重みつけである Loading は サンプル間のスコアが最もばらつくように計算された 各ピーク固有の係数です [1] スコアは理論上 サンプルに含まれるピークの数だけ計算できますが PCA の目的は 少数個のスコアでサンプル間の違いを解釈する ことですので 通常は 1~3 個のスコアを求めて スコアと Loading の解析を行います サンプルの違いを表す情報量を最も表しているスコアから順番に第 1 主成分 ( Component 1) 第 2 主成分 (Component 2) と呼びます [2] サンプルごとの各主成分のスコアを表した図が スコアプロット クロマトグラムピークの各主成分の Loading を表した図が Loading Plot になります [1] 詳しい計算方法は ケモメトリクスや統計解析の書籍を参照ください ここでは PCA を MPP で行う際 スコアを求めるための Loading 計算は ソフトウェアで自動的に行われることのみ ご紹介させていただきます [2] この章で扱う 主成分 という言葉は サンプル間の違い という情報量に対する言葉です Page 48

49 PCA( 主成分分析 ) の基本的な考え方 試料 A 試料 B 試料 C ピーク 1 ピーク ピーク 試料 A~ 試料 C の特徴が分かるように 各ピークの面積を元にして試料の総合得点 ( スコア ) を付けることを考える 試料 ピーク係数 1 a 2 b 3 c スコア (u) 試料 A a+15b+4c 試料 B a+4b+15c 試料 C a+15b+5c 分散 ( ばらつき ) s 1 s 2 s 3 s u すなわち u= ax 1 +bx 2 +cx 3 となるスコア u を考える (x 1, x 2, x 3 はピーク 1~3 の面積値 ) u の分散 s u が最も大きくなるような係数 a, b, c を計算することで 試料 A~ 試料 C のスコアが最も離れて 特徴が区別できるようになります この計算は MPP で自動的に計算されます Page 49

50 PCA の計算結果 ( 第 1 主成分 ) 試料 A 試料 B 試料 C ピーク 1 ピーク ピーク 試料 A~ 試料 C の各ピークの計算結果 試料 ピーク係数 スコア (u) 試料 A 試料 B 試料 C 分散 ( ばらつき ) s 1 s 2 s 3 s u 結果から分かること 1. ピーク 1 は試料間の違いにあまり関与しない ( 係数が 0) 2. ピーク 2 は試料間の違いを表すスコア u に 負の影響 を与える 3. ピーク 3 は試料間の違いを表すスコア u に 正の影響 を与える スコア (u) Page 50

51 PCA の計算 ( 第 2 主成分 ) 試料 A 試料 B 試料 C ピーク 1 ピーク ピーク 試料 試料 A~ 試料 C の各ピークの第 2 主成分の計算 ピーク係数 1 d 2 e 3 f スコア (v) 試料 A 10*(1-0.00) 15*(1+0.63) 4*(1-0.78) 10d e+0.89f 試料 B 10*(1-0.00) 4*(1+0.63) 15*(1-0.78) 10d+ 6.51e+3.33f 試料 C 7*(1-0.00) 15*(1+0.63) 5*(1-0.78) 10d e+1.11f 分散 ( ばらつき ) s 4 s 5 s 6 s v v= dx 1 (1-a)+ex 2 (1-b)+fx 3 (1-c) となるスコア v を考える (x 1, x 2, x 3 はピーク 1~3 の面積値 ) v の分散 s v が最も大きくなるような係数 d, e, f を計算することで 試料 A~ 試料 C のスコアが最も離れて 特徴が区別できるようになります この計算は MPP で自動的に計算されます Page 51

52 PCA の計算結果 ( 第 2 主成分 ) 試料 A 試料 B 試料 C ピーク 1 ピーク ピーク 試料 A~ 試料 C の各ピークの計算結果 ( 第 2 主成分 ) 試料 ピーク係数 スコア (v) 試料 A 試料 B 試料 C 分散 ( ばらつき ) s 1 s 2 s 3 s v 結果から分かること 1. ピーク 1 は試料間の違いにあまり関与しない ( 係数が 0) 2. ピーク 2 は試料間の違いを表すスコア v に 正の影響 を与える 3. ピーク 3 は試料間の違いを表すスコア v に 正の影響 を与える スコア (v) スコア (u) Page 52

53 PCA の Loading と Score 試料 A ピーク1 ピーク2 ピーク 各試料のスコアの係数を Loading といい スコアに与える影響度を表す スコア ピーク u v 試料 B Loading Plot 2 スコア (v) 3 スコア (u) 試料 C Score Plot 各試料の情報 ( 属性など ) から Score Plot のスコア u,v の意味付けを行い その意味付けについて クロマトグラム中の各ピークの影響度を Loading Plot から理解します スコア (v) スコア (u) Page 53

54 主成分分析 (PCA, Score plot) 各サンプルの傾向を視覚化するには Score plot が便利です Next 各サンプルの傾向を表示するためには 平均化していない Interpretation を選択する必要があります また ここで指定する entity list を再現性や統計的有意差によって絞り込むことで 各サンプル群の PCA 結果が各々の特徴を反映していきます Page 54

55 主成分分析 (PCA, Score plot) 3 次元空間上で Ctrl キーを押しながらマウスカーソルをドラッグさせると 軸を回転させることができます また Shift キーを押しながらマウスカーソルを上下にドラッグさせるとズームイン アウトができます Eigenvalues は各主成分の寄与率 ( 情報量全体のうちその主成分が説明できる割合 ) を示しています 赤のプロットは各主成分の寄与率を 青のプロットは寄与率の累積値を示します 一般的に この寄与率が 70~80% 以上であれば よく説明されていると言われます また 少ない主成分で多くの寄与率があるほど よいモデルであると言われます Page 55

56 主成分分析 (PCA, Score plot) Page 56

57 データ処理による PCA( 主成分解析 ) の変化 PCA of the data All entities (19786) PCA of the data Entities filtered by frequency (3744) Page 25 参照 PCA of the data Entites after ANOVA (p 0.05) & Fold Change ( 2.0) (93) Page 参照 FILTRATION FILTRATION 品種 A 品種 B 品種 C 各種 統計的フィルターを使って有意に差のある化合物を絞り込んでいくことで サンプル群の傾向がはっきりしてくることがわかります 後述する判別分析 (Page 121) ではこの様に特徴付けが明白な entity list を用いることで 精度の高い判別結果が得られます Page 57

58 主成分分析 (PCA, Loading Plot) PCA はサンプル群を三次元空間に表示する Score Plot だけでなく 各化合物を二次元上に Loading Plot で表示させることも可能です Page 58

59 使用可能な統計の検定 One-way Tests: 一つのパラメータでサンプルグループを比較する T-Test ANOVA Time 0 hr Time 24 hr Time 0 hr Time 24 hr Time 48 hr N-way Tests: 2 つ以上のパラメータでサンプルグループを比較する 2-Way 3-Way Time 0 hr 24hr Treatment Control X Drug A Time 0 hr 24hr Treatment Control Drug A Genotype WT X KO Page 59

60 2 つのサンプルグループを比較する One-way Tests パラメトリック検定 : T-test unpaired T-test paired T-test unpaired unequal variance ノンパラメトリック検定 Mann-Whitney unpaired Mann-Whitney paired Page 60

61 Paired T-tests もっとも一般的な組み合わせの例としては 例えば右の表のように 変数として各個人を表し もう一つの変数として コーヒーを 飲む前 と 飲んだ後 の器用さといったような ものがあります もし 各個人の個人差が大きく コーヒーの効果 が小さい場合は t-test でコーヒーの差を検出するには非常に多くの個人の情報 (Biological replicates) を集めないといけません paired t-test を使用することで グループ間の変動が グループ自身の変動より小さい場合でも 統計検出力を t-test よりも高めることができます Dexterity Before Coffee Dan Kelly Tom Janet Dexterity After 1 Cup of Coffee David Page 61

62 頻度 Parametric Test ( パラメトリック検定 ) µ = 母集団平均 σ = 母集団標準偏差 Expression of Gene X 正規分布は上記の図のように釣鐘型の形をしており 平均値に対して左右対称の形をしています 平均値から両側 1σ( 標準偏差 ) までの面積が全体の 68.26% 2σ までの面積が全体の 95.44% 3σ までが全体の 97.5% の面積を占めます MPP のパラメトリック統計検定 (Parametric statistical tests) では 各化合物ピークのアバンダンスが正規分布の母集団からサンプリングされたと仮定して検定を行います パラメトリック統計検定 (Parametric statistical test) の不等分散 (unequal variances) では 比較するサンプルグループの分散 (σ 2 ) が等しくないという前提で検定を行います Page 62

63 Non-parametric Tests ( ノンパラメトリック検定 ) Non-parametric Tests は正規分布を前提としません サンプルグループ間の分散が等しくないと想定します 測定サンプルデータの標準化データ (Normalized Data) の順番に番号をつけ 標準化データ逸脱値の影響を減らします サンプルグループ間の繰り返し回数 (replicates) が少ないと 同じサンプルグループでパラメトリック検定 (parametric tests) を行った場合に比べて 統計的検出力は少ないです Gene X Untreated Normalized Intensity Treated Normalized Intensity Untreated Rank Treated Rank Replicate Replicate Replicate Page 63

64 3 つ以上のサンプルグループを比較する One-way Tests パラメトリック検定 ANOVA ANOVA unequal variance (Welch ANOVA) Repeated measures ノンパラメトリック検定 Kruskal Walis Friedman Page 64

65 Repeated Measures ANOVA もし 各個人の差が大きく コーヒーの効果 が小さい場合は ANOVA でコーヒーの差を検出するには非常に多くの個人の情報 (Biological replicates) を集めないといけません Repeated Measures ANOVA を使用することで グループ間の変動が グループ自身の変動より小さい場合でも 統計検出力を高めることができます Paired t-test と同様に 各個人の個人差による変動を効率よく除去するにはいくつかの段階を経る必要があります Dexterity Before Coffee Dexterity After 1 Cup of Coffee Dan Kelly Tom Janet Dexterity After 2 Cups of Coffee David Page 65

66 統計学的有意差のイメージ Page 66

67 P-value の計算方法 Asymptotic Method( 漸近法 ) 算出の前提として 化合物ピークのアバンダンスが正規分布をして各分布の分散が等しいとします よって 検定で使用されるパラメータ (t-ratio, f-ratio) も同様に正規分布すると仮定し 計算します これらの前提をしないで計算する場合は 以下の Permutation Method で p- value を計算します Permutation Method( 並べ替え法 ) 潜在的に存在する分布を想定しません サンプルを並べ替えて 調査のためのテスト評価基準の分布を作成します ( Permute samples and build distribution of test metrics for probe) P-value は順番に並べられた計算値が実測値よりも大きくなる割合です (the fraction of permutations in which the test metric computed is larger than the actual test metric for that sample) Page 67

68 Permutation test とは ある観測で A 集団の平均 >B 集団の平均 という結果が得られたとする その平均値の差を x とする ここで帰無仮説 : A 集団の平均 =B 集団の平均 として A と B のサンプルを 1 つにまとめ サンプルサイズ =n からなる母集団からランダムにとってきた集団とみなす この集団をランダムな 2 つの集団に分け直す この場合 サンプルの組み合わせは全部で (n)c(1/2n) 通り もし A,B の属する母集団が同じであって平均値の違いはたまたま生じた差だとすれば 全ての組み合わせの中でも x より大きな差は頻繁に見られるはず そこで 全ての組み合わせについて平均値の差を計算して x より大きい組み合わせがいくつあるか数える それが 全ての組み合わせのうち 5% を越えていたら たまたま生じた差 とみなす Page 68

69 What p-value Cut-off to Use? Depends on what type of error you are more comfortable with Type I の誤り (false positive): 有意差がないのにあると判定されてしまった Type II 誤り (false negative): 有意差があるのにないと判定されてしまった P-Value の Cut-off は type I の誤りと type II の誤りのトレードオフとなる 5HT1c NFL NMDA2C afgf GRa actin nachrd EGFR bfgf HT Brm SOD mglur IGF.I SC trkc mglur SC CNTFR pre-gad BDNF.rat GDNF IP3R L GAD H2AZ IP3R MK CCO mglur PDGFa IGF.II CNTF nachre IGFR GAP ODC SC NT PTN trk mglur cjun Ins MAP neno GRb TCP GRb S100beta 検定で有意差があると判定 p-value=0.05 検定で有意差がないと判定 本当は有意差があるサンプル 本当は有意差がないサンプル Page 69

70 T- 検定 および ANOVA による entity の絞り込み Next 3 群以上の比較には ANOVA を選択してください Next Next ANOVA により entity が p 値で絞り込まれました P 値はデフォルトで 0.05 ( 棄却域 5%) になっていますが この数値を小さくすると より化合物数が絞られます Page 70

71 多重検定の補正 Page 71

72 統計の多重検定の問題点 統計計算を多くの化合物ピークで行うため 5% の p-value でも ちりも積もればかなりの量となる peaks = 回 個別に統計検定を実施 p-value = 0.05 として のピークに対して検定を行うと 500 peaks (0.05 x 10000) で Type I の誤りが発生する可能性がある 統計検定の回数を増やせば増やすほど それに比例して false positive も増加してしまう 統計解析を行う前に データの Quality Control を行うことで false positive の数を減らすことができる 多重検定補正 (multiple testing correction:mtc) を行うことで 更に false positive を減らすことができる Page 72

73 MPP の Multiple Testing Correction ( 多重検定補正 ) オプション Family-wise error rate (FWER) Bonferroni Bonferroni Holm False Discovery Rate (FDR) Benjamini Hochberg Individual (genewise) error rate (p-value cut-off) (Probability of false positive for each test) No Correction Page 73

74 Multiple Testing Correction の例 以下の通り変数を定義します N = MTCを行う前にANOVAを通過したピーク数 P i = MTCを行わない ピークiのp-value = ユーザーが設定したp-cutoff 値 P post i = MTCを行った後の ピークiの p-value 計算を行うために 以下の値を代入します N = 100 = 0.05 Page 74

75 Family-wise Error Rate MTC: Bonferroni 複数回繰り返された検定全体において帰無仮説が棄却される可能性を family-wise error rate と呼びます FWER = 0.05 で 100 個の化合物ピークを検定した時に P 1 = P 2 = P 3 = P 100 という値であったとすると P post 1 = (0.0002)*(100) = 0.02 P post 2 = (0.0004)*(100) = 0.04 P post 3 = (0.0006)*(100) = 0.06 となります 結果としては 0.02 < 0.05 化合物強度に有意差があると認められる 0.04 < 0.05 化合物強度に有意差があると認められる 0.06 > 0.05 化合物強度に有意差があるとは認められない Page 75

76 Family-wise error rate MTC の問題点と解決方法 Family-wise error rate の調整は 何回検定を繰り返しても 全体の α レベル (family-wise error rate) は 0.05 を超えないようにするぞ! という非常に保守的な方法です したがって 本当は有意差があるのに 帰無仮説が棄却されないという Type II (false negative) の誤りが問題になります そこで ある程度 Type I (false positive) を許容して Type II を起こす可能性を小さくする方法の一つとして false discovery rate を調整するという方法が開発されました false discovery rate は 簡単に言うと 棄却された全ての帰無仮説のうち Type I が含まれている確率 です Page 76

77 False Discovery Rate MTC: Benjamini & Hochberg 統計検定の結果 (ANOVA, two-sample t-tests etc.) から得られた 100 個の p-value を降順に並べます (P 1 >P 2 > >P N ) 例 : P 1 = P 65 = P 66 = P 67 = P 100 各 P-value に 100/( その番号 ) を掛けたものを P post i とします P post 65 =(100/65)* = > 0.05 有意差は認められない P post 66 = (100/66)* = > 0.05 有意差は認められない P post 67 = (100/67)* = < 0.05 有意差が認められる よって p post 67 から p post 100 は有意差があるとして その中に潜在的な false positive のピークは 5% ある Page 77

78 多重検定方法の使い分け > Family-wise Error Rate Bonferonni FWER Bonferonni Holm FWER Benjamini Hochberg FDR No Correction 非常に保守的で一切の False Positive を許さない > False Discovery Rate More false negatives More false positives MTC で検出されたピークに p-value 分の False Positive が存在する (False positive a percentage of called peaks) > None 検定で用いたピークに p-value 分の割合で False Positive が存在する (False positive a percentage of peaks being tested) Page 78

79 MPP の統計 Post Hoc Tests Page 79

80 なぜ post-hoc test が必要なのか? (1) One-way ANOVA model 帰無仮説 : グループ間の平均値に有意差はない と仮定 H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 ここでは 1 つの化合物ピークで 5 つの条件を仮定します ここでもし H 0 が棄却されても 何が棄却されたか といった情報は得られません どの条件で棄却されたかを知るにはどうしたらいいでしょうか? Page 80

81 なぜ post-hoc test が必要なのか? (2) 可能な解決策 : 各条件の組み合わせで 2 群の t-test を実施する H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 この場合 5 つの条件があるため 全部で 10 通りの組み合わせの検定を行う必要がある 複数回の検定 false positive の増加 その他の解決策 : post-hoc test の実施 false positive を減らすことができる Page 81

82 Post-hoc Test MPP post-hoc test オプション : Tukey s Honestly Significant Difference (HSD) test Student-Newman-Keuls (SNK) test Tukey s と SNK の検定はいずれも正規化されて等しい分散であると仮定して実施されます One-way test で有意差があると認められた化合物ピークだけが Post-hoc test にかけられます Post-hoc test は 正規化されて等しい分散であるという過程で選んだ One-way test で行った場合に 妥当な結果が得られる 有意差があると認められた化合物ピークについて 各条件のピークアバンダンスの平均を ペアで比較していきます Tukey の方が SNK よりも conservative な結果になります Post-hoc tests は MPP の One-way test で行うことができます Page 82

83 Post-hoc Tukey Test ANOVA で有意差が認められた化合物ピーク X の 5 つの条件について 以下の帰無仮説を立てます H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5 ここで 各条件での化合物ピークのアバンダンス平均を以下の通りとします X 1 = 32.1 X 2 = 40.2 X 3 = 41.1 X 4 = 44.1 X 5 = 58.3 それぞれの pairwise q to critical value q (for group) を計算し比較します 5 vs. 1: significant (reject H 0 : µ 5 = µ 1 ) 5 vs. 2: significant 5 vs. 3: significant 5 vs. 4: significant 4 vs. 1: significant 4 vs. 2: not significant (does not reject H 0 : µ 4 = µ 2 ) 4 vs. 3: not necessary 3 vs. 1: significant 3 vs. 2: not necessary 2 vs. 1: significant Final results: or µ1 µ2= µ3= µ4 µ5 Page 83

84 Post-hoc Group サマリー結果 青い Box は 2 つの条件で有意差が認められた化合物ピークの数になります オレンジ色の Box は 2 つの条件で有意差が認められなかった化合物ピークの数になります Box をクリックした後に Union または Intersection いずれかをクリックすると ボックスに含まれる化合物ピークの Entity リストを作成することができます Page 84

85 統計解析 N-way ANOVA Page 85

86 2-way ANOVA 2 変数の効果を確認するための検定 (Tests for effects of two parameters) 各サンプルは 2 つのパラメータから得られた値を持つ ( 例 :Treatment type and Time) 化合物ピークの変動は Treatment type Time 両者の相互作用によるもの?? 各化合物ピークについて 3 つの p-values が計算されます Generate p-value for effect of treatment Generate p-value for effect of time Generate p-value for effect of interaction between treatment and time (change in expression influenced by both parameters) Page 86

87 2-way ANOVA Design T I M E 0 wks 2 wks 6 wks n=3 n=3 n=3 n=3 n=3 n=3 Page 87

88 Acceptable Designs for Analysis in MPP ( 必要なサンプル数 ) バランスの取れた Design: 各条件で 5 回ずつサンプルされている All three p-values calculated No Drug Drug A Drug B Time Time Time Time バランスが取れていない Design: 条件によりサンプル数がバラバラ All three p-values calculated No Drug Drug A Drug B Time Time Time Time 繰り返しのない Design: 各条件とも 1 サンプルしかデータが得られていない Interaction p-values will not be calculated No Drug Drug A Drug B Time Time Time Time サンプル数が 0 の条件がある : Test will not be performed No Drug Drug A Drug B Time Time Time Time Page 88

89 2-way Test Results Venn 図で 必要な条件を満たす部分をクリックして その条件を満たす化合物ピークを Entity List として保存できます Page 89

90 3-way ANOVA 3 変数の効果を確認するための検定 各サンプルは 3 つのパラメータから得られた値を持つ ( 例 :Treatment type, Time and Gender) 化合物ピークの変動は 1) treatment types, 2) different time points, 3) different gender, 4) interaction of treatment-time, 5) interaction of treatment-gender, 6) interaction of time-gender 7) or the interaction between treatment-time-gender のどれによって引き起こされているか? 各化合物ピークについて 上記の 7 つのそれぞれの p-values が計算されます Page 90

91 3-way ANOVA Results 各化合物ピークで, 7 つの p-values が計算されます 7 つの Entity Lists が作成され 各条件 相互作用の p-value がそれぞれ含まれています Empty lists will not be saved Page 91

92 Fold Change Fold change は 2 つの条件における化合物ピークの強度レベルを比較して違いを判別する測定基準です ユーザーは 2 倍 (2-fold) といったような閾値を設定することができます Fold Change では それぞれの化合物ピークに対して 条件 1 のアバンダンス平均に対する 条件 2 のアバンダンス平均の比で表わされます 化合物ピークのピークが 2 つの条件で増えたか減ったかを表示することができます Page 92

93 Fold Change による entity の絞り込み Next 3 群比較で A 対 B B 対 C C 対 A において強度比が一定数以上変化している entity を残します チェックボックスは全て入れてください Next Next Fold Change により entity が絞り込まれました Fold Change パラメーターはデフォルトで 2.0 になっていますが この数値を大きくすると より化合物数が絞られます スライダーではきりのいい値になりませんので (3.0 ではなく などとなる ) 値をキー入力し Enter キーを押すことでフィルター値が反映されます Page 93

94 2 群間比較を Scatter Plot で表示する 2 Tea 2 に特徴的 Tea 1 に特徴的 Scatter Plot は 2 群間の比較しか出来ませんが シンプルで理解しやすい表示方法です X 軸 y 軸はそれぞれサンプル群の中から選択し プロット画面右下方向のものほど x 軸群に特徴的 プロット画面左上方向のものほど y 軸群に特徴的な成分であることを示しています 右クリックで zoom mode を選択し マウスをドラッグさせれば選択した領域の拡大を行うことができます 初期設定では Selection Mode になっているため マウスをドラッグさせると Entity の選択を行うことができます 選択した Entity は Create entity list from selection (2) から 別リストにまとめることが可能です Page 94

95 Volcano Plot(1/3) Next >> 比較する 2 つの Condition を指定します Next >> Page 95

96 P-value ( 上ほど小さい = 有意差がある ) Volcano Plot(2/3) 結果の表示 (Volcano Plot) Next >> サンプル群 1 に多い サンプル群 2 に多い Volcano Plot は t 検定と Fold Change を同時に行えるので二群比較に便利な機能です 三群以上の比較には使用することが出来ません Cut-off 値を調整できます Page 96

97 Volcano Plot(3/3) Page 97

98 クラスター分析とは? クラスターは 似たグループ を集めて視覚化する統計解析の手法です A クラスター間の距離 ( 類似度 ) を樹形図 ( ツリー ) で表したものを デンドログラム と呼びます ツリーの高さが各クラスタ間の距離となり このようなクラスターを 階層型クラスタリング といいます C B D D B C A Page 98

99 Clustering Clustering は 教師なしの分類 の方法と呼ばれており データセットのパターンを表示する方法です Clustering は 化合物ピークを類似度の高いグループに分けます entity-level の clustering から 同じクラスタに属する化合物ピークは何らかの関連があると推察することができます sample level の clustering から サンプルレベルの Quality Control が行え 異なる条件で違いを示す化合物ピークを見つけることができます Page 99

100 階層型クラスタツリーの例 : 似たコンポーネントを集める 1 クラスタツリー中の 1 つ 1 つのマスが 各データファイルに含まれるコンポーネント ( 化合物ピーク ) を表します コンポーネントのアバンダンス ( 強度 ) は色で表示されています Low High 3 似た変動パターンを示すデータファイル ( サンプル ) 同士を近くに配置して ツリー ( 線 ) でつないでいます ツリーの高さが サンプルの類似度を表しています 4 特定のグループの特徴的なコンポネントが一まとまり ( クラスター ) に表示されます 横方向はコンポーネント ( 化合物ピーク ) 2 似た変動を示すコンポーネント同士を近くに配置して ツリー ( 線 ) でつないでいます ツリーの高さが コンポーネントの類似度を表しています グループ A B C D 縦方向はデータファイル ( サンプル ) Page 100

101 クラスタの作成で考慮する点 1) 何をクラスタで一緒にまとめたいか? 2) どの 類似度 を選択するか? 3) どのクラスタアルゴリズムで計算するか? Page 101

102 階層型クラスタリングの長所と短所 長所 : 全ての関連性ツリーが構築されるため K-means や自己組織化マップ (SOM) PCA に基づいたクラスタリング手法よりも詳細な情報が得られます 短所 : 類似度指標の算出法によっては 解析初期段階の小さな誤差が大きな差として出力される恐れがあります クラスター毎の entity list を直接出力できない為 ツリーからマニュアルで出力する必要があります Page 102

103 K-means クラスタリングの長所と短所 長所 : 計算速度が最も速いクラスタリング手法で メモリ使用量も最小で済みます 短所 : クラスターの数が適切でないと 正しく分類されない可能性があります クラスター間の関連性 及び同一クラスター内の化合物間の関連性について情報が得られません Page 103

104 クラスタを作成するために どのような類似度を選択するか 類似度の指標は Entity や Condition の近さを数学的に計算して算出されます 指標は類似度の計算式によって異なります ( 同じサンプルでも ) 全体のトレンドを強調する指標もあれば 大きさを強調する指標もあります 類似度の指標は以下の組み合わせの類似度の度合によって割り当てられます Entity の変動プロファイルの組み合わせ Sample/Condition の変動プロファイルの組み合わせ Page 104

105 MPP で使用できる類似度の指標 それぞれの類似度は以下の 2 種類のいずれかの値を持ち 類似度を数値化します 距離 (0 から無限大 ) 相関 (-1 to 1) MPPで使用できる類似度 (Similarity) Euclidian Squared Euclidian Manhattan Chebyshev Differential Pearson Absolute Pearson Centered Pearson Uncentered Page 105

106 類似度 類似度の指標は適切なものを選択する必要があります 例 カテゴリデータへ Euclidian 距離を当てはめるのは適切ではない 高度に歪んだ分布に対して相関の類似度を当てはめると 誤った結果をもたらすことがある Page 106

107 クラスタ分析 (1/6) k-means: あらかじめクラスタ数 (k) を指定して Entity を分類します Hierarchical: 階層型クラスタツリーを作成します Self Organization Map: 自己組織マップで Entity を分類します Page 107

108 クラスタ分析 (2/6) Finish Page 108

109 クラスタ分析 (3/6) 次々ページで説明 サイズ調整します Page 109 サイズ調整します

110 クラスタ分析 (4/6) 選んだ部分が拡大されます 110

111 クラスタ分析 (5/6) Properties を選択します 次に Create Classification でクラスター数を確認し OK 押します Entity clusters color threshold を調整して 大まかなクラスターに色分けされていることを確認します Page 111

112 クラスタ分析 (6/6) ダブルクリックすると各クラスタに分類された結果が表示されます Page 112

113 表示色やレイアウトを変更したいのですが クラスター分析結果の画面上で右クリックし Properties を選択してください Row Headers を Compound に設定すると 分析結果の右側に化合物情報が表示されます Color Range を設定することで 強度比の色を変えることが出来ます Rendering タブ中の Row Header Width をスライドさせることで 表示させる化合物情報の幅を設定することが出来ます Page 113

114 データの準備 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 分けて見つける 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 114

115 ID Browser による化合物推定 MPP でライブラリサーチを行う機能です (Mass Hunter も同じ機能を有しています ) Entity のマススペクトル 化学構造式 ( データベースインストール時のみ使用可能 ) Entity とライブラリのマススペクトルの同時表示 ライブラリのマススペクトル 検索結果 Page 115

116 効率よく entity (=compound) を ID するには この化合物のみ ID したい ID Browser は 現在開いている entity list の全 entity を METLIN+ 組成式計算で ID します Entity 数が数十であれば計算時間は 10 秒程度で済みますが 左図の様に 以上の entity となると化合物を 1 つ ID する度に全 entity を読み込ませていては 解析が非効率なものとなります そこで マウスをドラッグさせて興味のある化合物のみを選択し ( 緑色に変わります ) Create entity list のアイコンをクリックすることで ID Browser に持ち込む化合物を絞ることが効率の良い解析のコツになります Page 116

117 ID Browser の設定 Next Finish デフォルトの設定では 1) DB は METLIN で 5ppm 以内の精度で保持時間を加味せず質量のみで検索 2) 組成式は右図の構成元素で計算 となっております DB 検索結果と組成式結果が違うということを避けるために DB の Torerance は 2ppm 程度にした方が良いでしょう Page 117

118 ID Browser の実行結果 DB 検索 及び組成式計算が終了すると Compound List が表示されます ここには組成式 CAS 番号 化合物名などが表示されます また この Compound List は MassHunter Qual. のものと同じもので Cef ファイルの中には化合物名 組成式 CAS 番号などの情報が含まれています よって MassHunter Qual. 上から Find by Molecular Feature Find by Formula 等の機能を使用して Compound List を作成した後 Identify compounds > Search Database や Generate Formula を行い Compound List に名前や組成式を付けた状態で File > Export > as cef を実行して MPP の標準形式である.cef ファイルを作成すると MPP の Entity に保持時間 質量だけでなく名前や ID 情報も annotation として付いてくるので entity の絞込みが楽になります 後述する Pathway 解析は CAS 番号を基に代謝マップに当てはめていくので DB に CAS 番号が含まれていない場合は Manual Identification 機能を使い CAS 番号を入力します ( 次ページ参照 ) Page 118

119 Manual Identification の実行 ID Browser 上で Compound を選び 右クリックをすると Add/Edit Manual Identification が選択できます ここで現れるウィンドウで CAS ID を指定するとその番号が Compound List に張り付くので Save and Return を実行すれば マニュアルで ID した結果をパスウェイ解析に持ち込むことができます Page 119

120 Class Prediction ( 判別分析 ) sample class prediction model 作成のためには再現性の良い Entity を選ぶことが重要です Page 120

121 Class Prediction ( 判別分析 1/8) Page 121

122 Class Prediction ( 判別分析 1/8) Page 122

123 Class Prediction ( 判別分析 2/8) アルゴリズムを選択して Next をクリックします Page 123

124 Class Prediction ( 判別分析 3/8) Page 124

125 Class Prediction ( 判別分析 4/8) Page 125

126 Class Prediction ( 判別分析 5/8) 判別したい未知サンプルを選択します Page 126

127 Class Prediction ( 判別分析 5/8) Page 127

128 Class Prediction ( 判別分析 6/8) Page 128

129 Class Prediction ( 判別分析 7/8) Page 129

130 Class Prediction ( 判別分析 8/8) Page 130

131 Class Prediction ( 判別分析 ) Page 131

132 Class Prediction ( 判別分析 ) 判別モデルを選択します例 :Naïve Bayes Page 132

133 Class Prediction ( 判別分析 ) 判別したい未知サンプルを選択します Page 133

134 Class Prediction ( 判別分析 ) Page 134

135 Class Prediction ( 判別分析 ) Page 135

136 Class Prediction ( 判別分析 ) Page 136

137 判別モデルのアルゴリズム (1) -Decision Tree ( 決定木 )- Entity Sample 1 Sample 2 Sample 3 Entity1 [email protected] Entity2 [email protected] No Entity 1 >2000? Yes Sample 2 Yes Entity 2 >2000? No Sample 3 Sample 1 Page 137

138 判別モデルのアルゴリズム (2) -Support Vector Machine ( サポートベクターマシン, SVM)- Condition 1 Condition 3 Condition 2 サポートベクターマシンは各点からのマージンを最大化する超平面 (separation plane) を学習する方法です Page 138

139 判別モデルのアルゴリズム (3) -Naïve Bayes ( 単純ベイズ )- ベイズ分類器は連続した値 ( イオン強度など ) カテゴリー値 ( アンケートの 1. 悪い ~5. 良い ) の両方を扱うことが可能で 複数のクラスに分類することができるアルゴリズムです この判別アルゴリズムはサンプルが各クラスに属する確率を予測します ベイズ分類器モデルは各化合物に対する既知データの分布関数に基づいて構築され 学習した確率密度関数に基づいてデータポイントを分類します Entity 1 Condition 1 Entity 2 Max probability? Condition 2 Entity 3 Condition 3 入力分布関数確率 ( 各化合物の強度 ) 出力 ( 予測クラス = 最大確率を持つcondition) Page 139

140 判別モデルのアルゴリズム (4) -Neural Network ( ニューラルネットワーク )- Entity 1 Condition 1 Entity 2 Entity 3 Max score? Condition 2 Entity 4 Condition 3 Entity 5 入力 ( 各化合物の強度 ) Neurons 出力 ( 予測クラス = 最大スコアを持つ condition) Page 140

141 判別モデルのアルゴリズム (5) -Partial Least Square Discrimination (PLS 回帰分析 )- PLS 回帰分析のゴールは 化合物強度からクラスを予測することです PLS 回帰分析は化合物とクラスを直交成分と各化合物毎のローディングとして分解します Entity 1 Entity 2 Condition 1 Entity 3 Max score? Condition 2 Entity 4 Entity 5 ローディング ( 重み ) スコア Condition 3 入力 ( 各化合物の強度 ) 出力 ( 予測クラス = 最大スコアを持つ condition) Page 141

142 データの準備 実験計画を検討する 目的 仮説など ChemStation, MassHunter でデータを取る 統計的有意差による Entity 抽出 t- 検定 ANOVA 解析 PCA( 主成分分析 ) 分けて見つける 階層型クラスタ分析 条件を満たす Entity を探す (Venn 図 ) データファイルの読み込み Entity List の作成 ピークアライメント (Entity の作成 ) グループ定義 IDBrowser ( 化合物の推定 ) 推定する Class Prediction ( 判別分析 ) Entity のフィルター ( ノイズ除去 ) 詳細のクロマトグラム マススペクトルを解析する Entity List の出力 ChemStation, MassHunter での解析 Page 142

143 MassHunter 上での確認 検索や化合物の絞り込み結果が得られたら 結果の xxx.cef を作成します MassHunter Qual ソフトを開き 該当データを開いた後に 上記 xxx.cef を開いて実行するとリストされた化合物の マスクロマトグラム マススペクトルが表示されます Page 143

144 化合物抽出条件 これらの条件に基づいて マスクロマトグラム マススペクトルを抽出します 144

145 便利な機能 Page 145

146 便利な機能 1:Create Entity List 選択された Entity の Entity List を作成 興味ある Entity を選択します 右クリックして Zoom Mode も使えます 選択した 5 Entities List が作成されました Page 146

147 便利な機能 2:Find Similar Entities Compound や Mass のタイトルクリックしてソートし例 :Caffeine を選択します Page 147

148 便利な機能 2:Find Similar Entities Minimum, Maximum を調整して 似た挙動の Entities を選択します Page 148

149 便利な機能 2:Find Similar Entities Caffeine と似た挙動の 16 Entities が抽出されました Page 149

150 便利な機能 3: Data Spreadsheet 解析結果を Excel に出力する場合は Data Spreadsheet を選択し 右クリックから Select All Sheet を選び コピーします 強度は log 表記されていますので 1.0 は検出されなかった データ抽出されなかったことを示しています Page 150

151 便利な機能 4: ディレクトリとバックアップ Mass Profiler Professional では.doc や.xls ファイルの様に windows 上で experiment を削除することはできません ( 厳密には C:\Program Files\Agilent\MassHunter\Workstaion\MassProfilerPro\app\Data\files\gxuser に Experiment は保存されてはいますが 名前から判断できないファイル名になっています ) Experiment の削除は Mass Profiler Professional 上から行なってください また experiment を保存し 後日別の PC で解析を行なう場合やバックアップには Project Export Project から.tar ファイルとして保存してください Page 151

152 便利な機能 5:Venn 図 Venn 図を表示する 最大 4Entity リストから集合の考え方で絞込みできます Page 152

153 便利な機能 6:MPP のインストール方法 Use proxy のチェックボックスは記入せず proxy も空欄のまま Order ID を入力し OK を押します Page 153

154 便利な機能 7-1: Filter On Parameters 事前に Experiment Grouping で Parameter type が Numeric のパラメーターを作成します 仮に ブルーマウンテンの活性を 1 とした場合 キリマンジャロが 2 モカが 3 として その活性と相関する Entyty を探す例とします Page 154

155 便利な機能 7-2: Filter On Parameters Analysis から Filter on parameter を選択します Entity List Interpretation 相関を探したい Parameter Similarity Metric を選択します ピアソン相関係数は線形の相関解析なので 非線形の相関を解析したい場合はスピアマン順位相関係数を使用します Page 155

156 便利な機能 7-3: Filter On Parameters Cutoff 値のレンジは 1 に近いと相関 0 で相関なし -1 に近いと逆相関です Next ボタンで次に進み 名前を確認して Finish ボタンで Entity List を保存します Page 156

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Agilent 1色法 2条件比較 繰り返し実験なし

Agilent 1色法 2条件比較 繰り返し実験なし GeneSpring GX11.0.2 ビギナーズガイド Agilent 1 色法 2 条件の比較繰り返し実験あり 適用 薬剤非投与と投与の解析 Wild type と Knock out の解析 正常細胞と病態細胞の解析 など ビギナーズガイドは 様々なマイクロアレイの実験デザインがあるなかで 実験デザインの種類ごとに適切なデータ解析の流れを 実例とともに紹介するガイドブックです ご自分の実験デザインに適合したガイドをお使いください

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

NGSデータ解析入門Webセミナー

NGSデータ解析入門Webセミナー NGS データ解析入門 Web セミナー : RNA-Seq 解析編 1 RNA-Seq データ解析の手順 遺伝子発現量測定 シークエンス マッピング サンプル間比較 機能解析など 2 CLC Genomics Workbench 使用ツール シークエンスデータ メタデータのインポート NGS data import Import Metadata クオリティチェック Create Sequencing

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

PrimerArray® Analysis Tool Ver.2.2

PrimerArray® Analysis Tool Ver.2.2 研究用 PrimerArray Analysis Tool Ver.2.2 説明書 v201801 PrimerArray Analysis Tool Ver.2.2 は PrimerArray( 製品コード PH001 ~ PH007 PH009 ~ PH015 PN001 ~ PN015) で得られたデータを解析するためのツールで コントロールサンプルと 1 種類の未知サンプル間の比較が可能です

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Qlucore_seminar_slide_180604

Qlucore_seminar_slide_180604 シングルセル RNA-Seq のための 情報解析 フィルジェン株式会社バイオサイエンス部 ([email protected]) 1 シングルセル RNA-Seq シングルセル RNA-Seq のデータ解析では 通常の RNA-Seq データの解析手法に加え データセット内の各細胞の遺伝子発現プロファイルの違いを俯瞰できるような 強力な情報解析アルゴリズムと データのビジュアライズ機能を利用する必要がある

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

ChIP-seq

ChIP-seq ChIP-seq 1 ChIP-seq 解析原理 ChIP サンプルのフラグメントでは タンパク質結合部位付近にそれぞれ Forward と Reverse のリードがマップされることが予想される ChIP のサンプルでは Forward と Reverse のリードを 3 側へシフトさせ ChIP のピークを算出する コントロールサンプルでは ChIP のサンプルとは異なり 特定の場所に多くマップされないため

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

ThermoFisher

ThermoFisher Thermo Fisher Connect Relative Quantification 操作簡易資料 http://www.thermofisher.com/cloud 使用には事前登録が必要になります 画面は予告なく変わることがあります The world leader in serving science Thermo Fisher Connect とは? キャピラリシーケンサ リアルタイム

More information

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編 手順 4 Excel データを活用する ( リスト / グラフ 色分け ) 外部の表データ (CSV 形式 ) を読み込み リスト表示やカード表示 その値によって簡単なグラフ ( 円 正方形 棒の 3 種類 ) や色分け表示することができます この機能を使って地図太郎の属性情報に無い項目も Excel で作成し CSV 形式で保存することにより 自由に作成することができます (Excel でデータを保存するとき

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Rの基本操作

Rの基本操作 Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa 機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

エンドポイント濁度測定装置 LT-16 取扱説明書

エンドポイント濁度測定装置 LT-16 取扱説明書 エンドポイント濁度測定装置 LT-16 LT-16 Manager マニュアル ( 簡易マニュアル Version 2.0) LT-16 Manager のインストール LT-16 Manager は添付の CD に内蔵されています LT-16 Manager は Windows 7 Windows 8 において動作確認をしております ( 以下の図は Windows 8 使用時の表示図面です ) ただし

More information

Eschartマニュアル

Eschartマニュアル Eschart マニュアル 株式会社スマートエナジー研究所 Version 1.0.0, 2018-09-26 目次 1. 概要........................................................ 1 2. 各部名称 概要................................................. 2 3. 基本操作.....................................................

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

Microsoft PowerPoint - pr_12_template-bs.pptx

Microsoft PowerPoint - pr_12_template-bs.pptx 12 回パターン検出と画像特徴 テンプレートマッチング 領域分割 画像特徴 テンプレート マッチング 1 テンプレートマッチング ( 図形 画像などの ) 型照合 Template Matching テンプレートと呼ばれる小さな一部の画像領域と同じパターンが画像全体の中に存在するかどうかを調べる方法 画像内にある対象物体の位置検出 物体数のカウント 物体移動の検出などに使われる テンプレートマッチングの計算

More information

2.Picasa3 の実行 デスクトップの をダブルククリック 一番最初の起動の時だけ下記画 面が立ち上がります マイドキュメント マイピクチャ デスクトップのみスキャン にチェックを入れ続行 これはパソコン内部の全画像を検索して Picasa で使用する基本データを作成するものですが 完全スキャン

2.Picasa3 の実行 デスクトップの をダブルククリック 一番最初の起動の時だけ下記画 面が立ち上がります マイドキュメント マイピクチャ デスクトップのみスキャン にチェックを入れ続行 これはパソコン内部の全画像を検索して Picasa で使用する基本データを作成するものですが 完全スキャン Picasa3 を使った写真の整理 写真の整理はエクスプローラーを開いてフォルダの作成から写真の移動やコピーを行うことが望ましいのですが エクスプローラーの操作を覚えられずに写真の整理が進んでいない人のために画像管理ソフト Picasa3 を使った整理方法を説明します なお このソフトは画像に関する多くの機能を持ったものですが 画像整理だけの利用では容量も大きいですからエクスプローラーの使い方をマスターしている人はこのソフトを使う必要はありません

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株

二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株 二項ソフトクラスタリング分析例 この資料では Visual Mining Studio のアイコン Dyadic Soft Clustering を使って 二項ソフトクラスタリング 分析をする方法を説明します 二項ソフトクラスタリングは一般的には PLSI, PLSA などの名前で知られています 株式会社 NTT データ数理システム Copyright 2013 NTT DATA Mathematical

More information

2015アレイ解析プロトコル

2015アレイ解析プロトコル マイクロアレイデータ 解 析 (4 日 目 5 日 目 6 日 目 ) アレイデータのファイルや 実 習 の 連 絡 事 項 を 共 有 できる wiki を 用 意 しました http://bit.ly/microarray2015 4 日 目 ⅰ) Excel によるデータ 解 析 1. 全 サンプルのデータを 1 つのワークシートにまとめる 行 番 号 とプローブ 番 号 の 対 応 関 係

More information

Maser - User Operation Manual

Maser - User Operation Manual Maser 3 Cell Innovation User Operation Manual 2013.4.1 1 目次 1. はじめに... 3 1.1. 推奨動作環境... 3 2. データの登録... 4 2.1. プロジェクトの作成... 4 2.2. Projectへのデータのアップロード... 8 2.2.1. HTTPSでのアップロード... 8 2.2.2. SFTPでのアップロード...

More information

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20 BayoLink Excel アドイン使用方法 1. はじめに BayoLink Excel アドインは MS Office Excel のアドインツールです BayoLink Excel アドインは Excel から API を利用して BayoLink と通信し モデルのインポートや推論の実行を行います BayoLink 本体ではできない 複数のデータを一度に推論することができます なお現状ではソフトエビデンスを指定して推論を行うことはできません

More information

内容 1 はじめに インストールの手順 起動の手順 Enterprise Architect のプロジェクトファイルを開く 内容を参照する プロジェクトブラウザを利用する ダイアグラムを開く 便利な機能.

内容 1 はじめに インストールの手順 起動の手順 Enterprise Architect のプロジェクトファイルを開く 内容を参照する プロジェクトブラウザを利用する ダイアグラムを開く 便利な機能. Viewer manual by SparxSystems Japan Enterprise Architect 読み込み専用版 (Viewer) 利用マニュアル 内容 1 はじめに...3 2 インストールの手順...3 3 起動の手順...6 4 Enterprise Architect のプロジェクトファイルを開く...7 5 内容を参照する...8 5.1 プロジェクトブラウザを利用する...8

More information

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン JMP 10 のグラフビルダーで作成できるグラフ SAS Institute Japan 株式会社 JMP ジャパン事業部 2012 年 9 月作成 1. はじめに グラフビルダーは グラフを対話的に作成するツールです グラフビルダーでは グラフの種類を選択することにより 散布図 折れ線グラフ 棒グラフなどさまざまなグラフを作成することができます さらに グループ変数を用いて グラフを縦や横に分割することができ

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

<4D F736F F F696E74202D CB4967B2D8F6F93FC8AC48E8B8D9E F8E9E8C9F8DF5817A D C882F182C282A C520837D836A B2E707074>

<4D F736F F F696E74202D CB4967B2D8F6F93FC8AC48E8B8D9E F8E9E8C9F8DF5817A D C882F182C282A C520837D836A B2E707074> なんつい WEB 版簡易マニュアル ( 随時検索タイプ ) 2013/1/11 更新 1 URL ログイン名 パスワード < お手持ちのパソコンで位置情報を確認する > 1URL 2 ログイン名 3 パスワード https://loc.tliserv.co.jp/upr/user/login.do?svc= < お手持ちの携帯電話 PHS で位置情報を確認する > 4URL https://loc.tliserv.co.jp/upr/ktai/top.do?svc=

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと .5 Gage R&R による解析.5.1 Gage R&Rとは Gage R&R(Gage Repeatability and Reproducibility ) とは 測定システム分析 (MSA: Measurement System Analysis) ともいわれ 測定プロセスを管理または審査するための手法である MSAでは ばらつきの大きさを 変動 という尺度で表し 測定システムのどこに原因があるのか

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

電話機のファイル形式

電話機のファイル形式 この章では テキスト エディタを使用して作成する CSV データ ファイルのファイル形式を設定 する方法について説明します 電話機 CSV データ ファイルを作成するためのテキスト エディタ, 1 ページ の検索, 2 ページ CSV データ ファイルの電話機ファイル形式の設定, 3 ページ テキストベースのファイル形式と CSV データ ファイルの関連付け, 7 ページ 電話機 CSV データ ファイルを作成するためのテキスト

More information

2. 患者一覧 ログインすると患者一覧画面が表示されます 初期表示は本日日付で診療が行われた患者の一覧が表示されます 該当の患者がいない場合は上図のように患者一覧は表示されません ORCA 連携されていない場合は初期導入時に患者情報がありませんので 取り込みを行う必要があります 患者の取り込み方法は

2. 患者一覧 ログインすると患者一覧画面が表示されます 初期表示は本日日付で診療が行われた患者の一覧が表示されます 該当の患者がいない場合は上図のように患者一覧は表示されません ORCA 連携されていない場合は初期導入時に患者情報がありませんので 取り込みを行う必要があります 患者の取り込み方法は 手順書 No:U004-01 作成者 : 中部システムサポート株式会社 作成日 :2013/07/19 電子文書管理システム操作手順 電子文書管理システムの操作手順を説明します 1. ログイン ログインするユーザー ID とパスワードを入力してください 初期導入時はユーザー ID:administrator パスワードなしで登録されているのでそれでログインしてください administrator は管理者権限となっていますので

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では

More information

概要 ABAP 開発者が SAP システム内の SAP ソースまたは SAP ディクショナリーオブジェクトを変更しようとすると 2 つのアクセスキーを入力するよう求められます 1 特定のユーザーを開発者として登録する開発者キー このキーは一度だけ入力します 2 SAP ソースまたは SAP ディクシ

概要 ABAP 開発者が SAP システム内の SAP ソースまたは SAP ディクショナリーオブジェクトを変更しようとすると 2 つのアクセスキーを入力するよう求められます 1 特定のユーザーを開発者として登録する開発者キー このキーは一度だけ入力します 2 SAP ソースまたは SAP ディクシ オンラインヘルプ :SAP ソフトウェア変更登録 (SSCR) キーの登録 目次 概要... 2 参考リンク... 3 アプリケーションの起動... 4 アプリケーションとメインコントロールの概要... 5 キーリストのカスタマイズ... 7 リストのフィルタリング... 7 表のレイアウトのカスタマイズ... 8 新しい開発者の登録... 10 新しいオブジェクトの登録... 12 特定のインストレーションから別のインストレーションに個々の

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

写真の閲覧方法 1. 閲覧する納品データの種類の選択 ( 写真 ) P3 写真の閲覧写真の閲覧写真の閲覧 2. 写真を一覧から選択 表示 3. 写真をサムネイル一覧から選択 表示 4. 写真をアルバム形式で表示 P5~ P7~ P9~ 5. 写真の便利な表示方法 拡大 / 縮小 回転 明るさ補正 6

写真の閲覧方法 1. 閲覧する納品データの種類の選択 ( 写真 ) P3 写真の閲覧写真の閲覧写真の閲覧 2. 写真を一覧から選択 表示 3. 写真をサムネイル一覧から選択 表示 4. 写真をアルバム形式で表示 P5~ P7~ P9~ 5. 写真の便利な表示方法 拡大 / 縮小 回転 明るさ補正 6 新潟県 CALS システム 電子検査システム 簡易検査ビューワ ( 工事用 ) 操作マニュアル別冊 ~ 写真の閲覧 ~ 平成 25 年 7 月 1 写真の閲覧方法 1. 閲覧する納品データの種類の選択 ( 写真 ) P3 写真の閲覧写真の閲覧写真の閲覧 2. 写真を一覧から選択 表示 3. 写真をサムネイル一覧から選択 表示 4. 写真をアルバム形式で表示 P5~ P7~ P9~ 5. 写真の便利な表示方法

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

GWB_RNA-Seq_

GWB_RNA-Seq_ CLC Genomics Workbench ウェブトレーニングセミナー : RNA-Seq 編 フィルジェン株式会社バイオサイエンス部 ([email protected]) 1 Advanced RNA-Seq プラグイン CLC Genomics Workbench 9.0 / Biomedical Genomics Workbench 3.0 以降で使用可能な無償プラグイン RNA-Seq

More information

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 )   水落研究室 R http: イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) http://yuhikaku-nibu.txt-nifty.com/blog/2017/09/22103.html 水落研究室 R http://depts.nanzan-u.ac.jp/ugrad/ps/mizuochi/r.html 1 この授業では統計ソフト R を使って分析を行います データを扱うソフトとして

More information

ユーザ デバイス プロファイルの ファイル形式

ユーザ デバイス プロファイルの ファイル形式 CHAPTER 34 CSV データファイルの作成にテキストエディタを使用する場合 デバイスフィールドと回線フィールドを CSV データファイル内で識別するファイル形式を使用する必要があります このファイル形式には次のオプションがあります Default User Device Profile: ユーザデバイスプロファイルのデバイスフィールドと回線フィールドの事前決定済みの組み合せを含む Simple

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

Windows8.1基礎 ファイル管理

Windows8.1基礎 ファイル管理 OA ベーシック Windows8.1 基礎ファイル管理 1 / 8 Windows8.1 基礎ファイル管理 ファイル管理前編 ファイルとフォルダーの概要 ファイル Excel や Word などのアプリで作成したデータを ファイル といいます ファイルは 作成元のアプリの種類により Word では 文書 Excel では ブック PowerPoint では プレゼンテーション と呼ばれています ファイルの種類はアイコンのデザインで確認できます

More information

こんにちは由美子です

こんにちは由美子です Analysis of Variance 2 two sample t test analysis of variance (ANOVA) CO 3 3 1 EFV1 µ 1 µ 2 µ 3 H 0 H 0 : µ 1 = µ 2 = µ 3 H A : Group 1 Group 2.. Group k population mean µ 1 µ µ κ SD σ 1 σ σ κ sample mean

More information

本日の内容 はじめに - 多変量解析の簡単な説明 - RT m/z 強度(Intensity) の関係 - 解析を行う際に考慮すべき注意点 BLBに感染したRiceの解析例 ( 差分解析の例 ) - データ正規化 (Normalization) - Fold Analysis( 倍率変化を用いた解析

本日の内容 はじめに - 多変量解析の簡単な説明 - RT m/z 強度(Intensity) の関係 - 解析を行う際に考慮すべき注意点 BLBに感染したRiceの解析例 ( 差分解析の例 ) - データ正規化 (Normalization) - Fold Analysis( 倍率変化を用いた解析 LC/MS GC/MS データ解析セミナー - GeneSpring MS トレーニングセミナー 本日の内容 はじめに - 多変量解析の簡単な説明 - RT m/z 強度(Intensity) の関係 - 解析を行う際に考慮すべき注意点 BLBに感染したRiceの解析例 ( 差分解析の例 ) - データ正規化 (Normalization) - Fold Analysis( 倍率変化を用いた解析 )

More information

生存確認調査ツール

生存確認調査ツール Hos-CanR.0 独自項目運用マニュアル FileMaker pro を使用 登録作業者用 Ver. バージョン改訂日付改訂内容 Ver. 00//5 初版 Ver. 0// FileMaker Pro の動作確認の追加 はじめに 本マニュアルについて Hos-CanR.0 院内がん登録システム ( 以降は Hos-CanR.0 と記述します ) では 独自項目の作成 登録 サポートはなくなり

More information

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める... Microsoft Excel 2013 - グラフ完成編 - 明治大学教育の情報化推進本部 2017 年 2 月 1 日 目次 1. はじめに... 2 1.1. Excel シートからグラフの選択... 2 1.2. グラフの各部の名称... 3 2. 成績の複合グラフを作成... 4 2.1 各生徒の 3 科目の合計点を求める... 4 2.2 合計点から全体の平均を求める... 5 2.3

More information

<4D F736F F D E7382CC944D8AC28BAB91CE8DF4955D89BF B838B91808DEC B A B D8D A2E646F63>

<4D F736F F D E7382CC944D8AC28BAB91CE8DF4955D89BF B838B91808DEC B A B D8D A2E646F63> - 都市の熱環境対策評価ツール基本操作ガイド - さっそくツールを導入して基本的な操作を一通り体験してみましょう 本ガイドに記載された全操作に要する時間は 30 分程度です ツールを導入し 起動しましょう ( 操作マニュアル 1.4.) 任意のフォルダにおいて Zip ファイル ( 都市の熱環境対策評価ツール.zip) を解凍します PCS2007 フォルダをコピーして同じフォルダの階層にペーストし

More information

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用

2. 設定画面から 下記の項目について入力を行って下さい Report Type - 閲覧したい利用統計の種類を選択 Database Usage Report: ご契約データベース毎の利用統計 Interface Usage Report: 使用しているインターフェイス * 毎の利用統計 * 専用 EBSCOadmin 利用統計設定方法 EBSCOadmin 内の Report & Statistics 機能をご利用頂くことで セッション別 発信元の IP アドレス別 デー タベース別 最も多く検索された雑誌タイトルなどに限定して ユーザーのデータベース利用頻度を把握すること ができます ここでは 基本的なデータベースの利用統計レポートの作成方法をご説明します 利用統計を設定する (=Standard

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

スライド 1

スライド 1 6B-1. 表計算ソフトの操作 ( ) に当てはまる適切な用語とボタン ( 図 H 参照 ) を選択してください ( 選択肢の複数回の選択可能 ) (1) オートフィルオートフィルとは 連続性のあるデータを隣接 ( りんせつ ) するセルに自動的に入力してくれる機能です 1. 図 1のように連続した日付を入力します *( ア ) は 下欄 ( からん ) より用語を選択してください セル A1 クリックし

More information

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E

1. MEGA 5 をインストールする 1.1 ダウンロード手順 MEGA のホームページ (http://www.megasoftware.net/index.php) から MEGA 5 software をコンピュータにインストールする 2. 塩基配列を決定する 2.1 Alignment E MEGA 5 を用いた塩基配列解析法および分子系統樹作成法 Ver.1 Update: 2012.04.01 ウイルス 疫学研究領域井関博 < 内容 > 1. MEGA 5 をインストールする 1.1 ダウンロード手順 2. 塩基配列を決定する 2.1 Alignment Explorer の起動 2.2 シークエンスデータの入力 2.2.1 テキストファイルから読み込む場合 2.2.2 波形データから読み込む場合

More information

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ] JMP を用いた ARIMA モデルのあてはめ SAS Institute Japan 株式会社 JMP ジャパン事業部 2013 年 2 月作成 1. はじめに JMP の時系列分析では 一変量の時系列データに対する分析や予測を行うことができ 時系列データに対するグラフ表示 時系列モデルのあてはめ モデルの評価 予測まで 対話的に分析を実行することができます 時系列データにあてはめるモデルとしては

More information

スライド 1

スライド 1 ホームページ講習 CMS: 管理 1. ログインと管理画面へ切り替え 2. ホームページのバックアップを取るには? 3. 祝日設定について 4. 行事カレンダーについて 5. 自分のパスワードを変更するには? 6. 活動記録 欄の作りを理解しよう 7. 新規のページを追加するには? 8. 日誌を別ページに移動させるには? 9. 新規の日誌を作成するには? 10. 新規の活動報告枠を配置するには? 11.(

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

Salome-Meca を用いたモーダル解析の解析手順 今回はモーダル解析を DEXCS-Salome6-64bit を用いて行う 平成 24 年 11 月 21 日岐阜高専 DALAB 鍔田広美 目次 1. 解析概要 2. SALOME の起動 3. ファイルの作成 4. Geometry でモデ

Salome-Meca を用いたモーダル解析の解析手順 今回はモーダル解析を DEXCS-Salome6-64bit を用いて行う 平成 24 年 11 月 21 日岐阜高専 DALAB 鍔田広美 目次 1. 解析概要 2. SALOME の起動 3. ファイルの作成 4. Geometry でモデ Salome-Meca を用いたモーダル解析の解析手順 今回はモーダル解析を DEXCS-Salome6-64bit を用いて行う 平成 24 年 11 月 21 日岐阜高専 DALAB 鍔田広美 目次 1. 解析概要 2. SALOME の起動 3. ファイルの作成 4. Geometry でモデルの作成 5. Mesh でメッシュの実行 6. Aster で解析の実行 7. Post-Pro で結果の可視化

More information

ゲートウェイのファイル形式

ゲートウェイのファイル形式 この章では Cisco Unified Communications Manager 一括管理 BAT を使用して シスコのゲー トウェイのファイル形式を Cisco Unified Communications Manager データベースに一括して設定す る方法について説明します の検索, 1 ページ の設定, 2 ページ ファイル形式と CSV データ ファイルの関連付け, 5 ページ の検索

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

MassHunter Workstation Agilent MassHunter Workstation MS Agilent TOF Q-TOF LC/MS LC/MS GC/MS ICP-MS Agilent MS * MassHunter Workstation LC/MS GC/MS IC

MassHunter Workstation Agilent MassHunter Workstation MS Agilent TOF Q-TOF LC/MS LC/MS GC/MS ICP-MS Agilent MS * MassHunter Workstation LC/MS GC/MS IC Agilent MassHunter Workstation faster, confident more Our measure is your success. products applications soft ware services MassHunter Workstation Agilent MassHunter Workstation MS Agilent TOF Q-TOF LC/MS

More information

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研 CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育

More information

Microsoft Word - Power_Analysis_Jp_ docx

Microsoft Word - Power_Analysis_Jp_ docx Power Analysis using G*Power Version 1.0 013 年 3 月 03 日 評価学博士 佐々木亮 サンプルサイズの検討方法 1. 最低のサンプルサイズサンプルサイズに関する考え方 統計分析を用いた調査報告書では サンプルサイズとして 30 あるいは 5 を用いている場合が頻繁に見られる 事前 事後比較のための 1 群の t 検定では まさに 30 あるいは 5 が必要ということになり

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information