小児循環器専門医に必要な統計学

Size: px
Start display at page:

Download "小児循環器専門医に必要な統計学"

Transcription

1 PEDIATRIC CARDIOLOGY and CARDIAC SURGERY VOL.30 NO.2 ( ) 小児循環器専門医のための総説シリーズ 21 専門医のための総説シリーズ は 61 頁の一覧から順不同で掲載していきます 中村好一 Keywords: 自治医科大学公衆衛生学教室 Basic Knowledge of Biomedical Statistics for Pediatric Cardiologists Yosikazu Nakamura In this article, items concerning biomedical statistics according to the Aims of Training for Pediatric Cardiologists issued by the Japanese Society of Pediatric Cardiology and Cardiac Surgery are explained. The items are not only for pediatric cardiologists, however, but also for medical specialists in all the fields. Issues discussed in this article are; (1)characteristics of data, (2) representative values and variations, (3)descriptive statistics and analytic statistics, (4)estimations and tests, (5)methods of tests, (6)methods of estimations, (7)correlation and regression, (8)multiple comparison, and (9)charts and graphs. 要旨日本小児循環器学会の 小児循環器専門医修練目標 で取り上げられている統計に関する事項を解説した. ただし, 紹介した事項は小児循環器専門医に特化したものではなく, すべての臨床専門医に必要な事項と考える. 項目は以下の通りである :(1) データの種類,(2) 代表値とばらつき,(3) 記述統計と分析統計,(4) 推定と検定,(5) 検定の実際, (6) 推定の実際,(7) 相関と回帰,(8) 多重比較,(9) 図の作成. はじめに本シリーズでは小児循環器専門医が習得すべき知識や経験を具体的に示す教科書的な総説として企画されている. 筆者が担当する統計学においては, 小児循環器学に特化したものはなく, 本稿は 臨床専門医に必要な統計学 という視点でまとめてみた. 臨床専門医に必要な統計学と一口にいうが, 筆者はこの中にも 3 種類のものがあると考える. ひとつは1 日常の臨床を行う上で直接必要な統計学, もうひとつは2 臨床の基礎となる他人の学会発表や学術論文を理解するために必要な統計学, そして最後に3 自らの経験を学問として発信するための学会発表や論文執筆のために必要な統計学である.1 が極めて基本的な知識であることについて異論はないであろう.2 と3の関係は微妙である. 他人の学会発表や論文を理解するためのものという意味では, ある程度の高度な統計学を理解しておく必要があるが, これらを自分で使う必要 50 はないという考え方もできる. しかし, 逆に学会発表や論文執筆の立場になると, 自分でも高度なものを使うことができなければならない. しかし, 統計学の専門家に共同研究者として自らの研究に加わってもらえば, 自分で統計を使いこなすことができなくても, ことが足りるかもしれない. しかし一方で, 統計解析を統計学者に丸投げということであれば, 臨床専門医としての立場が研究に反映されなくなる. 以上のように考えると,2 と3は同一レベルと考えることもできるし, 一方では1だけでは専門医と称するには心許ない ( そもそも 専門医とは何か という根源的な課題に行き着くが, ここではこれ以上は触れない ). したがって, 区分はあるが, 臨床専門医としてはすべてについて一定レベル以上の理解が必要であろう. 以下では, 日本小児循環器学会が提示している 小児循環器専門医修練目標 の中であげられている統計学やその関連領域について解説していく. 日本小児循環器学会雑誌第 30 巻第 2 号

2 136 データの種類データを大きく分けると数量データと質的データに 2 区分できる. 数量データは数値で表すデータ ( 年齢, 体温, 血清アルブミン値など ) であり, 質的データは性別, 職業など数値では表現しないデータを指す. 数量データは後述のような代表値とばらつきでその特徴を示すが, 質的データは全体に占める割合を示すのみである. 数量データの中にもいくつかの区分がある. 連続データは, 観察の精度は置くとして, 各種の検査値などいくらでも細かな数値まで理論的には取り得るものであるのに対して, 離散データは, たとえば兄弟姉妹の数など, 理論的に特定の値しかとらないものを指す. 離散データの平均を求めると 兄弟姉妹数の平均は 1.8 人 といったあり得ない数値になることもあるが, 気にする必要はない. 絶対値として 0 が存在するデータを比尺度, そうでないものを間隔尺度という. 摂氏や華氏で表現した温度は間隔尺度であるが, 絶対温度は比尺度である. 比尺度では ある値はもうひとつの値の x 倍である と表現することができる. 質的データは順序尺度と名義尺度に区分することができる. 並び方に意味があるもの ( たとえば重症度など ) は順序尺度で, 意味がないもの ( 職業など ) は名義尺度である.2 値データ ( 性別などの 0-1 データ ) はすべて名義尺度である. 代表値とばらつき 数学的には度数分布曲線が上向きに凸の変曲点の値と定義される. (3) 中央値 (median) 個々の値を大きな順 ( 小さな順でも可 ) に並べた場合の中央に存在する値である. 標本サイズ n が奇数の場合には上から数えても下から数えても (n +1)/2 番目の数値である. 偶数の場合には n/2 番目と n/2 + 1 番目の値の算術平均を中央値とする. 2. 散布度代表値が同一でも個々のデータが幅広く分布するものもあれば, 代表値の周囲に集中しているものもある. このようなばらつきを示す指標として, 各数値と平均の差の 2 乗の合計を n - 1 で除した分散 (variance) がある. これを母集団の分散の推定値として 不偏分散 と呼ぶことがある. エクセルでは関数 VAR.S を用いる. 一方で観察集団そのものを全体 (= 母集団 ) と考えた場合には n - 1 ではなく n で除した分散を用いる ( この場合のエクセル関数は VAR.P である ). 分散のディメンジョンは, 個々の数値や平均の 2 乗なので扱いにくい. そこで分散の平方根を計算し, 標準偏差 (standard deviation) を用いることも多い. エクセルでは分母が n - 1 の場合には STDEV.S を,n の場合には STDEV.P を使う. 複数の変数の標準偏差の相互比較は変数の大きさが異なるためにできない ( 身長と体重の標準偏差の比較を考える ) ので, 標準偏差を平均で除した変動係数 (coefficient of variation) を用いて相互比較を行う. 1. 代表値集団を代表するデータを代表値という. 前述の通り, 数量データで用いる. (1) 平均 (mean,average, 算術平均,arithmetric mean) すべての値の合計を標本サイズ (n) で除した値を平均 ( 値 ) という. 幾何平均 (geometric mean, すべての値を乗じた数値の n 乗根 ) と区別するために, 算術平均ということもある. 正規分布に近い分布であれば, 観察される個々の数値とそれほどかけ離れた値が平均になることはないが, 極端な数値が含まれる場合や, 分布が歪んでいる場合 ( たとえば CRP 値など ) には, 個々の数値とはかけ離れた平均が観察されることもある. (2) 最頻値 (mode) 以上のような平均の問題点を解除するために最頻値や中央値が存在する. 最頻値は頻度が最も多い値だが, 記述統計と分析統計統計の目的を 2 種類に分けて検討する. データを収集した場合 ( たとえば, 川崎病の全国調査で26,691 人 [ 第 22 回全国調査報告患者数 ] の患者データが集まっていると想起してほしい ), これらのデータの集まりだけでは何もわからない. これをわかりやすく集計して示すのが記述統計である. 一方で, データが得られた標本の状況から, 確率論に基づいて母集団の状況を推計するのが分析統計である. 平均を計算する記述統計よりも t 検定を行う分析統計のほうが高度なことを行っているようにみえるが, 特に臨床医学で重要なのは患者集団の状況を正しく的確に示すことであり, 分析統計よりも記述統計のほうが重要と筆者は考える. なお, 川崎病全国調査の結果はすべて記述統計である. 平成 26 年 3 月 1 日 51

3 率 (rate) と割合 (proportion) 率 (rate) には時間の概念が入っているのに対して, 割合は断面の現象を観察している. すなわち, 率は一定の期間に新たに発症したイベントの頻度を示すものであるのに対して, 割合はある 1 時点でのイベントの状況を示す. 2. 罹患率 (incidence rate) と有病率 (prevalence) 疾病の頻度の観察において, 患者発生について率と割合を用いるものが罹患率と有病率である. ここで注意が必要なのは有病率は日本語表記では 率 を使っているが, 率ではなく割合である. 罹患率は一定期間に発生した患者数を観察した人年で除したものである.1 人年は 1 人の人間を 1 年間観察したことを意味する. 川崎病全国調査では罹患率は 0 ~ 4 歳人口 10 万対年間で表記するのが慣行だが, ある年の罹患率はその年の 0 ~ 4 歳の小児を 1 年間観察したと考えて, これを分母とし, この 1 年間に川崎病に罹患した患者数を分子として算出している. なおこの場合, 分子の患者には 5 歳以上のものが含まれていても構わない. 一方で有病率は, ある時点での観察対象全体に占める患者の割合である. 集団の中での先天性心疾患を持つ者の割合は有病率である. 3. 記述統計 (descriptive statistics) 以上のような指標を軸に集団の特性を示していく統計手法を記述統計という. 4. 分析統計 (analytic statistics) 記述統計に対して, 後述の統計学的推論 ( 観察集団を標本と捉え, 母集団の状況を推論すること ) を行うのが分析統計である. 推定や検定がこれに該当する. 5. 相対危険 (relative risk) と寄与危険 (attributable risk) 複数の集団間で疾病頻度を比較する方法を検討する. 話を単純化するために, 比較する集団は 2 つ ( たとえば, 男と女, 低出生体重児群とそうでない群, など ) としよう. 罹患率でも有病率でも構わないが, 双方の 52 疾病頻度の比を相対危険という. 他方に比べてどれだけ疾病頻度が高いかを示す指標である. 疾病頻度の差を寄与危険という. 曝露群 ( たとえば低出生体重児 ) と非曝露群 ( そうでない者 ) の疾病頻度を考える場合, 曝露群の頻度のうち非曝露群の頻度の分は曝露とは無関係に発生したと考えて, 寄与危険 ( 曝露群の頻度 - 非曝露群の頻度 ) は真に曝露によって発生した頻度と考えることができる. 曝露群の頻度全体に占める寄与危険の割合を寄与危険割合 (attributable risk percent) といい, 曝露群の頻度の中で真に曝露によって発生した割合を示している. さらに, 曝露群と非曝露群の比較ではなく, 集団全体 (= 曝露群と非曝露群で構成される ) と非曝露群との比較を同様に行った場合には, 集団寄与危険 ( あるいは人口寄与危険,population attributable risk), 集団寄与危険割合 ( 人口寄与危険割合,population attributable risk percent) という. 推定 (estimation) と検定 (test) 前述の通り, 観察した対象集団について統計学的に記述するのを記述統計と称するのに対して, 観察した対象集団を母集団からの標本とみなして, 母集団の状況を確率論を用いて推論するのを分析統計という. 推定や検定は分析統計である. 1. 推定と検定の違いいずれも母集団の状況を推論する手法である. 推定には点推定 (point estimation) と区間推定 (interval estimation) がある. 点推定は標本で観察された値をそのまま母集団の推定値とするものであり, たとえばある疾患患者の血圧の平均が 110/75mmHg であったとすれば, 母集団 (= 当該疾患の患者全体 ) の血圧の平均も 110/75mmHg と推定することである. 理論的には, 点推定はこれ以外にはあり得ない. 観察する群が複数の場合でも,2 群間の平均の差の推定値などを計算する. 検定は推定よりも守備範囲が狭く, 結論は あり か なし かの判定結果である. たとえばある疾患の患者の母集団の収縮期血圧の平均が 110mmHg である場合, 観察された標本にたまたま血圧が高い患者が多く含まれていた場合, 標本 100 人の平均が 115mmHg であることもありうるかもしれない. しかし, 標本平均が 150mmHg ということは, 直感的には考えにくい. これを直感ではなく, 確率論的に計算して, 偶然発生した日本小児循環器学会雑誌第 30 巻第 2 号

4 138 表 1. 母集団の真の姿と検定結果の関係 帰無仮説を棄却 ( 有意差あり ) 帰無仮説を採用 ( 有意差なし ) 差がある問題なし第 2 種の過誤母集団の真の姿差がない第 1 種の過誤問題なし第 1 種の過誤の確率 =α, 第 2 種の過誤の確率 =β, 検出力 =1-β のか, それともそうでない ( 統計学的に有意 ) のかを検討するのが検定である.2 群間だと両群の間に有意 (significant) な差があるかどうかの検定となる. 2. 帰無仮説 (null hypothesis) と対立仮説 (alternative hypothesis) 検定は, 仮定した母集団の状況のもとで観察された標本の結果が出現する確率を計算し, その結果から一定の判断を行うものである. 前述の例だと, 母集団の血圧の平均が 110mmHg という仮定のもとで, 標本の平均は 115mmHg であったり,150mmHg であったりする確率を計算する. この場合の仮定を帰無仮説と呼んでいる. 通常, 帰無仮説は明らかにしたいこととは逆のことを設定し, これが検定の結果として棄却 (reject) された場合に, 対立仮説を採用する. たとえば 2 群間の有病率の差の検定では, 帰無仮説として 2 群間に有病率に差はない を設定し, このような条件の下で観察された結果 ( 事象(phenomenon) という) が出現する確率を求め, この確率が一定以下だと帰無仮説を棄却して対立仮説である 2 群間の有病率は差がある を採用することになる. 3. 第 1 種の過誤 (type I error) と第 2 種の過誤 (type II error), 有意確率 (p) 母集団の真の状態 ( たとえば差がある / ない ) と検定結果 ( 有意差あり / なし ) において, 母集団で差がある場合の有意差ありの検定結果と, 母集団に差がない場合の有意差なしの検定結果は, 母集団の状態と検定結果が一致しているので問題はない. 一方で母集団に差がない場合の有意差ありの検定結果は問題であり, これを第 1 種の過誤と呼んでいて, その確率をαで表す. 逆に, 母集団に差がある場合の有意差なしの検定結果を第 2 種の過誤といい, 確率をβで表す ( 表 1). 通常の検定では帰無仮説の元で観察された事象が出現する確率を求める. これを有意確率といい, 通常,p で表現している. そして, 慣習として p が 0.05 以下 (20 回に 1 回しかみられない稀な事象が観察されたと考える ) の時に, 帰無仮説を棄却し, 対立仮説を採用する. このことを逆に考えると, 実は母集団では差がなく誤って帰無仮説を棄却してしまった場合 ( 第 1 種の過誤 ) でも, その確率は 0.05 以下で, それほど大きなものではないということになる. なお,1 からβを減じた数値を検出力 (power) という. 母集団に差がある場合に 有意差あり という検定結果が出てくる確率である. これが高い場合, 検定の結果で有意差がなければ, 母集団で差がない可能性が高い ( ただし断定的なことはいえない ). 4. 信頼区間 (confidence interval) 区間推定では母集団の状況が一定の確率で取り得る範囲を示す. 通常は 95% 信頼区間を提示するが, これは有意確率を 5%(0.05) で区分することの裏返しであり,95% を採用する理論的根拠はない. 標本の状況から点推定値と標準誤差 (standard error, たとえば平均の場合には標準偏差を標本サイズの平方根で除した値 ) を求め, 点推定値 ± 1.96 標準誤差を 95% 信頼区間としている. たとえば母集団の収縮期血圧が 110.5, 95% CI: ~ 120.7) という場合, 母集団の平均は と の間にあると考えて構わないであろう. 5. 統計学的推論の解釈いくつかのポイントがある. まず第 1 に, 推定と検定の結果は, 手段は異なるが同じものを観察しているので, 得られる結論は同じということである. たとえば相対危険の推定と検定を行った場合, 相対危険の 95% 信頼区間が 1.0(= 曝露群と非曝露群で差がない ) を跨ぐ場合には, 相対危険は 1.0 という帰無仮説を有意水準 5% で棄却できない, ということと同等である. ただし, 検定結果は統計学的に有意か否かという 2 者択一の判断でしかないが, 推定ではたとえば 95% 信頼区間が 0.95 ~ 3.44 であれば, もう少しで有意である といったことがわかる. したがって, 推定結果のほうが 平成 26 年 3 月 1 日 53

5 139 得られる情報量が多く, このために検定よりも好まれることになる. 検定は,1 推定を行うことができない場合 ( たとえば 3 群以上の平均の差の観察など ) や,2 標本サイズが小さいために 95% 信頼区間の幅が広すぎて意味をなさないような場合に留めるべきであろう. 通常の検定では第 1 種の過誤の確率しか観察しない. そこで, 得られた有意確率が 0.05 より大きく, 帰無仮説が棄却できない場合でも, 帰無仮説が認められた ということではない. 観察された結果は偶然に起こった可能性も十分にある ということだけであり, 2 群間に差がないことが確認された といったことではない. 検定結果は標本サイズに大きく依存する.2 群間の比較の場合, 群間の差が大きくても標本サイズが小さければ有意とはならない. 一方, 差が医学的には意味がないような小さなものであっても, 標本サイズが大きければ有意な結果が得られる. 統計学的推論は観察された結果が偶然発生したものかどうかを検討しているだけであり, 医学的に意味がある差かどうかについては統計学は何も情報を提供しない. 検定の実際検定には大きく分けて 2 種類ある. 一定の分布 (t 分布, カイ 2 乗分布など ) を仮定して, パラメータ (parameter) を用いて行うパラメトリック検定 (parametric test) と, 分布を仮定する必要なく, したがってパラメータを用いないノンパラメトリック検定 (non-parametric test) である. 標本の分布が大きく外れている場合にはノンパラメトリック検定を使うのだが, 標本サイズが大きいとパラメトリック検定でもさほど問題は生じない. なお, 誌面の関係でここではどのような場合にどの検定を使うかに留め, 実際の検定方法については本稿の最後に示すような統計学の教科書などを参照していただきたい. 1. パラメトリック法 (1) 対応のない t 検定母集団が t 分布に従うことを想定した検定である.2 群間の差の観察に用いるが, たとえば男の患者群と女の患者群の検査値の平均など, 個々の値に対応がない場合に用いる. (2) 対応のある t 検定治療前後の検査値の平均の比較のように, 個々の値 54 に対応がある場合に用いる. たとえば 10 人の患者の治療前後の収縮期血圧の比較を考える. 治療前と治療後でそれぞれ 10 ずつの血圧値があり, 前後の値の平均を算出するが, 前後の値はそれぞれ独立ではなく,1 人の患者で結びついている. そこでこの結びつきに配慮した検定 ( あるいは, 患者 1 人 1 人の治療前後の血圧の差の観察と考えてもよい ) が, 対応のある t 検定である. 対応を崩して, 対応のない t 検定を行うことも可能だが, そうすると第 2 種の過誤を犯す ( 差があるものを見逃す ) 確率が高くなる. (3) カイ 2 乗検定 m n 分割表における一様性の検定である. 最も単純なものは 2 2 分割表で, 表の縦 横とも 2 値のもの ( ある / なし ) で, 基本的には 4 つのセルからなる. イェーツの補正項 ( カイ 2 乗値の公式の分子が { ad - bc - n/2 } 2 n となっていれば,n/2 がイェーツの補正項である ) を入れるかどうかについては, 式からもわかるように入れるとカイ 2 乗値は小さくなり, その結果, 検定の結果は有意に出にくくなるため, 入れたほうが無難である. (4) フィッシャーの直接確率法これは厳密にいうとノンパラメトリック検定だが, 前項の 2 2 表に適用するので, ここで示す.2 2 分割表で一部のセルの値が小さいと検定結果が正しく出ないことがある. 通常いわれているのはセルの期待値 (a のセルの期待値は { a + b } { a + c }/n である ) が 5 を下回るセルが 1 つでもあれば, カイ 2 乗検定ではなくフィッシャーの直接確率法を用いるとされている. 一方で, コンピュータの発達によりフィッシャーの直接確率を計算することもそれほど困難ではなくなったので, カイ 2 乗検定を用いずに, 常にフィッシャーを用いたほうがよいと主張する統計学者もいる. (5) 分散分析 3 つ以上の群間の平均の差の検定の際に用いる. この際に注意しなければならないのは, 分散分析の帰無仮説は すべての群で平均は等しい であり, 対立仮説は 少なくとも 1 つの群では他の群と平均に差がある であり, すべての群で差がある ではないことに注意しなければならない. 通常はまず分散分析を行い, 帰無仮説が棄却された場合には群間の総当たりで差の有無の検定を行う. 2. ノンパラメトリック法前述の通り, 観察する集団が特定の分布に従わない ( ことが予想される ) 場合には, ノンパラメトリック法日本小児循環器学会雑誌第 30 巻第 2 号

6 140 を用いる. ノンパラメトリック法は母集団の分布に依存しないのでどのような場合でも使用することができるが, パラメトリック法と比較して検出力が落ちるため, パラメトリック法が使える場合にはそちらを使用するほうがよい. (1) マン ホイットニーの U 検定対応のない 2 群間の t 検定のノンパラメトリック検定に相当する. 紛らわしいのだが, ウィルコクソンの順位和検定 ( 次項のウィルコクソンの符号付順位和検定とは別物 ) と同じである. (2) ウィルコクソンの符号付順位和検定マン ホイットニーの U 検定 ( ウィルコクソンの順位和検定 ) が対応のない 2 群間の平均の検定なのに対して, ウィルコクソンの符号付順位和検定は対応がある 2 群間の平均の差の検定である. 推定の実際推定には点推定と区間推定がある. 点推定は標本で観察された数値を, そのまま母集団の数値の推定値とするものである. 一見乱暴にもみえるが, 母集団の点推定値はこれ以外にはあり得ない. 区間推定は通常,95% 信頼区間で提示する. 点推定値 ± 1.96 標準誤差で求めることができる. 低い相関係数しか観察されない. 単に相関係数を計算するだけでは 2 変数間の関係の誤った解釈, あるいは見逃しが起こる可能性があるので, 必ず散布図 ( 後述 ) を書いてみることを奨める. 相関係数ほど有意性と意義が誤って理解されているものも少ないかもしれない. 標本サイズが 50 ほどあれば, 相関係数 ( 絶対値 ) が 0.3 程度でも統計学的に有意な結果となる ( 帰無仮説は 母集団の相関係数は 0 ). 相関係数の 2 乗の値を決定係数 (coefficient of determinant) という. これは一方の変数の変動を他方の変数の変動で説明できる部分を示す指標で, 相関係数が 0.3 であれば決定係数は = 0.09, すなわち変動の 1 割も説明できないということである. 統計学的な有意性と意義のある数値かどうかは別の視点であることを再度強調しよう. (1) ピアソンの相関係数通常 相関係数 というと, このピアソンの相関係数を指している. パラメトリック法であり,2 つの数量データが正規分布しているという仮定のものとで使用される. (2) スピアマンの順位相関係数ノンパラメトリック法による相関係数がスピアマンの順位相関係数である. 観察する数量データが正規分布することがあやしい場合には, こちらを用いる. 2. 回帰分析 (regression analysis) 相関と回帰 1. 相関係数 (correlation coefficient) 2 つの数量データの関係を観察する際に用いるのが相関係数である. 相関係数は全く無関係の 0 をはさんで- 1 ~+ 1 の値をとる. 相関係数が- 1 または 1 であるというのは 2 つの変数 x と y の間に y = ax + b という直線的な関係がある場合だが, 人間を含めた生体の観察ではあり得ない. 相関係数の絶対値が 1 に近いほど,2 つの変数の関連は強く, 高い相関がある と表現する. 相関係数を用いる場合に注意しなければならないことがいくつかある. まず第 1 に相関係数は 2 つの変数の直線的な関係しか観察していないということを十分に理解する必要がある. 極端な外れ値があったり, 複数の集団が混在しているような場合には, 変数間に関連がなくても高い相関係数が観察されることがある. 逆に 2 つの変数の間に曲線的な関連がある場合には, 相関係数と同様に複数のデータ間の関連を観察する手法である. 最も単純なものは 2 つの数量データ間の直線的な関係を見るもので,y = a + bx(x と y が観察するデータ ) の関係を導き出す ( 具体的には a と b を求める ) ものである. この場合の x を独立変数 ( あるいは説明変数 ),y を従属変数 ( あるいは目的変数 ) と呼ぶ. 相関係数でも x と y の関係は観察できるが, 相関係数と回帰分析は基本的には異なる解析方法であるし, 同じ変数に対して同時に異なる解析を行うのは感心しない. 相関係数では 2 つの変数間の従属関係はない. わかりやすくいえば, 一方の変数がもう一方の変数を規定するということではなく, たとえば収縮期血圧と拡張期血圧のように単純に関連を観察しているだけである. 一方, 回帰分析では x が y の値を決める ( 影響を与える ) という背景がある. たとえば,x が年齢で,y が収縮期血圧のような場合である. この場合に変数の逆転 (x が収縮期血圧で y が年齢だとすると, 収縮期血圧が年齢の影響を及ぼすことになる ) は, あり得ない. した 平成 26 年 3 月 1 日 55

7 141 がって従属関係が明らかな場合には回帰分析を使用し, 明らかではない, あるいは従属関係の有無がわからないような場合には相関係数を計算するのがよいだろう. 相関係数とは異なり, 複数の独立変数を組み込むこともできる. このような場合を重回帰分析と呼ぶこともある. また, 独立変数は数量データだけでなく, 性別などの質的データを用いることも可能である. さらに, 従属変数は数量データだけでなく,2 値データ ( あり / なし, など ) を用いるロジスティック回帰分析 (logistic regression analysis) や, 生存データ ( 観察対象者の観察期間と観察終了時にイベントが発生しているかどうかの 2 つのデータを組み合わせたもの ) を扱うコックスの比例ハザードモデル (Coxʼs proportional hazard model) なども医学研究ではよく使用される. 医学研究における多変量解析の使用目的は,1 モデルの形成,2 交絡因子の制御のどちらかである. 多変量解析を行う際に悩ましいのは どの変数を独立変数としてモデルに投入するか ということであるが, この 2 つの目的のどちらかで考え方も異なる.1 の場合には, モデルに組み込む独立変数の数は少ないほうがよい ( 少ない独立変数で従属変数の予測ができる ) が, 独立変数の数が多いほどモデルの適合性はよくなる ( 予測値と実際の値が近くなる ) という矛盾した背景がある. そこで, 単変量解析で従属変数と有意な関連があった変数を独立変数としてモデルに投入する, という考えは十分に成立する. 一方 2の場合には単変量解析の結果如何にかかわらず, 交絡因子として作用すると考えられる変数はすべて独立変数として投入するのが正しい考え方である. しかしながら, 数ある独立変数すべてを投入することもできないということで, 便宜的に 単変量解析で有意なものを独立変数とする という処理方法も, 完全に否定するわけではない. 多重比較 (multiple comparison) 前述の通り, 統計学的推定や検定は確率論に基づいて母集団の状態を推論するものである. そしてそこには伝統的に有意確率 0.05 という基本原則がある.20 回に 1 回程度以下のめずらしい事象であれば前提 ( 帰無仮説 ) が誤っていると判断してもよいだろう, という発想である. ということは, 逆に帰無仮説が正しくても 20 回に 1 回程度は統計学的に有意な関係が観察される, ということである.7 つの数量データ間の相関係数を総当た 56 りで観察することを想定しよう. 合計 21 = 7 6 2) 個の相関係数が算出されるが, すべての変数間で関連がなくても 1 つぐらいは p<0.05 で有意となる, ということである. このように, 数多くの検定を行い, その中で一部に有意な結果が観察された時に, たとえ検定の結果は有意であっても, 偶然観察された可能性がある, というのが多重比較の問題である. これを解決する方法として,Tukey の方法や Dunnet の方法など種々の手法が提唱されているが, 決定的な方法はない. しかし, 多重比較の問題が存在するということは少なくとも頭の隅に入れておいたほうがよいだろう. 図の作成医学研究の成果を報告する際によく使う図を紹介する. なお, 用いたデータは 2011 年,2012 年の 2 年間の患者を対象とした第 22 回川崎病全国調査である. 一部の図は既に報告書で示したが, 本稿のために新たに作成したものもある. 1. プロット 箱ひげ図 ( ボックス プロット :box plot) 図 1 に示すように, 全体の分布を示すために用いる. 箱の下の辺は 25 パーセンタイル値 ( 下から数えて 25% 目に相当するものの値 ), 中の線は中央値, 上の辺は 75 パーセンタイル値である. 箱から上下に延びた線の端は最小値と最大値を示す. 2. 棒グラフ (bar chart) 図 2 に示すように, 分布を示すときに用いることが多い. 3. 折れ線グラフ (line chart) 図 3 に示すように, 時系列の変化を示すときに用いるとわかりやすい. 4. ヒストグラム (histogram) 図 4 に示すように, 分布を提示するときに用いる. 棒グラフと異なるのは横のバー同士は密着させ, 間に間隙を入れない. 日本小児循環器学会雑誌第 30 巻第 2 号

8 142 図 1 箱ひげ図の例 図 2 棒グラフの例 5. 帯グラフ次の円グラフとともに構成割合を示すときに用いる ( 図 5). なお, 欧米人には 帯グラフ の概念は無く, 合計を 100% にした横置き積み上げ棒グラフ のようである. 6. 円グラフ (pie chart) 帯グラフと同様に構成割合を示すときに用いる ( 図 6). 複数の集団を比較するときには帯グラフのほうが わかりやすい. 一方, ひとつの集団の構成割合を示すときには角度が視覚的にわかりやすい円グラフのほうがよい. 7. 散布図 (scatter diagram) 図 7 および図 8 に示すように,2 つの数量データの関係を示すときに用いる. 相関係数と回帰分析の項で記載したように,2 つの変数間に従属の関係がない場合 ( 図 7) には, どちらの変数を x 軸に持ってきてもよいが, 一方の変数が一方の変数の値を規定する関係がある場合 ( 図 8) には独立変数 ( 図 8 の場合には日齢 ) を x 平成 26 年 3 月 1 日 57

9 143 図 3 折れ線グラフの例 図 4 ヒストグラムの例 58 日本小児循環器学会雑誌第 30 巻第 2 号

10 144 図 5 帯グラフの例 図 6 円グラフの例 平成 26 年 3 月 1 日 59

11 145 図 7 散布図の例 (1) 図 8 散布図の例 (2) 60 日本小児循環器学会雑誌第 30 巻第 2 号

12 146 軸に持ってくる. 図 7 の場合, 回帰直線 ( 図 8 には記載 されている ) を入れると, おかしなことになる. 参考文献 以上, 日本小児循環器学会 小児循環器専門医修練 目標 に準拠して統計 ( 学 ) の概要を述べたが, 誌面の 関係で項目としてあげたものでも十分に語り尽くせて いない. 以下はすべて著者が関与している統計等に関 する著書だが, 自信を持ってお奨めするので興味があ る方は参照していただきたい. 1) 福富和夫, 永井正規, 中村好一, ほか : ヘルスサイエンスのための基本統計学 ( 第 3 版 ). 東京, 南山堂,2002 初心者用に執筆された統計学の入門書. 2) 中村好一編 : 医療系のためのやさしい統計学入門. 診断 と治療社,2009 次の 論文を正しく読み書くためのやさしい統計学 の姉妹編として, 初心者向けに執筆された書籍. 3) 中村好一編 : 論文を正しく読み書くためのやさしい統計学 ( 第 2 版 ). 診断と治療社,2010 医学論文をまず理解できるようになり, そして見よう見まねで論文に統計の使用ができるようになることを目指した書籍. 4) 中村好一 : 基礎から学ぶ楽しい疫学 ( 第 3 版 ). 医学書院, 2013 第 10 章で主として疫学で使用する統計手法を提示し, エクセルで可能な手法を実例で示している. エクセルでもここまでできるという点を示すとともに, 逆の見方をするとエクセルの限界を提示している. 5) 中村好一 : 基礎から学ぶ楽しい学会発表 論文執筆. 医学書院,2013 第 17 章は 図表の作成. 小児循環器専門医のための総説シリーズ 項立て 掲載号 1 胎児循環生理 2 心血管系の身体所見専門医に必要な循環器系理学所見のポイント 3 薬物について 3-1 利尿薬の使い方 3-2 血管拡張剤について 3-3 その他 4 鎮痛 鎮静 5 肺高血圧の治療戦略 6 失神について 7 呼吸と循環 8 超音波検査の原理から応用 9 心臓カテーテル検査によって得られた結果をどう解釈するか 10 心臓 CT 11 心臓 MRI 12 心臓核医学 13 運動負荷試験について 14 先天性心疾患の非手術歴 ( 自然歴 ) チアノーゼについて 16 ペースメーカのすべて 17 小児の心臓移植について 18 体外循環 19 代表的な手術法その工夫と問題点 20 死亡心臓病学 21 小児循環器専門医に必要な統計学 臨床研究と倫理委員会と個人情報保護 23 川崎病 24 カテーテル治療 25 不整脈治療 26 感染性心内膜炎 27 学校生活, 運動制限 心臓突然死 平成 26 年 3 月 1 日 61

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Chapter 1 Epidemiological Terminology

Chapter 1 Epidemiological Terminology Appendix Real examples of statistical analysis 検定 偶然を超えた差なら有意差という P

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

stat-base_ppt [互換モード]

stat-base_ppt [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 髙木廣文東邦大学看護学部国際広域保健分野 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは? アンケート調査で学生のアルバイト実施を調べる

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

<4D F736F F F696E74202D208EC0926E89758A7782CC82BD82DF82CC939D8C765F939693FA2E >

<4D F736F F F696E74202D208EC0926E89758A7782CC82BD82DF82CC939D8C765F939693FA2E > 1 平成 25 年度地方衛生研究所サーベイランス業務従事者研修 4 月 16 日 14:30 15:30 実地疫学のための統計 2 疫学調査の基本ステップ 1. 集団発生の確認 2. 症例定義 の作成, 積極的な症例の探索 3. 現場および関連施設などの観察調査 4. 症例群の特徴を把握 : 時 場所 人記述疫学ラインリスティング 図式化 5. 感染源 / 感染経路やリスクファクターに関する仮説の設定

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

EBNと疫学

EBNと疫学 ノンパラメトリック検定 94 質的変数と質的変数の関連性を調べる - クロス表 行周辺度数 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 列周辺度数 95 クロス表 - 行パーセント 各行のセルの度数を行周辺度数で割って 100 をかけたもの 行周辺度数 肺がん合計発生発生しない 10%(100

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札 解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札を入れまず1 枚取り出す ( 仮に1 番とする ). 最初に1 番の学生を選ぶ. その1 番の札を箱の中に戻し,

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

stat-base [互換モード]

stat-base [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 高木廣文東邦大学看護学部国際保健看護学研究室 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは?

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

Microsoft PowerPoint 古川杉本SASWEB用プレゼン.ppt

Microsoft PowerPoint 古川杉本SASWEB用プレゼン.ppt ロジスティックモデルと ROC AUC 分析を 組み合わせた検査性能の評価と 疫学基本モデル評価方法 古川敏仁 杉本典子株式会社バイオスタティスティカルリサーチ Test Perforance Evaluation in Epideiological Basic Model Using ROC AUC with logistic regression Toshihito Furukawa, Noriko

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C> 統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8> 第 8 回 t 分布と t 検定 生物統計学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学研究法 Ⅱ のスクーリングを未受講で 心理学統計法 に履修科目を変更された方は 本科目の学習を行ってください

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

仮説検定の手順

仮説検定の手順 2018 年 4 月 4 日 ( 東京 ) 仮説検定とその手順 基礎編 折笠秀樹 ( 富山大学 ) 折笠秀樹富山大学 で検索 折笠秀樹教室 前提 統計学には 記述統計 Descriptive statistics ( ナイチンゲール コレラ ) 推測統計 Inferential statistics (R.A. フィッシャー ) 仮説検定 (Hypothesis testing) 推定 信頼区間 (Estimation/

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード] R で統計解析入門 (4) 散布図と回帰直線と相関係数 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. の場所に移動し, データを読み込む 4. データ DEP から薬剤

More information

Microsoft Word - NumericalComputation.docx

Microsoft Word - NumericalComputation.docx 数値計算入門 武尾英哉. 離散数学と数値計算 数学的解法の中には理論計算では求められないものもある. 例えば, 定積分は, まずは積分 ( 被積分関数の原始関数をみつけること できなければ値を得ることはできない. また, ある関数の所定の値における微分値を得るには, まずその関数の微分ができなければならない. さらに代数方程式の解を得るためには, 解析的に代数方程式を解く必要がある. ところが, これらは必ずしも解析的に導けるとは限らない.

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

因子分析

因子分析 因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

相関係数と偏差ベクトル

相関係数と偏差ベクトル 相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074> 重回帰分析 (2) データ解析演習 6.9 M1 荻原祐二 1 発表の流れ 1. 復習 2. ダミー変数を用いた重回帰分析 3. 交互作用項を用いた重回帰分析 4. 実際のデータで演習 2 復習 他の独立変数の影響を取り除いた時に ある独立変数が従属変数をどれくらい予測できるか 変数 X1 変数 X2 β= 変数 Y 想定したモデルが全体としてどの程度当てはまるのか R²= 3 偏相関係数と標準化偏回帰係数の違い

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

8 A B B B B B B B B B 175

8 A B B B B B B B B B 175 4.. 共分散分析 4.1 共分散分析の原理 共分散分析は共変数の影響を取り除いて平均値を比較する手法 (1) 共分散分析 あるデータを群間比較したい そのデータに影響を与える他のデータが存在する 他のデータの影響を取り除いて元のデータを比較したい 共分散分析を適用 共分散分析 (ANCOVA:analysis of covariance アンコバ ) は分散分析に回帰分析の原理を応 用し 他のデータの影響を考慮して目的のデータを総合的に群間比較する手法

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

Microsoft Word - 第14回定例会_平田様_final .doc

Microsoft Word - 第14回定例会_平田様_final .doc クロスオーバー実験のデザインと解析 - テレメトリー法によ る QT/QTc 試験の実データを用いた検討 - II. クロスオーバー実験の統計解析 4) 有意差検定と信頼区間方式の解析の比較 平田篤由 薬理統計グループ安全性薬理チーム 要約 : ヒトの QT/QTc 評価試験における判断基準は,QTc 間隔の 95% 信頼区間の上限が 10ms を越えるかどうかである. 一方, 非臨床試験のイヌを用いたテレメトリー

More information

Microsoft PowerPoint - SAS2012_ZHANG_0629.ppt [互換モード]

Microsoft PowerPoint - SAS2012_ZHANG_0629.ppt [互換モード] SAS による生存時間解析の実務 張方紅グラクソ スミスクライン ( 株 バイオメディカルデータサイエンス部 Practice of Survival Analysis sing SAS Fanghong Zhang Biomedical Data Science Department, GlaxoSmithKline K.K. 要旨 : SASによる生存時間解析の実務経験を共有する. データの要約

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

Microsoft PowerPoint - 医学統計のつぼ.ppt

Microsoft PowerPoint - 医学統計のつぼ.ppt 日本補綴学会第 114 回学術大会 研究教育研修 Ⅰ 2005.10.1. 医学統計のつぼ 国立保健医療科学院技術評価部 横山徹爾 研究計画 データの整理 検定とは? 数量データの差の検定 質的データの差の検定 検定と区間推定 関連の分析 22 つの数量データの関連 研究計画時に行うこと 目的 仮説を明確に 最終的なまとめの図表を頭に描いておく 統計解析手法も決めておく とはいえ 統計学の基本が分かっていないと

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

相関分析・偏相関分析

相関分析・偏相関分析 相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理 MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う 相関とは

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information