医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 =

Size: px
Start display at page:

Download "医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 ="

Transcription

1 1.. 統計学の基本的な概念 1.1 統計学とは何ぞや? 統計学は沢山のデータを要約し 中に含まれている情報を把握しやすくするための手段 データデータ データデータ データデータ 要約値 ( 統計量 ) 実質科学的評価 < 例 >100 人の日本人について体重を測定した場合 100 個のデータを眺めただけでそこに含まれる情報を読み取るのは困難 100 個のデータのほぼ真ん中を表す要約値として平均値を求める 平均値が 60kg だった 100 人の日本人の体重はだいたい 60kg ぐらいである という情報を読み取ることができる 日本人の体重はだいたい 60kg ぐらいである と推測する 統計学では平均値のような要約値または代表値のことを統計量と呼ぶ 厳密に言うと 確率的に変動 する個々のデータを確率変数と呼び 確率変数 x の関数として定義される値 z=f(x) を統計量と呼ぶ 本書では平均値のように複数のデータを四則演算によって要約した統計量を要約値と呼び そのよ うな要約をしないポイント的な統計量を代表値と呼ぶことにする 要約値は中心極限定理によって近 似的に正規分布するが 代表値は正規分布するとは限らない 1-1

2 医学 薬学分野の研究で用いられるのは推測統計学 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 記述統計学調査対象集団 = 母集団のデータを要約し 母集団の情報を数学的に記述することが中心で 古典統計学とも呼ばれる 国勢調査で用いられる統計手法が代表例 推測統計学または推計学母集団から無作為抽出した標本集団の要約値から母集団の要約値を確率的に推測し それによって母集団の様子を数学的に記述することが中心で 近代統計学とも呼ばれる 科学実験や世論調査で用いられる統計手法が代表例 医学 薬学分野の研究 ( 臨床試験 臨床研究等 ) では主として推測統計学が用いられるが この分野独特の特徴がある 1-2

3 医学 薬学分野の研究は準母集団を対象にする点が特徴 母集団 準母集団 非無作為抽出 逆規定 標本集団 医学 薬学分野の研究では特定の疾患の患者を母集団にすることが多い 患者全体を正確に特定することは事実上不可能 母集団から標本集団を無作為抽出することも不可能 ある医療施設をたまたま受診した患者をとりあえず標本集団にする 標本集団の背景因子 ( 集団の特徴を表す項目 性別 年齢等 ) を調査 背景因子から母集団となるべき集団 = 準母集団を逆規定 論文の最初に載せる患者背景表は準母集団を規定するためのもの 準母集団と本当の母集団は微妙にずれる 同じような研究を行なっても準母集団がずれると結果もずれる 医学 薬学分野の研究の特徴 限界 1-3

4 1.2 データの要約方法 データの要約はグラフ化から 度数 体重図 1.1 度数分布図データを要約する時は まず初めにデータを見やすいようにグラフ化する それには横軸にデータの値を取り 縦軸にそのデータの数をプロットした度数分布図 (frequency distribution) を用いる 一般的な度数分布図では データの値をいくつかの区間に区切り その区間の中に入るデータの数を柱状グラフとしてプロットする < 度数分布図を描くメリット> データを感覚的に把握することができる 百聞は一見にしかず! データの内容についてある程度の情報を得ることができる データの解析方法について有益なヒントが得られる 1-4

5 度数分布図を理想化したものが正規分布 σ=10 度数 μ=60 図 1.2 正規分布 体重 度数分布においてデータの数 無限大 区切り幅 無限小とすると 理想的には正規分布 (normal distribution ガウス分布 ) になる < 正規分布の特徴 > 平均値を中心にして左右対称 平均値の度数が最も多く 平均値から離れるほど度数が減るベル型の分布 数学的な取り扱いが比較的簡単 現実のデータの度数分布を描くと 多くのものが近似的に正規分布になる 厳密に言うと 現実には有り得ない理想分布 理想気体のようなもの 1-5

6 最初の要約値は度数分布の中心を表す平均値 度数分布を眺めながら データ内容を把握するのに適した要約値を検討する 最初の要約値と して 普通は度数分布の中心を表す値である平均値 (mean) を求める 平均値 :m= x= x 1 + +x i + +x n = 1 n x x n n i = i=1 n x i :i 番目のデータ < 平均値の特徴 > 分布の重心を表す 全てのデータを均等に反映する 正規分布では分布の中心を表す 次の要約値はデータのバラツキ具合を表す標準偏差 次の要約値として 普通は度数分布の幅つまりデータのバラツキ具合を表す値である標準偏 差 (SD:Standard Deviation) を求める 偏差 ( バラツキの定義 ): d i =x i m n 2 平方和 :SS=S x x = d i = (x i m) 2 i=1 分散 :V = SS n = d i 2 n = (x i m) 2 n 標準偏差 : s=sd= V = SS n = d i 2 n = (x i m) 2 n 正規分布は例数 平均値 標準偏差によって分布の形が完全に決まる そして現実のデータの度数分布は近似的に正規分布になる そのため普通は例数 平均値 標準偏差によってデータを要約し データに含まれる情報を把握する 1-6

7 < 標準偏差の特徴 > データ 1 個あたりのバラツキ具合を表す 正規分布では平均値から分布の変曲点までの距離になる( 図 1.2 参照 ) 正規分布では平均値 ± 標準偏差の間に全データの約 68% が含まれる 正規分布では平均値 ±2 標準偏差の間に全データの約 95% が含まれる 推測統計学では標本集団の要約値から母集団の要約値を推測することが重要 母集団のデータ 多数データの 数学的要約 記述 記述統計学 ( 古典統計学 ) 母集団 ( 準母集団 ) 無作為抽出 標本集団のデータ 少数データの 数学的要約 記述 推測統計学 ( 近代統計学 ) 逆規定 確率的推測 記述 推測統計学の目的は標本集団の要約値を求めることではなく 標本集団の要約値から母集団の要約値つまり母数 (parameter) を推測すること 常識的には 次のようにして近似的に推測できると考えられる 母平均 ( 母集団の平均値 ):μ m: 標本平均 ( 標本集団の平均値 ) 母分散 ( 母集団の分散 ):σ 2 V : 標本分散 ( 標本集団の分散 ) 母標準偏差 ( 母集団の標準偏差 ):σ SD: 標本標準偏差 ( 標本集団の標準偏差 ) 母数はギリシャ文字で表す習慣がある しかし母分散は V に相当するギリシャ文字がないため σ 2 で表す ところが実際には 母分散と母標準偏差は次の式の方が近似が良い 1-7

8 母分散 :σ 2 SS n 1 =V * : 不偏分散 ( 偏らない分散 ) 母標準偏差 :σ V * =SD * : 不偏標準偏差 ( 偏らない標準偏差 ) 平均値の定義式から 平均値と n 個のデータの間には 1 次従属関係がある この関係から 平均値を固定した時 n 個のデータの中で自由に変動できるデータの個数つまり独立変数の数は (n-1) 個になり これが自由度になる バラツキを生み出すのは独立変数だから バラツキの合計つまり平方和 SS を自由度 (n-1) で割り 1 自由度あたりのバラツキにした方が近似が良い 概念的には 次のように理解するとわかりやすい かも 母集団の分布は左右に広く広がっている 分布の左右の端の部分は度数が少ないため標本集団に抽出される可能性が低い そのため標本集団の分布は左右の端が少し切れている 母集団の標準偏差を推測する時は標本集団の標準偏差よりも少し大きな値にした方が近似が良い 平方和 SS を n で割る代わりに (n-1) で割った値を不偏標準偏差にする 推測統計学では 特に指定しない限り V は不偏分散を表し SD は不偏標準偏差を表す そしてこれは標本集団のバラツキ具合の要約値ではなく 母集団のバラツキ具合の要約値の推測値を意味する 正確には 母数は要約値というよりも母集団の性質を左右する定数のことであり 母数によって確率変数の挙動が決定される 厳密に言うと 不偏分散の平方根は不偏標準偏差にならない しかし不偏標準偏差を正確に計算する のは非常に面倒なので 普通は不偏分散の平方根で母標準偏差を近似的に推測する 1-8

9 標準誤差は母平均値の推測誤差を表す推測統計学独特の要約値 例数 n 例を無作為抽出して標本平均 m を無限回求める SD m = σ n =SE 度数 σ SD μ x m 2 =55 m=μ m 1 =60 母集団のデータの分布標本平均の分布図 1.3 母集団の分布と標本平均の分布 m 標準偏差と標準誤差 (SE:Standard Error) の混同は 統計学 3 大間違いの 1 つ < 標準誤差の求め方 > (1) 母集団から n 例の標本集団を無作為抽出する (2) 標本平均を求め それを m 1 として標本平均の度数分布図にプロットする (3) n 例の標本集団を母集団に戻す (4) 母集団からまた n 例の標本集団を無作為抽出する (5) 標本平均を求め それを m 2 として標本平均の度数分布図にプロットする (6) (1) から (3) を無限回繰り返す (7) すると図 1.3 のような標本平均の度数分布図ができあがる 図 1.3 の標本平均の度数分布について次のことが成り立つ 母集団のデータがどんな分布をしていても この度数分布は漸近的に(n が多いほど ) 正規分布に近似する 中心極限定理 ( 推測統計学の基本定理 ) 標本平均の平均値は母平均と一致する μ= m 1-9

10 μ: 母平均 m: 標本平均の平均値 標本平均の標準偏差は次のような値になる 標準誤差 SD m = σ n SD n =SE SD m : 標本平均の標準偏差 σ: 母標準偏差 n: 標本集団の例数 SD: 不偏標準偏差 SE: 標準誤差標準偏差がデータのバラツキ具合を表す要約値であるのに対して 標準誤差は標本平均のバラツキ具合を表す要約値 これは 母平均を標本平均によって推測する時の推測誤差の大きさを表す推測統計学独特の値である < 標準誤差と標準偏差の使い分け> 80 mean±se mean±sd 60 重量 週図 1.4 体重の推移 A 錠 B 錠図 1.5 錠剤の重量 図 1.4 のように 母平均の変化とその推測誤差範囲を表したい時は標準誤差 μ=m±se : μ を m で推測すると SE 程度の推測誤差がある という意味 図 1.5 のように データのバラツキ具合を表したい時は標準偏差 m±sd : データには m を中心にして SD 程度のバラツキがある という意味 一般には要約値つまり統計量の標準偏差を標準誤差と呼ぶ しかし普通は平均値について議論するこ とが多いので 単に SE と書けば 平均値の標準誤差 つまり SEM(Standard Error of Mean) を指す 1-10

11 1.3 推定の考え方 推定は定量試験 検定は定性試験 統計学的推論 推定 定量試験 母数を推測 ph 計に相当 検定 定性試験 母数が基準値と等しいかどうかを 式で推測 リトマス試験紙に相当 推測統計学は推定 (estimate) と検定 (test) の 2 本柱で成り立っていて 定量試験である推定の 方が重要 しかし実際の研究現場では 推定よりも検定の方が頻繁に利用されている これは 推定は記述式の回答が得られるのに対して 検定は 式の回答が得られることに大 きな原因があると思われる 記述式試験よりも 式試験の方が採点が楽! 点推定はピンポイントの推測 区間推定は幅を持たせた推測 (1) 点推定 母平均 :μ m: 標本平均 母標準偏差 : σ SD= V = SS n 1 : 不偏標準偏差 点推定 (point estimation) は母平均を標本平均で 母標準偏差を不偏標準偏差で推測するピ ンポイント推測 1-11

12 (2) 区間推定 σ SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める 1-α 区間推定 (interval estimation) は ある程度の幅を持たせて母数を推測する < 母平均の区間推定法 > μ 母集団の分布 t(n-1,α) SE m L 図 1.6 区間推定の模式図 m=μ m U μ L m μ U 標本平均の分布と信頼区間 t(n-1,α) SE 標本平均の分布は近似的に正規分布になり標本平均の平均が母平均 μ に 標本平均の標準偏差が標準誤差 SE になる μ±2 SE の範囲に標本平均の約 95% が含まれる ある標本平均 m が μ±2 SE の範囲に含まれる確率は約 95% 逆に m±2 SE の範囲に μ が含まれる確率も約 95% μ=m±2 SE μ L =m-2 SE μ U =m+2 SE μ L ~μ U :95% 信頼区間または信頼限界 ( 母平均が 95% の確率で含まれる区間 ) μ L :95% 信頼区間下限 μ U :95% 信頼区間上限 95%: 信頼係数 厳密に言うと SE に掛ける係数 2 は自由度 (n-1) と信頼係数によって値が少し変わる この係数を t 値と 1-12

13 いい 自由度 (n-1) 信頼係数 100(1-α)% の時の t 値を t(n-1,α) と書く μ=m±t (n 1,α) SE μ L =m t (n 1, α) SE,μ U =m+t(n 1, α) SE t (60,0.05)=2, t (60,0.01)=2.66, t(,0.05)=1.96 等標準誤差 SE は不偏標準偏差 SD を n で割った値だから 例数が多くなるほど小さくなる したがって信頼区間を狭くして母平均の値を精度良く推測するためには データ数を多くするのが一番効率的 下手な鉄砲も数射ちゃ当たる! 推定は 漁師 (Fisher!) が水面に映った魚 (Poisson!) の影 m を見て 魚 μ を捕まえるようなもの 点推定は銛で一突きの方法であり 区間推定は幅のある投網を打つことに相当する 銛は手軽に扱えるが 魚に当たる確率は低い 投網を打つには技術を要するが 魚を捕まえる確率は高くなる そこで普通は点推定で母数を推定しておき 重要な時だけ区間推定を行うのが一般的 標準 偏差は点推定だけ行うのが普通 1-13

14 1.4 有意性検定の考え方 検定は定性試験だから 定量試験である推定結果から判定可能 SD=10 母集団の推測分布 標本集団の度数分布 μ m=60 0 =50 μ L μ U 95% 信頼区間図 1.7 信頼区間と有意性検定検定は 式の定性試験だから 最初に問題を設定する 例えば体重の医学的な正常値を 50kg とすると 問題 : 日本人の平均体重は 50kg か? この 50kg は検定の基準値 μ 0 であり この値は医学的に意義のある値を設定する 例えば医学 的な正常値 治療前の平均値等 この問題を検討するために 日本人全体から無作為に 100 名の標本集団を抽出して体重を測 定したところ 平均値が 60kg 標準偏差 ( 不偏標準偏差 ) が 10kg だったとすると 95% 信頼区間 :μ=60± =60±2 μ=58 62 この推定結果から 日本人の平均体重 = 母平均 μ は 95% の確率で 58~62kg の間にある つま り μ は 95% 以上の確率で 50kg ではないと言える したがって 1-14

15 統計学的結論 : 日本人の平均体重は 50kg ではない 問題の答えは という結論が 95% 以上の確率で正しく 間違っている危険性は 5% 以下である この状態のことを 有意水準 (significance level)5% で有意 または 危険率 (critical rate)5% で有意 と表現する 例えば 95% 信頼区間が 49~71kg だったとすると μ はひょっとすると 50kg かもしれず 95% 以上の確率で 50kg ではないと言い切れない したがって 統計学的結論 : 日本人の平均体重は 50kg ではないと断定できない 問題の答えは保留 この状態のことを 有意水準 5% で有意ではない と表現する この結論は 統計学的結論 : 日本人の平均体重は 50kg である 問題の答えは とは違うことに注意! 例えば 95% 信頼区間が 49~51kg だったら この結論を採用しても良い 保留 というと 何となく非科学的な感じがするかもしれないが 不確かなデータから得られた結果を解釈する時は確定的なことを断言する方がかえって非科学的になる 得られたデータから結論できる限界を明確にすることが 科学的 1-15

16 推定を利用した検定を母集団側から見て手順化したものが有意性検定 σ H 0 : μ=μ 0 SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める 標本平均を t 値に変換する t= m μ 0 SE SE t =1 μ=μ 0 母集団の分布 α/2 α/2 α/2 α/2 p/2 m L m=μ 0 m U -t(n-1,α) 0 t(n-1,α) t(n-1,α) SE t 分布 t o μ L m μ U 標本平均の分布と信頼区間図 1.8 有意性検定の模式図 母集団は永遠に不明のため 標本集団のデータから母数を推測し それによって推定や検定の原理を考える方が研究者にとってはわかりやすい しかし母集団は変動せず標本集団のデータが変動するため 母集団を基準にして推定や検定の原理を考える方が数学者にとってはわかりやすい < 有意性検定 (test of significance) の手順 > (1) 問題を設定する 問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? (2) 帰無仮説 (null hypothesis) と対立仮説 (alternative hypothesis) を設定する 帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 対立仮説 H 1 : 日本人の平均体重は 50kg ではない μ μ 0 または δ=μ-μ

17 (3) 有意水準 = 危険率 α(α エラー ) を決める 1. 統計学の基本的な概念 有意水準を 5% にする α=0.05 信頼係数 (1-α)=0.95 (4) 母集団から n 例の標本集団を無作為抽出する 日本人全体から 100 名の人を無作為抽出 標本集団 (5) 標本集団のデータを測定して要約値を求める 100 名の体重を測定 標本平均 m=60 不偏標準偏差 SD=10 (6) 帰無仮説が正しいと仮定した時の母集団を想定し その母集団から n 例の標本集団を無作為抽出して標本平均を求め それを無限回繰り返した時の標本平均の分布を描く 図 1.8 の母集団の分布と標本平均の分布 μ=μ 0 =50 σ SD=10 SE=1 (7) その標本平均の分布で 母平均を中心にして標本平均の (1-α) が含まれる範囲を求める この時 範囲から外れる左右の端の α/2 の部分を棄却域という 図 1.8 の標本平均の分布で標本平均の 95% が含まれる範囲 2 SE=2 より 下限 m L =48 上限 m U =52 下側棄却域 : 48 以下 上側棄却域 : 52 以上 ( 図 1.8 の標本平均の分布の薄い灰色部分 ) 95% が含まれる範囲の幅は 95% 信頼区間と同じ ( 推定の原理 ) 信頼区間は 60±2 SE より 下限 μ L =58 上限 μ U =62 (8) 実際の標本平均 m が棄却域に入っているかどうかを調べる 方法 1:m と棄却域の上限または下限を比較する 図 1.8 より この方法は母平均の 95% 信頼区間 58~62 に基準値 50 が入るかどうかを調べることと同じであることがわかる 60 は上側棄却域の下限 52 よりも大きいから棄却域に入っている 1-17

18 方法 2:(m-μ 0 ) を SE 単位で測った値 t o =(m-μ 0 )/SE が (m U -μ 0 ) を SE 単位で測った値 (m-μ 0 )/SE よりも大きいかどうか調べる 標本平均から μ 0 を引き それを SE で割った値を t とすると t は図 1.8 の一番右側のような t 分 布になる この t 分布で (m L -μ 0 )/SE=-t(n-1,α) (m U -μ 0 )/SE=t(n-1,α) これは信頼区間を求める時に SE に掛ける係数 t(n-1,α) 2 である t o =(m-μ 0 )/SE=(60-50)/1=10>2 で 2 よりも大きいから棄却域に入っている データから平均値を引いて標準偏差で割ると データの分布の平均値が 0 に 標準偏差が 1 になる これをデータの標準化という t 値は (m-μ 0 ) というシグナルを SE というノイズで割った S/N 比と解釈することも可能 方法 3: 図 1.8 の t 分布において t o から右側の濃い灰色の部分の面積 ( 確率 )=p/2 を計算し (t 値の p 値変換 ) それが α/2 よりも小さいかどうか調べる 実際には t o から右側の分布の面積を 2 倍した値を有意確率 p 値といい この値が α よりも小さいかどうか調べる t o =10 から右側の分布の面積 2=p=10-16 <0.05 だから棄却域に入っている (9) m が棄却域に入っている時 帰無仮説が正しい確率は α 以下になり 対立仮説が正しい確率 は (1-α) 以上になる そこで有意水準 α で有意として 対立仮説を統計学的結論として採用する 有意水準 5% で有意 統計学的結論 : 日本人の平均体重は 50kg ではない (10) m が棄却域に入っていない時は帰無仮説が正しい確率が α よりも大きくなる そこで有意水準 α で有意ではないとして 統計学的結論を保留する 有意水準 5% で有意ではない 統計学的結論 : 保留 (11) 統計学的結論を科学的に評価して 実質科学的結論を下す 有意の時 母集団の平均体重の推測値 60kg は基準値 50kg に比べて 10kg 重い これは医学的に見ると意義のある差である 1-18

19 医学的結論 : 日本人の平均体重は 50kg ではなく それよりも重い 有意ではない時 母集団の平均体重の推測値 60kg は基準値 50kg に比べて 10kg 重い これは医学的に見ると意義のある差だが 推測値の信頼性が低いため確実なことは言えない 医学的結論 : 日本人の平均体重は 50kg よりも重い可能性があるがデータの信頼性が低いので結論は保留する 1-19

20 有意差あり は 実質科学的に差がある という意味ではない n= SD=10 SE= % 信頼区間 ~ n=15 SD=20 SE=5.2 95% 信頼区間 48.9 ~ 71.1 m=50.01 μ 0 =50 図 1.9 有意でも実質科学的には無意味な差 μ 0 =50 m=60 図 1.10 実質科学的に意味があっても有意ではない差 有意 数学的に意味が有る つまり 統計学的結論の信頼性が高い 有意ではない 数学的に意味が無い つまり 統計学的結論の信頼性が低い はっきり言えば 統計学的結論を保留する 有意水準 =(1- 信頼係数 )= 危険率 間違っている危険性がこの値以下の統計学的結論だけを採用することを表す 統計学的結論の合格水準 有意差あり= 実質科学的に有意義な差がある や 有意差なし= 実質科学的に有意義な差はない= 等しい という解釈は大いなる誤解 このような誤解症状は 有意症 (significantosis) とか 有意症症候群 (significant syndrome) と呼ばれる難治性疾患の一種であり 各種学会や厚生労働省等で大流行している この疾患の予防策の第一歩は 有意差あり や 有意差なし という誤解されやすい用語を使わず 差は有意である や 差は有意ではない という用語を使うことである 1-20

21 統計学の役目はデータの要約と要約値の数学的な信頼性を評価すること 標本集団の データ 要約値 ( 統計量 ) 検定 有意である 要約値の実質科学的評価 有意ではない 再実験 統計学的結論保留 実質科学的結論 統計学の守備範囲 実質科学の守備範囲 統計学の役目はデータを要約して 要約値が数学的にどの程度信頼できるかを確率的に評価し それらの情報を実質科学的に評価してもらうために研究者に提供することである その要約値が実質科学的に有意義かどうかを評価するのは あくまでもその分野の研究者の役目である 統計学の守備範囲と実質科学の守備範囲を混同しないこと! 1-21

22 1.5 統計的仮説検定の考え方 1. 統計学の基本的な概念 統計的仮説検定は検出差を設定して有意ではない時も結論を採用する δ*=5 μ L m μ U 95% 信頼区間に μ 0 が含まれない 有意水準 5% で有意 μ μ 0 =50 μ 0 -δ*=45 μ L μ 0 =50 m μ U μ 0 +δ*=55 図 1.11 信頼区間と統計的仮説検定 95% 信頼区間に μ 0 が含まれる 有意水準 5% で有意ではない μ<μ 0 +δ*=55 有意性検定は検定結果が有意の時だけ結論を採用し 有意ではない時は結論を保留する この曖昧さを改善するために開発された手法が統計的仮説検定 (statistical hypothesis testing) 例えば第 3 節の有意性検定と同じ問題を設定し 日本人全体から 100 名の標本集団を抽出して体重を測定したところ 平均値が 51kg 標準偏差( 不偏標準偏差 ) が 10kg だったとすると 問題 : 日本人の平均体重は 50kg か? 95% 信頼区間 :μ=51± =51±2 μ= % 信頼区間に基準値 50kg が含まれているため有意水準 5% で有意ではない 統計学的結論 : 日本人の平均体重は 50kg ではないと断定できないため結論保留 ここで体重の医学的な許容範囲または誤差範囲を ±5kg 以内とする つまり ±5kg よりも小さい体重の変動は医学的に意義がなく 無視できるとすると 45~55kg 以内の体重は実質的に 50kg と変わらないことになる 49~53kg という信頼区間はこの許容範囲にすっぽりと入っているから 次のような結論が 95% 以上の確率で正しいことになる 1-22

23 統計学的結論 : 日本人の平均体重は 45kg よりも重く 55kg よりも軽い = 日本人の平均体重は実質的に 50kg と等しい 問題の答えは この結論は 統計学的結論 : 日本人の平均体重は 50kg である 問題の答えは とは違うが 医学的には実質的に同じ意味になる ±5kg は医学的な許容範囲であり ( 最小 ) 検出差 (scientific significant difference) と呼ばれる 統計的仮説検定は検出差つまり実質科学的な許容範囲または誤差範囲と 信頼区間つまり数学的な誤差範囲を利用して 検定結果が有意ではない時も結論を採用することができる 1-23

24 推定と検出差を利用した検定を母集団側から見て手順化したものが統計的仮説検定 δ* δ* SE H 0 : μ=μ 0 α/2 m L t(n-1,α) SE p/2 m U α/2 t(n-1,2β) SE SE μ L μ 0 m μ U SE H 1 : μ=μ 0 - δ* H 1 : μ=μ 0 +δ* β β μ 0 - δ* m L m U μ 0 +δ* 図 1.12 統計的仮説検定の模式図 < 統計的仮説検定の手順 > (1) 問題を設定する 問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? (2) 帰無仮説と対立仮説と検出差を設定する 帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 1-24

25 対立仮説 H 1 : 日本人の平均体重は 45kg または 55kg である μ=μ 0 ±δ*=μ 0 ±5 または δ=μ-μ 0 =±δ*=±5 有意性検定の対立仮説 日本人の平均体重は 50kg ではない は帰無仮説の否定であり 具体的な仮 説ではない それに対して上記の対立仮説は具体的な仮説である点に注意 (3) 有意水準 α(α エラー ) と検出力 =1-β(β エラー ) を決める 有意水準を 5% にする α=0.05 信頼係数 (1-α)=0.95 検出力を 80% にする (1-β)=0.8 β=0.2 (4) 母集団から n 例の標本集団を無作為抽出する 日本人全体から 100 名の人を無作為抽出 標本集団 (5) 標本集団のデータを測定して要約値を求める 100 名の体重を測定 標本平均 m=51 不偏標準偏差 SD=10 (6) 帰無仮説が正しいと仮定した時の母集団と 対立仮説が正しいと仮定した時の母集団を想定し その母集団から n 例の標本集団を無作為抽出して標本平均を求め それを無限回繰り返した時の標本平均の分布を描く 図 1.12 の 3 種類の標本平均の分布 μ 0 =50 μ 0 -δ*=45 μ 0 +δ*=55 SE=1 (7) 帰無仮説が正しいと仮定した時の標本平均の分布で 分布の左右の端にそれぞれ α/2 の面 積の棄却域を設定する 図 1.12 の標本平均の分布で標本平均の 95% が含まれる範囲 2 SE=2 より 下限 m L =48 上限 m U =52 下側棄却域 : 48 以下 上側棄却域 : 52 以上 ( 図 1.12 の中央の標本平均の分布の薄い灰色部分 ) この時 図 1.12 の左側の標本平均の分布で m L =48kg 以上の範囲の面積 ( 確率 ) は β になり 1-25

26 右側の標本平均の分布で m U =52kg 以下の範囲の面積も β になる これら 2 つの範囲は対立仮説の棄却域に相当する 対立仮説の棄却域は左右の標本平均の分布の片側にしかなく その面積は β/2 ではなく β になる これは μ=μ 0 -δ* と μ=μ 0 +δ* はどちらか一方しか起こらないため β を 2 つに分ける必要がないからである 95% 信頼区間は 51±2 SE より 下限 μ L =49 上限 μ U =53 (8) 実際の標本平均値 m が棄却域に入っているかどうかを調べる 方法 1:m と棄却域の上限または下限を比較する 51 は上側棄却域の下限 52 よりも小さいから棄却域に入っていない 方法 2:μ 0 と m の距離 (m-μ 0 ) が (m U -μ 0 ) よりも大きいかどうか調べる 51-50=1 は 52-50=2 よりも小さいから棄却域に入っていない 方法 3:t 分布において t o から右側の確率 =p/2 を計算して 2 倍し それが α よりも小さいかどう か調べる t o =1 から右側の分布の面積 2=p=0.3198>0.05 だから棄却域に入っていない (9) m が棄却域に入っている時は有意水準 α で有意として 帰無仮説を否定した仮説を統計学的 結論として採用する 有意水準 5% で有意 統計学的結論 : 日本人の平均体重は 50kg ではない これは対立仮説 日本人の平均体重は 45kg または 55kg である の採用ではない点に注意! (10) m が棄却域に入っていない時は有意水準 α で有意ではないとして 対立仮説を否定した結 論を統計学的結論として採用する 有意水準 5% で有意ではない 統計学的結論 : 日本人の平均体重は 45kg よりも重く 55kg よりも軽い (11) 統計学的結論を科学的に評価して 実質科学的結論を下す 1-26

27 有意の時 母集団の平均体重の推測値 51kg は基準値 50kg に比べて 1kg 重い これは医学的に見ると意義のない差である 医学的結論 : 日本人の平均体重は 50kg ではないが 実質的には 50kg と変わらない 有意ではない時 母集団の平均体重は 45kg よりも大きく 55kg よりも小さい これは医学的に見ると実質的に 50kg と等しい 医学的結論 : 日本人の平均体重は実質的に 50kg と等しい 統計的仮説検定には 2 種類のエラーがある 真実 統計的結論 有意 :μ μ 0 有意ではない : μ-μ 0 <δ* H 0 :μ=μ 0 α 1-α H 1 :μ=μ 0 ±δ* 1-β β α:α エラーまたは第 1 種のエラーまたはアワテの言い過ぎ帰無仮説 μ=μ 0 が正しい時に アワテて μ μ 0 と言い過ぎてしまう確率 偽陽性率 β:β エラーまたは第 2 種のエラーまたはボンヤリの見逃し対立仮説 μ=μ 0 ±δ* が正しい時に ボンヤリしていて μ-μ 0 <δ* と見逃してしまう確率 偽陰性率 1-β: 検出力対立仮説 μ=μ 0 ±δ* が正しい時に μ μ 0 と違いを検出する確率 感度 普通は α=0.05 β=0.2 つまり有意水準を 5% 検出力を 80% 程度にする しかし α エラーと β エラーは同等なので 本当は α=β にするのが合理的である 1-27

28 検定には片側検定と両側検定がある 次のような限定した問題の場合 対立仮説が単純になり 帰無仮説が正しいと仮定した時の 標本平均の分布と 対立仮説が正しいと仮定した時の標本平均の分布は図 1.13 のようになる 問題 : 日本人の平均体重は 50kg よりも重いか? μ>μ 0 =50? 帰無仮説 H 0 : 日本人の平均体重は 50kg である μ=μ 0 または δ=μ-μ 0 =0 対立仮説 H 1 : 日本人の平均体重は 55kg である μ=μ 0 +δ*=μ 0 +5 または δ=μ-μ 0 =+δ*=+5 δ* SE H 0 : μ=μ 0 t(n-1,2α) SE p m U α t(n-1,2β) SE μ L μ 0 m μ U SE H 1 : μ=μ 0 +δ* β m U μ 0 +δ* 図 1.13 統計的仮説検定の模式図 ( 片側検定 ) 1-28

29 図 1.13 のように帰無仮説が正しいと仮定した時の標本平均の分布の片側だけに棄却域を設定する検定を片側検定 (one-taild test) といい 図 1.12 のように分布の両側に棄却域を設定する検定を両側検定 (two-taild test) という < 片側検定の特徴 > 有意水準 α を分布の片側だけに割り振るため 棄却域の下限値 m U が両側検定の m U よりも少し小さくなる 統計学の教科書などに載っている t 分布表は普通は両側検定用なので 片側検定の時は t(φ,2α) を用いる必要がある 検定の基本は片側検定であり 問題に合わせて適切な検定統計量を選択すれば全ての検定は片側検定として実施可能 区間推定にも片側信頼区間と両側信頼区間がある 片側信頼区間は下限を-- にして上限を μ U するか 下限を μ L にして上限を にする しかし片側信頼区間は不自然で使いづらいので 普通は両側信頼区間を用いる F 検定は t 検定の両側検定と同等の片側検定 σ SD n SE= SD n n 例を無作為抽出して標本平均を無限回求める 標本平均を F 値に変換する F=( m μ 2 0 SE ) p/2 p μ=μ 0 m=μ 0 m 0 F 母集団の分布 標本平均の分布 F 分布 図 1.14 標本平均の分布と F 分布 問題 : 日本人の平均体重は 50kg か? μ=μ 0 =50? この問題を検定したい時 t 値を平方した F 値を検定統計量にすれば t 検定の両側検定と同 1-29

30 等の検定を片側検定として行うことが可能 このように F 値を利用した検定のことを F 検定という F 検定は分散分析でも用いられる 両側検定は標本平均の分布の両側に棄却域を設定する検定であり 母平均が基準値と異なっているかどうか つまり母平均が基準値よりも小さいか それとも基準値よりも大きいかという 2 種類の仮説を検定するものではないので注意! 検定の基本は片側検定なので 母平均が基準値よりも大きいか? という問題を検定したい時は片側の t 検定を用い 母平均が基準値と異なっているか? という問題を検定したい時は片側の F 検定を用いるのがお薦め 1-30

31 統計的仮説検定は事前に試験の必要例数を計算しなければらない 図 1.12 より 統計的仮説検定では δ*={t(n-1,α)+t(n-1,2β)} SE という関係がある この式と SE=σ/ n から 標本集団の例数を理論的に求めることが可能 それを必要例数の計算式といい この式を利用して試験計画の段階で必要例数を求める n= [ {t(,α)+t (, 2β)} σ δ * ] 2 σ: 母集団の標準偏差推測値 予備試験や先行研究の結果から推測 σ は事前の推測値のため 実際に標本集団のデータから推測した母標準偏差推測値とは異な る時がある そこで試験終了後 実際の例数と母標準偏差推測値から実際の検出差 δ を計算し それが事 前に設定した検出差 δ* 以下であるかどうかを検討する これを検出力分析 (power analysis) とい う δ={t(n 1, α)+ t(n 1,2β)} SE SE= SD n 簡単に言えば これは統計的仮説検定は信頼区間つまり数学的な誤差範囲を 検出差つま り実質科学的な誤差範囲以下にしなければならない という意味である 信頼区間の幅は SE に比例し SE は n に反比例して小さくなるため 信頼区間を検出差以下 にするのに必要な例数 つまり標本集団の例数を理論的に求めることが可能になる 1-31

32 検定結果だけから実質科学的な判断をするのは危険! δ* (1) (2) (3) (4) (5) μ 0 -δ* (6) μ L m μ U μ 0 μ 0 +δ* 図 1.15 検定結果と信頼区間 検定結果推定結果実質科学的な判断 (1) 有意ではない μ μ 0 (2) 有意ではない μ=μ 0 ~μ 0 +δ* 母平均は基準値とほぼ等しい この結果だけでは判断できない 検出力をもっと高くする必要がある ( 例数を増やす ) (3) 有意 μ 0 <μ<μ 0 +δ* 母平均は基準値と実質的に変わらない (4) 有意 μ μ 0 +δ* (5) 有意 μ μ 0 +δ* 母平均は基準値と実質的に変わらない可能性が高い 母平均は基準値よりも大きい可能性が高い (6) 有意 μ 0 +δ*<μ 母平均は基準値よりも大きい 図 1.15 と上表から 実質科学的な判断は定性試験である検定結果よりも 定量試験である推定結果に基づいた方が良いことと 検定結果だけから実質科学的な判断をするのは危険であることがわかる このことから検定廃止論を主張する統計学派が存在する 実際 生物学的同等性試験では推定結果を重視し 検定結果は参考程度である 1-32

33 第 1 章 演習問題 第 1 問次の文章について正しいものには を 間違っているものには を付けよ (1) 推測統計学は近代統計学と呼ばれることもある ( ) (2) 標準偏差はデータのバラツキ具合を表し 標準誤差と呼ばれることもある ( ) (3) 検定は厳密な結論が得られるため 検定を行えば推定を行う必要はない ( ) (4) 検定の有意水準は試験計画段階で決めておく必要がある ( ) (5) 有意差あり とは 医学的に有意義な差がある という意味である ( ) 第 2 問 次の文章の括弧の中に 下記の罫線枠の中から適当な語句を選んで入れよ 推測統計学は標本集団の要約値から ( 1 ) の要約値つまり母数を確率的に推測する が その推測方法には ( 2 ) と ( 3 ) の 2 種類がある ( 2 ) は母数がどのくらいの値なのかを推測する手法であり ( 4 ) に相当する それに対し て ( 3 ) は母数が実質科学的に有意義な基準値と等しいかどうかを 式で推測す る手法であり ( 5 ) に相当する 母集団標本集団武装集団推定検定不安定定量試験定性試験共通 1 次試 験 第 3 問 次の文章の括弧の中に適当な語句を入れよ 統計的仮説検定では 母平均と基準値が等しい という ( 1 ) が正しいにもかか わらず あわてて 母平均と基準値は異なる と言い過ぎてしまう確率 α のことを α エラーまたは ( 2 ) または ( 3 ) といい これは診断学における ( 4 ) に相 当する それに対して 母平均は基準値に ( 5 ) をプラスまたはマイナスした値と等し い という ( 6 ) が正しいにもかからわず ぼんやりして 母平均は基準値 ±(

34 ) の範囲内である と差を見逃してしまう確率 β のことを β エラーまたは ( 7 ) といい これは診断学における ( 8 ) に相当する そして (1-β) のことを ( 9 ) とい い 診断学における ( 10 ) に相当する 第 4 問 次の条件で行う試験について必要例数を求めよ またその試験の結果について 検出力分析を行い 試験の検出力が事前の条件を満足しているかどうかを検討せよ 試験内容 : ある疾患について評価項目の平均値を基準値と比較する試験 (1 群試験 ) 試験条件 : 有意水準 5% 検出力 80% 評価項目の検出差 2 母標準偏差推測値 5 試験結果 : 例数 61 例 評価項目の不偏標準偏差 6 t(,0.05)=1.96, t(,0.4)=0.842, t(60,0.05)=2, t(60,0.4)=0.848 第 5 問 有意性検定と統計的仮説検定の違いを説明し 両者の長所と短所について論ぜ よ 1-34

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8> 第 8 回 t 分布と t 検定 生物統計学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, . 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を

More information

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63> 第 5 回統計的推定 実験計画学 A. 統計的推定と検定母集団から無作為抽出した標本から母集団についてなんらかの推論を行う. この場合, 統計から行う推論には統計的 ( ) と統計的 ( ) の 2つがある. 推定統計的に標本の統計量から母集団の母数 ( 母平均, 母標準偏差など ) を推論することを統計的推定という. 例 : 視聴率調査を 200 人に対して行い, 番組 Aの視聴率を推定した. 検定統計的に標本の統計量から母数に関する予想の真偽を検証することを統計的検定という.

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 17 回 講義 母平均の区間推定 Part- 016 年 6 14 ( )3 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u toyama.ac.jp website: http://www3.u toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.jp website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

統計学の基礎から学ぶ実験計画法ー1

統計学の基礎から学ぶ実験計画法ー1 第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - Statistics[B] 講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 kkarato@eco.u-toyama.ac.jp

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団 統計学 Ⅱ(16 11-1 章 11 章母集団パラメータの推定 1. 信頼区間 (1 点推定と区間推定 ( 区間推定のシミュレーション (3 母平均 μの信頼区間 (4 母比率 pの信頼区間 (5 母比率 pのより厳密な信頼区間. 点推定量の特性 (1 標本平均 X の持つ望ましい性質 ( 不偏性 (3 推定量の分散と有効性 (4 平均 乗誤差 MEと最小分散性 (5 一致性 (6 チェビシェフの不等式

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Microsoft Word - Stattext07.doc

Microsoft Word - Stattext07.doc 7 章正規分布 正規分布 (ormal dstrbuto) は 偶発的なデータのゆらぎによって生じる統計学で最も基本的な確率分布です この章では正規分布についてその性質を詳しく見て行きましょう 7. 一般の正規分布正規分布は 平均と分散の つの量によって完全に特徴付けられています 平均 μ 分散 の正規分布は N ( μ, ) 分布とも書かれます ここに N は ormal の頭文字を 表わしています

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

untitled

untitled 分析の信頼性を支えるもの データ評価のための統計的方法 確率分布と平均値の推定 検定 田中秀幸 1 はじめに前回は, 統計的手法を適用するために意味のあるデータをどのように取得するのかについて, 母集団と標本について, 期待値 分散 標準偏差について解説した 今回は, 統計的推定 検定の基礎となる確率分布とその確率分布を用いた推定 検定について解説する 2 確率分布 測定データを取得したとき, そのデータのばらつきを視覚的に表すために,

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て . 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,0 年に 回の渇水を対象として計画が立てられる. このように, 水利構造物の設計や, 治水や利水の計画などでは, 年に 回起こるような降雨事象 ( 最大降雨強度, 最大連続干天日数など

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n 0, p 6 の二項分布になる さいころを 0 回振ったときに が 0 回出る

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

_KyoukaNaiyou_No.4

_KyoukaNaiyou_No.4 理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回 ( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円 前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ 区間推定に基づくサンプルサイズの設計方法 7.7. 株式会社応用数理研究所佐々木俊久 永田靖 サンプルサイズの決め方 朝倉書店 (3) の 章です 原本とおなじ 6 種類を記述していますが 平均値関連 4 つをから4 章とし, 分散の つを 5,6 章に順序を変更しました 推定手順 サンプルサイズの設計方法は, 原本をそのまま引用しています R(S-PLUS) 関数での計算方法および例を追加しました.

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint slide2forWeb.ppt [互換モード] 講義内容 9..4 正規分布 ormal dstrbuto ガウス分布 Gaussa dstrbuto 中心極限定理 サンプルからの母集団統計量の推定 不偏推定量について 確率変数, 確率密度関数 確率密度関数 確率密度関数は積分したら. 平均 : 確率変数 分散 : 例 ある場所, ある日時での気温の確率. : 気温, : 気温 が起こる確率 標本平均とのアナロジー 類推 例 人の身長の分布と平均

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft Word - apstattext05.docx

Microsoft Word - apstattext05.docx 5 章 群間の量的データの検定 5. 対応のない検定手順例えば 男女の成績を比較しようとして試験を実施した場合 男性の集団 ( 群 ) と女性の集団 ( 群 ) との比較になりますから つの集団に同一人物は 人もいません しかしその試験で英語と国語の平均点を比較する場合 英語と国語を受験した集団には必ず同じ人がいます 前者のような場合を対応のないデータ 後者の場合を対応のあるデータと呼びます 対応のあるデータについては特別の処理ができるので

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

スライド 1

スライド 1 計測工学第 12 回以降 測定値の誤差と精度編 2014 年 7 月 2 日 ( 水 )~7 月 16 日 ( 水 ) 知能情報工学科 横田孝義 1 授業計画 4/9 4/16 4/23 5/7 5/14 5/21 5/28 6/4 6/11 6/18 6/25 7/2 7/9 7/16 7/23 2 誤差とその取扱い 3 誤差 = 測定値 真の値 相対誤差 = 誤差 / 真の値 4 誤差 (error)

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

モジュール1のまとめ

モジュール1のまとめ 数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算 統計学テキストの69ページに 平均偏差 分散 標準偏差 変動係数 標準誤差 信頼区間に関する記述がある 分布を考える分布の中心の位置 ( 例 ) 65 53 44 78 50 の数値の算術平均は (65+53+44+78+50)/5=58 である 此れだけでは 分布の状態がわからない ばらつきの程度を表すには最大値と最小値との差 (78-44)=34 これをレンジ ( 範囲 ) と言う しかし 両端の数字だけでは

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

数値計算法

数値計算法 数値計算法 011/5/5 林田清 ( 大阪大学大学院理学研究科 ) レポート課題 1( 締め切りは 5/5) 平均値と標準偏差を求めるプログラム 入力 : データの数 データ データは以下の 10 個 ( 例えばある月の最高気温 ( )10 日分 ) 34.3,5.0,3.,34.6,.9,7.7,30.6,5.8,3.0,31.3 出力 :( 標本 ) 平均値 標準偏差 ソースプログラムと出力結果をメイルの本文にして

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx 都市工学数理 浅見泰司 東京大学大学院工学系研究科教授 Yasushi Asami 1 0. 統計学的検定の基本 母集団と標本 世論調査では 日本人全員に聞くというのは事実上不可能 そこで 日本人全員 (= 母集団 ) から 一部 (= 標本 ) を選んで そこで得られた傾向 (= 仮説 ) が日本人全体にもある程度の信頼性で成り立つかどうかを考える (= 検定 ) 注意 サンプリングの方法 ランダムサンプリングが基本

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日

日経平均株価の推移 ( 円 ) 5,, 15, 1, 5, ( データ ) 日経 NEEDS 3 日本株価の推移 (1 年 1 月 =1) 5 日経平均 TOPIX JASDAQ ( データ ) 日 3. 株式投資のリスクとリターン 経済統計分析 (1 年度春学期 ) 株式投資のリスクとリターン ( 統計分析手法 ) 成長率 ( 株価上昇率 ) 指数 平均 分散 標準偏差 相関係数 分布と確率の計算 信頼区間の推定 ( 点推定と区間推定 ) 仮説検定 ( 平均値の検定 平均差の検定 ) ( 経済理論等との関連 ) 金融資産価格 ( 株価 債券価格 為替レート ) の決定要因 相互関連 リスクとリターンの関係

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 )

3. 株式投資の リスクとリターン 経済統計分析 (2015 年度春学期 ) 3. 株式投資の リスクとリターン 経済統計分析 (15 年度春学期 ) 株式投資のリスクとリターン ( 統計分析手法 ) 成長率 ( 株価上昇率 ) 指数 平均 分散 標準偏差 相関係数 分布と確率の計算 信頼区間の推定 ( 点推定と区間推定 ) 仮説検定 ( 平均値の検定 平均差の検定 ) ( 経済理論等との関連 ) 金融資産価格 ( 株価 債券価格 為替レート ) の決定要因 相互関連 リスクとリターンの関係

More information

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな 第 3 章統計的手法に用いられる分布 第 節我々の身の回りにある代表的分布と性質. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布になっているかを明確に表現し 分析 比較を行えるようにしなければなりません この手法を覚えるようにしましょう () 分布の示し方収集した分布の全体的状態を目視で確認 比較するためには

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良

More information

Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

Microsoft Word - reg2.doc

Microsoft Word - reg2.doc 回帰分析 重回帰 麻生良文. 前提 個の説明変数からなるモデルを考える 重回帰モデル : multple regresso model α β β β u : 被説明変数 epled vrle, 従属変数 depedet vrle, regressd :,,.., 説明変数 epltor vrle, 独立変数 depedet vrle, regressor u: 誤差項 error term, 撹乱項

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル

ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル ロペラミド塩酸塩カプセル 1mg TCK の生物学的同等性試験 バイオアベイラビリティの比較 辰巳化学株式会社 はじめにロペラミド塩酸塩は 腸管に選択的に作用して 腸管蠕動運動を抑制し また腸管内の水分 電解質の分泌を抑制して吸収を促進することにより下痢症に効果を示す止瀉剤である ロペミン カプセル 1mg は 1 カプセル中ロペラミド塩酸塩 1 mg を含有し消化管から吸収されて作用を発現する このことから

More information

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63> 第 回相関分析 9 年 月 日 A.つの変数間の関係を調べる. 散布図を書く例 水稲の収量に関連のある生育指標を知りたい. 例えば草丈と収量には関連があるだろうか? 例 トマトの糖度は施肥量によってどのように変化するかを知りたい. 例えば, 窒素施肥量を増加させると糖度はどうなるか? 散布図の書き方 )x 軸 ( 横軸 ) には原因となる変量を, y 軸 ( 縦軸 ) には結果となる変量をとる. サツマイモの収量

More information

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫りにするために スペクトルを滑らかにする操作のことをいう 6.1 合積のフーリエ変換スペクトルの平滑化を行う際に必要な 合積とそのフーリエ変換について説明する 6.2 データ

More information