日本経営システム学会

Size: px
Start display at page:

Download "日本経営システム学会"

Transcription

1 統計的検定における多重比較に関する一考察 名古屋大学古橋武 A Study on Multiple Comparisons in Statistical Test Nagoya University Takeshi Furuhashi 1 はじめに多重比較は研究者にとって間違いやすく, いささかならずややこしい問題である. 本稿は統計的検定における多重性の問題について, 全て Excel のシミュレーションによる具体例を紹介しながら, 多重比較法の基本的な考え方を解説する. シミュレーションは Excel2007 を用いている. 本稿中の Excel ファイルは全て次の URL よりダウンロードできる. ion/multiple_comparison/index.html 多重比較法の進展は, 各手法が提案された順序を無視すれば,FWER = αを確保しながら, いかにして閾値を緩めるか, という観点から見ることができる. シダックの方法は事象間が独立であるとして閾値を決定している. テューキーの方法は, 事象間に相関がある検定において, 閾値を緩めている. 下位検定法 ( ヘイター フィッシャー方法 ) は上位検定法 ( 分散分析 ) よりもデータ群数を 1 つ減らして閾値を決定でき, 閾値を緩められる. ホルムの方法では, この考えを推し進めて, データ群数を 1 つずつ減らしながら下位検定を繰り返すことで, 閾値のさらなる緩和を実現している.FDR は FWER とは異なる新しい発想で, 閾値の大幅緩和に成功している. 本稿では, これらの手法をシミュレーション例を付して紹介する. 本稿の最後では, 多重比較法を深く理解するための課題を提示する. かったのに帰無仮説を棄却しない確率は第 2 種の 過誤と呼ばれる. 通常, 統計的検定は第 1 種の過 誤の確率を有意水準以下とする. 図 2.1 は 1 つの組の中でステューデントの t 検 定を 2 回繰り返すことを 1000 組について実施する シミュレーション画面の抜粋である. 図説の xxx.xlsm はこのシミュレーション用の Excel のフ ァイル名である. 多重比較とは 1 つの組の中で検 定を複数回繰り返すことである. 図の例では, 独 立な事象 X 1,X 2 の母分散をそれぞれ µ 1,µ 2 とする と, 帰無仮説 H 1, H 2 を HH 1 : μμ 1 = μμ 0 (2.1) HH 2 : μμ 2 = μμ 0 としている. ここで, 帰無仮説 H 1, H 2 はファミリ ーと呼ばれる. 多重比較における Family-wise Error Rate (FWER) は FWER = PPPP {VV 1} (2.2) と定義される.V は帰無仮説のファミリーの中で 2 多重性の問題 帰無仮説が正しかったのに棄却してしまう過誤 は第 1 種の過誤と呼ばれる. 逆に対立仮説が正し 図 2.1 ステューデントの t 検定を 2 回繰り返すことを 1000 組実施するシミュレーションの画面 (t 検定 (2 事象 ) のシミュレーション.xlsm)

2 第 1 種の過誤が起きる回数である.FWER はファ ミリーの中で第 1 種の過誤が少なくとも 1 回起き る確率である. 各事象のサンプルサイズ n = 9 である. セル B7 ~B15 に事象 X 1 の第 1 組のサンプル値が計算され ている. 各サンプル値は NORMDIST(RAND(), µ 0, σ 0) 関数により平均 µ 0, 標準偏差 σ 0 の正規乱数が生 成されている.µ 0 と σ 0 はセル B4, C4 にてそれぞれ 1 に指定されている. セル B16 で平均値 xx 1 が, セ ル B17 で不偏分散 vv ee 2 が計算されている. セル B18 では tt 1 = xx 1 μμ 0 vv ee 2 /nn (2.3) により検定統計量が計算されている. この t 値は 自由度 8 (= n - 1) の t 分布に従うことが知られてい る. また, セル B19 では TDIST(t, n-1, 2) 関数によ り両側検定の場合の p 値が求められている. ここ で,3 番目の引数の 2 は両側検定の指定である. セル B20 では p 値がセル F4 の有意水準を下回っ た場合に 1 が出力される. この例では, セル B20 が 1 であるので, 第 1 組の事象 X 1 の帰無仮説 H 1 は棄却されている. サンプルは µ 0 と σ 0 に従った正 規乱数であるので, 正しい帰無仮説が棄却された ので, ここで第 1 種の過誤が起きている. C 列のセル C6~C20 では事象 X 2 の 9 個のサン プルに対して t 検定が実施されている. セル B21 では B20,C20 の少なくともいずれかで 1 となっ た場合に 1 が出力される. これが 1 であれば, 帰 無仮説のファミリーの中で第 1 種の過誤が起きた ことを意味する. この Excel ファイルではセル B5~C21 を横に 1000 組コピーしてある. セル B23 では第 21 行目 の中の 1 の数を数えて, 全体の組数 1000 で割り, 第 1 種の過誤の起きた頻度が求められている. そ れぞれの検定における閾値を α とすると 2 重の検 定の場合の FWER は で,FWER = である. 図の例では という値が得られている.1000 組のシミュレーションでは確率的ゆらぎが大きいので, この 1000 組のシミュレーションを 100 回繰り返すマクロを作成して, 第 1 種の過誤の確率の平均値を求め, その 95% 信頼区間を計算した. マクロは当該 Excel ファイルのメニューバーの 開発 マクロ 実行 とクリックすることで実行できる. マクロの中身は 実行 の代わりに 編集 をクリックすることで見ることができる. 結果を第 26 行目に示す. 第 1 種の過誤の確率の真値が 95% の確率で ~ の範囲内にあることが分かる. 図 2.2 は, 独立な事象 X 1, X 2 の場合の t 分布の結合確率密度関数の鳥瞰図 ( 同図 (a)) と等高線を描いた平面図 ( 同図 (b)) である. ステューデントの t 検定において, 両側検定の場合,p 値 = 0.05 に対応する検定統計量 t = である. 図 2.3 は図 2.2 において, t > の領域を示す. 鳥瞰図では t < の領域の値を 0 としている. t > の領域は小さな山として残っている. 平面図 (a) 鳥瞰図 t 2 t 1 FWER = 1 (1 α) 2 (2.4) となる. セル F4 にて α = 0.05 と設定されているの (b) 平面図 図 2.2 独立な事象 X 1, X 2 の場合の t 分布の結合確率密度関数

3 (a) 鳥瞰図 t 2 t α 図 3.1 シダックの方法による検定を 1000 組実施するシミュレーションの画面 ( シタ ックの方法 (2 事象 ) のシミュレーション.xlsm) -t α -t α (b) 平面図 図 2.3 t 検定を 2 重に繰り返す場合の第 1 種の過誤の領域 (t α = 2.306) 図 2_2 では t > の領域を黒く塗ってある. 第 1 種の過誤の確率は t > の領域の体積で与え られる. この体積が である. このように 1 つの組の中で検定を複数回繰り返 すことで, 第 1 種の過誤が有意水準 α を超えてし まう問題が多重性の問題と呼ばれる. t α t 1 α = 1 (1 FWER) 1 2 (3.3) = と求められる.α' は名義水準と呼ばれる. シダッ クの方法は, 各検定の p 値が名義水準 α' を下回 った場合に帰無仮説を棄却する. この方法は, FWER = α を保証する. 図 3.1 はシダックの方法により 2 重の検定を 1000 組実施するシミュレーション画面の抜粋で ある. 図 2.1 との違いは, 各検定における p 値の 閾値をセル G4 にて名義水準 α' = としてい る点だけである. 第 20 行目の各セルでは,p 値が α' を下回った場合に 1 が出力されている. 第 26 行目より,FWER = 0.05 となる結果が得られてい 3 多重比較法 [1, 2, 3] る. 図 3.2 は図 2.3 と比較すると, 閾値 t a' = と 多重比較法は, 有意水準を α とすると FWER α (3.1) とする手法である. 3.1 シダックの方法 [4] 同じ組の中で検定を 2 回繰り返す例を取りあげ る. 事象 X 1, X 2 は独立とする. 帰無仮説のファミ リーは HH ii :μμ ii = μμ 0 ii = 1, 2 (3.2) である.(2.4) 式において,FWER = 0.05 とする閾 値を α' とすると して, 黒塗りの部分を狭くしてある. この t > t a' の領域が, 事象 X 1, X 2 の少なくとも一方において 検定統計量の t 値が閾値を超えた場合に, 対応す る帰無仮説を棄却する領域である. この領域の体 積を 0.05 (= FWER) としている. なお, ボンフェローニの方法はシダックの方法 の簡略法である. 同じ組の中で N 回検定を繰り返 す場合は α = FWER/NN (3.4) とする. ボンフェローニの方法は (3.3) 式を N 回検 定を繰り返す場合に拡張した場合と較べて

4 FWER/NN < 1 (1 FFFFFFFF) 1/NN (3.5) が常に成立する. 計算機が身近になかった時代に は便利な方法であった. 3.2 テューキーの方法 [5] 前節の例では, 検定対象である事象 X 1, X 2 の平 均値は独立であった. 検定の課題には各事象の母 平均の差の検定がある. 帰無仮説のファミリーを HH 12 :μμ 1 = μμ 2 HH 13 :μμ 1 = μμ 3 (3.6) HH 23 :μμ 2 = μμ 3 とする. 事象 X 1, X 2, X 3 が互いに独立であっても, 平均値の差 XX 1 XX 2, XX 1 XX 3, XX 2 XX 3 には従属関係 がある. t α 図 3.2 シダックの方法 (t α = 2.743) t α - t α - t α t 1 図 3.3 平均値の差の検定 (3 事象, 多重比較を考慮せず ) を 1000 組実施するシミュレーション ( 平均値の差の検定 (3 事象 ) シミュレーション.xlxm) t 2 まず, 多重比較を考慮しないシミュレーション を実施する. 図 3.3 は, 互いに独立な事象 X 1, X 2, X 3 の平均値の差について t 検定を 3 回繰り返すこと を,1000 組実施した場合のシミュレーション結果 である. セル B19, C19, D19 でそれぞれ xx 1 xx 2, xx 1 xx 3, xx 2 xx 3 が計算されている. セル B20, C20, D20 の検定統計量 q ij (i, j = 1, 2, 3, ii jj) は次 式による. qq iiii = xx ıı xx ȷȷ / 2vv 2 EE /nn (3.7) ただし,vv EE 2 は各事象の不偏分散の平均値であり, 平均平方と呼ばれる. 検定統計量 q ij は, データ群 数 ( 事象の数 ) を N, 各事象のサンプルサイズを n とすると, 自由度 ν = NN(nn 1) (3.8) の t 分布に従う. 図 3.3 の例では N = 3, n = 9 であ る. セル F4 の閾値 q 0 は,TINV(α, N(n-1)) ( ただし, α = 0.05) によって求められた値である. もし, 平 均値の差 XX 1 XX 2, XX 1 XX 3, XX 2 XX 3 が互いに独立で あれば,(2.4) 式を参考に,FWER=0.143 となると 期待されるが, これらには従属関係があるため, FWER の 95% 信頼区間は ~ と得られ ている. 図 3.4 は N = 3, n = 9 のデータを 1 千万組生成し て,q 12 値と q 13 値の分布を求めた結果である.q 12 値 と q 13 値の結合確率密度関数の鳥瞰図と平面図であ る. 図中の縞模様は等高線である.q 12 と q 13 は独立 ではないため結合確率分布は楕円形状となっている. テューキーの方法は, 検定統計量 q ij の最大値 q max の確率分布から, FWER = PP{qq mmmmmm qq mmmmmm0 } = αα (3.9) とする閾値 q max0 を与える.α = 0.05 のとき q max0 はステューデント化された範囲の 5% 点と呼ばれ る.q max0 は解析的には求められないため [1][3], 数 値計算により求められた数表が作成されている. このステューデント化された範囲の 5% 点の数表 より N = 3, ν =24 のとき qq mmmmmm0 = 3.532/ 2 = (3.10) と与えられる. 図 3.5 はこの閾値により第 1 種の 過誤が起きる領域を黒く塗りつぶして示す. 実際 には q 23 値の軸を加えた 4 次元空間内の黒色部分の

5 (a) 鳥瞰図 q 13 (b) 平面図 図 3.4 平均値の差の q 値の結合確率密度関数 q q 12 図 3.6 テューキーの方法 (3 事象 ) を 1000 組実施するシミュレーション ( テューキーの方法 (3 事象 ) のシミュレーション.xlsm) 4 上位検定と下位検定 超体積が 0.05 (=FWER) となる. なお, 数表の値を 1/ 2 倍して用いるのは, 数表が作られた歴史的経緯によるようである. 図 3.6 はテューキーの方法による検定を 1000 組実施するシミュレーション結果である. 図 3.3 との違いは, セル F4 に q max0 の値が与えられた点だけである. 第 21 行目にて (3.7) 式の q ij の絶対値が q max0 の値を超えた場合に, その平均値の差に有意差有りとしている.27 行目に求められているように,FWER 0.05 が得られている. q max0 図 3.5 テューキーの方法 (q max0 = 2.498) q 13 q max0 - q max0 - q max0 q 12 N 重比較の FWER = α とする閾値は,N が大き くなるとともに厳しくなり, 仮説の有意差が出に くくなる. 上位検定 下位検定と呼ばれる手法が あるが, これを閾値緩和の視点で見ていく. 4.1 分散分析 ( 上位検定 ) [6] 一元配置の分散分析について紹介する. 帰無仮 説のファミリーを HH 123 :μμ 1 = μμ 2 = μμ 3 (4.1) とする. このとき対立仮説は 対立仮説 :μμ 1 μμ 2 or μμ 1 μμ 3 or μμ 2 μμ 3 (4.2) である. 帰無仮説 H 123 を棄却できる場合, 対立仮 説のいずれかが有意であることが分かるが, どれ であるかは下位検定を実施しなければ分からない. 分散分析の検定統計量 F は, データ群数が N, 各群のサンプルサイズが等しく n である場合 FF = SS AA/(NN 1) (4.3) SS EE /(nn(nn 1)) により与えられる. この F 値は自由度 N -1, n (N - 1) の F 分布に従う. ここで, NN SS AA = nn(xx ii xx ) 2 ii=1 NN nn SS EE = xx iiii xx ii 2 ii=1 jj=1 (4.4)

6 図 4.1 分散分析 (3 事象 ) を 1000 組実施するシミュレーション ( 分散分析 (3 事象 ) のシミュレーション.slxm) であり,S A, S E はそれぞれ水準間変動, 水準内変動 と呼ばれる.xx は全体の平均値,xx ii はデータ群 i の平 均値である. 図 4.1 は分散分析による検定を 1000 組実施する シミュレーションの画面の抜粋である.N = 3, 帰 無仮説が (4.1) 式の場合である. セル B18, B19 で (4.4) 式の S A, S E がそれぞれ計算され, セル B20 で (4.3) 式の F 値が求められている. セル B21 では, この F 値から FDIST() 関数により求められる p 値 がセル F4 に入力された有意水準を下回った場合 に 1 が出力される. このとき帰無仮説 H 123 が棄却 される. 第 26 行目の 95% 信頼区間より,FWER 0.05 であることが分かる. 4.2 ヘイター フィッシャーの方法 ( 下位検定 ) [7,8] 分散分析の結果, 帰無仮説が棄却された場合, どの対立仮説が有意であるかを調べるのが下位検 定である. 下位検定法にヘイター フィッシャー の方法 [7] がある. これは, データ群数が N で, 各 群のサンプルサイズが等しい場合, データ群数 N' = N - 1 と 1 つ減らしてテューキーの方法を適用す る方法である. 元のデータ群数 N = 3 の場合にの み適用できる下位検定法にフィッシャーの PLSD 法 [8] があるが, ヘイター フィッシャーの方法は N = 3 のときフィッシャーの PLSD 法と一致する. データ群数を 1 つ減らして N' = N - 1 として良い理由は次のように説明される. 例えば 4 群の場合で各群の母平均が µ 1 >> µ 2, µ 3, µ 4 であったとする. これらの平均値の差により, 上位検定では有意差有りとなる. このとき注意すべきは,µ 2 - µ 3, µ 2 - µ 4, µ 3 - µ 4 については 検定されずに 下位検定に渡されることである. そこで, 下位検定ではデータ群数 N' = 4 ではなく,N' = 3 として,µ 2 - µ 3, µ 2 - µ 4, µ 3 - µ 4 について多重性を考慮した検定を行えば十分である. なお,µ 1 - µ 2, µ 1 - µ 3, µ 1 - µ 4 に関しては検定により有意差有りと出るが, これは正しい結論であり, 第 1 種の過誤ではない. N = 4 とする. 分散分析の帰無仮説は HH 1234 :μμ 1 = μμ 2 = μμ 3 = μμ 4 (4.5) である. 下位検定の帰無仮説のファミリーは HH 12 :μμ 1 = μμ 2 HH 13 :μμ 1 = μμ 3 HH 14 :μμ 1 = μμ 4 HH 23 :μμ 2 = μμ 3 (4.6) HH 24 :μμ 2 = μμ 4 HH 34 :μμ 3 = μμ 4 である. 図 4.2 は 4 群の場合の上位検定を分散分析, 下位検定をヘイター フィッシャーの方法として, 1000 組の検定を実施するシミュレーション画面の抜粋である. 第 22 行目までで図 4.1 と同様の分散分析がなされている. セル B26~E26, B27, C27 にて (3.7) 式の q 12, q 13, q 14, q 23, q 24, q 34 の値 ( サンプルサイズ n = 9, 自由度 ν = N(n - 1)= 32) が求められ, セル B28~E28, B29, C29 にてそれぞれセル E24 に入力されている閾値 q max0 = との比較がなされている. 閾値 q max0 はステューデント化された範囲の数表より, データ群数 N' = N - 1= 3, 自由度 ν = N(n - 1) = 32 のとき q max0 =3.475/ 2 = である.FWER 0.05 が達成されている. もし, 上位検定を介さずに,4 群に対してテューキーの方法を適用する場合は, 数表より N = 4, ν = 32 のとき q max0 =3.832/ 2 = であるので, ヘイター フィッシャーの方法により閾値の緩和が実現されている.

7 図 4.3 ホルムの方法 (5 事象 ) を 1000 組実施するシミュレーション ( ホルム (5 事象 ) によるシミュレーション.xlsm) 進む. (3) t t -1 とする.t = 0 であれば,(4) へ進む.(4.8) 図 4.2 ヘイターフィッシャーの方法 (4 事象 ) を 1000 組実施するシミュレーション ( ヘイター フィッシャーの方法 (4 事象 ) のシミュレーション.xlsm) 式の順に, 次に大きい p 値の添え字を i に代入 し,(2) へもどる. (4) 検定を終了する. 4.3 ホルムの方法 [9] ホルムの方法は下位検定法として位置づけられ ているわけではないが, 前節までの下位検定にお ける閾値緩和の考え方を発展させた方法として位 置づけることができる. すなわち, 最も検定統計 量の絶対値の大きいものに多重比較法を適用し, 対応する帰無仮説を棄却できれば, データ群を 1 つ削減して閾値を緩和し, 以降同様にして, 多重 比較法の適用, 対応する帰無仮説の棄却, 閾値緩 和を繰り返す方法である. 簡単のため, 帰無仮説のファミリーを HH ii :μμ ii = μμ 0 ii = 1, 2,, NN (4.7) とする.3.1 節に記したボンフェローニの方法に対 して, 以下の手順で閾値 ( 名義水準 )α th を緩和 する. (1) 帰無仮説 H i を p 値の小さな順に並べる. pp jj pp kk pp ll 1 jj, kk,, ll N (4.8) であったとする.i = j, t = N とする. (2) 名義水準 α th = α/t とし,pp ii < αα tth であれば,H i を棄却し,(3) へ進む.pp ii α tth であれば,(4) へ 図 4.3 はデータ群数 N = 5, サンプルサイズ n = 9 の場合にホルムの方法を適用して,1000 組の検定を繰り返すシミュレーション画面の抜粋である. 帰無仮説の数 N = 5 である. セル D4 にて,FWER の有意水準 α = 0.05 が入力されている. 第 23 行目にて第 21 行目の p 値が小さい順に並べ替えられている. セル B24 では, セル B23 の p 値がセル H4 の有意水準 α 5 = α/5 = 0.05/5 = 0.01 を下回ったので, 有意差有りとして 1 が出力されている. 対応する帰無仮説 H 3 が棄却されている. もともと帰無仮説が正しい設定であるので, ここで第 1 種の過誤が起きている. セル C24 ではセル C23 の p 値がセル G4 の有意水準 α 4 = α/4 = より大きかったので,0 が出力されている. 結果として帰無仮説 H 1, H 2, H 4, H 5 は棄却されず, 検定が終了している. セル B25 では B24~F24 にて 1 回以上 1 があるときに 1 が出力される. セル B27 では 1000 組の検定において第 1 種の過誤が起きた頻度が求められている. 図の例では 43 組で第 1 種の過誤が起きていた.

8 閾値 マクロにより, この 1000 組の検定を 100 回繰り 返して, 第 1 種の過誤の確率の 95% 信頼区間を求 めた結果が第 29 行目に表示されている.FWER 0.05 である. FDR_TST 法 新手法? ボンフェローニの方法 ホルムの方法 検定の回数 図 4.4 ホルムの方法, ボンフェローニの方法, FDR_TST 法, 新手法 (?) の閾値 (N = 5, E(V+S) = 1) 図 4.4 はホルムの方法とボンフェローニの方法 の閾値 α th と検定の回数の関係を示す. ホルムの方 法により, 検定の回数とともに閾値が緩和されて いく様子が分かる. 他の方法の閾値は後述する. 5.1 FDR の定義 FDR は多重比較に対する新しい考え方である. 表 5.1 は帰無仮説の棄却 / 保留と第 1 種 / 第 2 種 の過誤の関係を表す. 帰無仮説の数 N の検定にお いて, 帰無仮説が真である場合に帰無仮説を保留 した数が U, 棄却した数が V, 帰無仮説が偽であ る場合に帰無仮説を保留した数が T, 棄却した数 が S である.V は第 1 種の過誤が起きた数であり, T は第 2 種の過誤が起きた数である.N = U+V+T+S の関係がある. また, 帰無仮説を棄却 した総数が V+S である.FDR は FDR = EE(VV/(VV + SS)) (5.1) と定義される.E(x) は x の期待値である.FDR は 採択した対立仮説の中に含まれる間違った対立仮 説の比率の期待値である.FDR に基づく検定では FDR αα (5.2) となるように, 検定の閾値を緩和し, FWER > α (5.3) となることは許容する.FWER が上式のようであ っても, 採択された対立仮説に含まれる誤った対 立仮説の比率が一定値以下であればそれでよしと する, 新しい考えに基づく多重検定法である. 5 FDR_TST 法 [10, 11] 帰無仮説の数が増えると, 検定の閾値が厳しく なり, 有意差は出にくくなる.FWER を抑えると いう観点では問題ないのであるが, 対立仮説の中 に真のものが含まれていても有意差なしとされる 第 2 種の過誤の確率が高くなってしまう. ゲノム 解析などでは仮説の数に対してサンプルサイズが 小さく, 有意差が出にくいことが問題となってい た. そこで,FWER そのものを見直す考え方とし て FDR(False Discovery Rate) が提唱されている. 表 5.1 帰無仮説を保留帰無仮説を棄却 計 U 第 1 種の過誤 V U + V 第 2 種の過誤 T S T + S 計 U + T V + S N 帰無仮説真 帰無仮説偽 帰無仮説の保留 / 棄却と第 1/2 種の過誤 5.2 BH 法 [10] FDR に基づく検定法の基本的方法は BH 法と呼 ばれる. 簡単のため, 帰無仮説のファミリーを HH ii :μμ ii = μμ 0 ii = 1, 2,, NN (5.4) とする. 以下の手順で検定を行う. なお,α' は次 節の TST 法では αα 1, αα 2 として与えられる. (BH1) 帰無仮説 H i を p 値の大きな順に並べる. pp jj pp kk pp ll 1 jj, kk,, ll NN (5.5) であったとする.i = j, t = N とする. (BH2) 名義水準 α th を αα tth = αα tt/nn (5.6) とし,pp ii < αα tth であれば,H i および H i より p 値 の小さな帰無仮説を全て棄却し,(BH4) へ進む. pp ii α tth であれば,H i を保留して (BH3) へ進む. (BH3) t t - 1 とする.t = 0 であれば,(BH4) へ 進む.(5.5) 式の順に, 次に小さい p 値の添え字 を i に代入し,(BH2) へもどる. (BH4) 検定を終了する.

9 5.3 TST (Two-stage linear step-up procedure) 法 [11] BH 法を 2 段階 (Two-stage) で適用する方法 (TST 法 ) が提案されている.TST 法は,1 段階目では BH 法を E(V + S) の推定に適用し,2 段階目で FDR α とする検定を行う.TST 法の手順は以下の通り である. (TST1) αα 1 = α /(1 + α), として,BH 法を適用する. 棄却された帰無仮説の数を V + S とする.V + S = 0 であれば,(TST4) へ進む.V + S = N であれ ば, 全ての帰無仮説を棄却して (TST4) へ進む. 0 < V + S < N であれば,(TST2) へ進む. (TST2) EE (VV + SS) = V + S として (TST3) へ進む. (TST3) 次式により αα 2 を決定し,BH 法を適用する. αα 2 = αα 1 NN/(NN EE (VV + SS)) (5.7) 終了したら (TST4) へ進む. (TST4) 検定を終了する., 図 5.1 は TST 法によるシミュレーション画面の 抜粋である. 帰無仮説のファミリーは (5.4) 式で, N = 10 である. ただし,10 のデータ群の内, 事象 X 8, X 9, X 10 はセル D4 の平均値 µ 1 を用いて正規乱数 が生成されている. 表 5.1 において S = 3 となる設 定である. 第 24 行目までが (TST1) の計算である. 第 23 行目で (BH1) の並べ替えがなされ, セル F4 図 5.1 FDR_TST 法 (N = 10, 1000 組 ) のシミュレーション (FDR_TST(10 群 ) によるシミュレーション.xlsm) にて α = 0.05 と与えられているので, セル G4~K6 にて (5.6) 式により α th が計算されている. 第 24 行 目で (BH2), (BH3) の比較がなされ, セル B26 に V + S が得られている.(TST2) にてこの V + S を EE (VV + SS) としている. セル D26 と第 28, 29 行目で (TST3) が実行されている. セル D26 にて (5.7) 式の 計算がなされ, 第 28 行目で (5.6) 式の閾値が求めら れている. 第 29 行目で各帰無仮説の p 値と閾値 α th の比較がなされている. 第 30 行目では, 偽の 帰無仮説の数 S = 3 が分かっているとして,V/(V+S) が計算されている. 図の例では 1/4 = 0.25 である. 第 35 行目の FDR の 95% 信頼区間より, 少し小さ めではあるが FDR αα の値が得られている. 図 4.4 に帰無仮説のファミリーにおいて N = 5, EE (VV + SS) = 1 の場合の閾値と検定の回数の関係を 示してある.FDR_TST 法では, ホルムの方法より もさらに閾値の緩和が実現されている. 6 課題 以下のアルゴリズムを考えてみた. 帰無仮説のフ ァミリーを とする. HH ii :μμ ii = μμ 0 ii = 1, 2,, NN (6.1) (1) 帰無仮説 H i を p 値の大きな順に並べる. pp jj pp kk pp ll 1 jj, kk,, ll NN (6.2) であったとする.i = j, t = N とする. (2) 名義水準 α th を αα tth = αα (6.3) とし,pp ii < αα tth であれば,H i および H i より p 値 の小さな帰無仮説を全て棄却し,(5) へ進む. pp ii α tth であれば,H i を保留して (3) へ進む. (3) t t - 1 とする.t = 1 であれば,(4) へ進む. (6.2) 式の順に, 次に小さい p 値の添え字を i に 代入し,(2) へもどる. (4) 名義水準 α th1 を αα tth1 = NN(1 αα)nn 1 αα + (1 αα) NN (1 αα) NN(1 αα) NN 1 (6.4) とする.pp ll < αα tth1 であれば,H l を棄却し,pp ll α tth1 であれば,H l を保留して (5) へ進む. (5) 検定を終了する.

10 参考文献 図 6.1 新手法 (?)(N = 5, 1000 組 ) のシミュレーション ( 新手法 (?)(5 群 ) によるシミュレーション.xlsm) ステップ (4) は FWER = α となるように最後の段 階で調整している. 図 6.1 はこの新手法 (?) により,N = 5 の帰無 仮説のファミリーに対して,1000 組について検定 を実施するシミュレーション画面の抜粋である. セル F6 にて α th1 の値が (6.4) 式により計算されてい る. ただし,α = 0.05 である. このシミュレーシ ョンでは帰無仮説は全て正しい設定である. 第 30 行目において FWER 0.05 である. 図 4.4 にこの新手法 (?) の閾値の変化の様子を 書き加えて示す. この手法は,FWER 0.05 を保 ちながら, 閾値の大幅な緩和を実現している??? この手法は致命的な間違いを犯している. 理由 は, 本稿を前章まで読まれた方にはお分かりいた だけると思いますが, いかがでしょうか? 7 結論 本稿では Excel を用いたシミュレーションによ り多重性の問題を例示し, 基本的な多重比較法の 解説を, 閾値の緩和の観点から展開した. もとより, 本稿ではカバーできなかった多重比 較法がたくさんある. 別の機会に報告したい. [1] 広津千尋 : 実験データの解析- 分散分析を超えて- 共立出版(1992) [2] 永田 吉田 : 統計的多重比較法の基礎 サイエンティスト社 (1997) [3] 古橋武編 : 統計 多変量解析とソフトコンピューティング ( 改訂版 ) 共立出版(2014) [4] N. Salkind(Ed.): BonferroniTest, Encyclopedia of Measurement and Statistics, Vol.1, pp (2007) [5] H. I. Braun(Ed.): The Collected Works of John W. Tukey, Vol. III Multiple Comparisons: , Chapman & Hall (1994) [6] 石村貞夫 : 分散分析のはなし 東京図書 (1992) [7] A. J. Hayter: The Maximum Familywise Error Rate of Fisher's least Significant Difference Test, J. of American Statistical Association, Vol. 81, No. 396, pp (1986) [8] N. Salkind(Ed.): Fisher's LSD, Encyclopedia of Measurement and Statistics, Vol.1, pp (2007) [9] S. Holm: A Simple Sequentially Rejective Multiple Test procedure, Scandinavian J. of Statistics, Vol. 6, No. 2, pp (1979) [10] Y. Benjamini and Y. Hochberg: Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing, J. of the Royal Statistical Society. Series B(Methodological), Vol. 57, No. 1, pp (1995) [11] Y. Benjamini, A. M. Krieger and D. Yekutieli: Adaptive Linear Step-up Procedures that Control the False Discovery Rate, Biometrika, Vol. 93, No. 3, pp (2006)

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

Vol. 29, No. 2, (2008) FDR Introduction of FDR and Comparisons of Multiple Testing Procedures that Control It Shin-ichi Matsuda Department of

Vol. 29, No. 2, (2008) FDR Introduction of FDR and Comparisons of Multiple Testing Procedures that Control It Shin-ichi Matsuda Department of Vol. 29, No. 2, 125 139 (2008) FDR Introduction of FDR and Comparisons of Multiple Testing Procedures that Control It Shin-ichi Matsuda Department of Information Systems and Mathematical Sciences, Faculty

More information

paper2005b14.dvi

paper2005b14.dvi R BH 1 (2004) 1 (Familywise error rate) Tukey step-down Tukey-Welsch R (False Discovery Rate) () Benjamini and Hochberg(1995) BH adaptivebh BY R 2 (False Discovery Rate) m m 0 m 1 m = m 0 + m 1 R Benjamini

More information

データ科学2.pptx

データ科学2.pptx データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378> 3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

31 33

31 33 17 3 31 33 36 38 42 45 47 50 52 54 57 60 74 80 82 88 89 92 98 101 104 106 94 1 252 37 1 2 2 1 252 38 1 15 3 16 6 24 17 2 10 252 29 15 21 20 15 4 15 467,555 14 11 25 15 1 6 15 5 ( ) 41 2 634 640 1 5 252

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ 区間推定に基づくサンプルサイズの設計方法 7.7. 株式会社応用数理研究所佐々木俊久 永田靖 サンプルサイズの決め方 朝倉書店 (3) の 章です 原本とおなじ 6 種類を記述していますが 平均値関連 4 つをから4 章とし, 分散の つを 5,6 章に順序を変更しました 推定手順 サンプルサイズの設計方法は, 原本をそのまま引用しています R(S-PLUS) 関数での計算方法および例を追加しました.

More information

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8> 第 8 回 t 分布と t 検定 生物統計学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

日本統計学会誌, 第44巻, 第2号, 251頁-270頁

日本統計学会誌, 第44巻, 第2号, 251頁-270頁 44, 2, 205 3 25 270 Multiple Comparison Procedures for Checking Differences among Sequence of Normal Means with Ordered Restriction Tsunehisa Imada Lee and Spurrier (995) Lee and Spurrier (995) (204) (2006)

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

第7章

第7章 5. 推定と検定母集団分布の母数を推定する方法と仮説検定の方法を解説する まず 母数を一つの値で推定する点推定について 推定精度としての標準誤差を説明する また 母数が区間に存在することを推定する信頼区間も取り扱う 後半は統計的仮説検定について述べる 検定法の基本的な考え方と正規分布および二項確率についての検定法を解説する 5.1. 点推定先に述べた統計量は対応する母数の推定値である このように母数を一つの値およびベクトルで推定する場合を点推定

More information

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 17 回 講義 母平均の区間推定 Part- 016 年 6 14 ( )3 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u toyama.ac.jp website: http://www3.u toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです 一元配置分散分析 (ANOVA) 概要 一元配置分散分析は 3 つ以上のグループの平均を比較し 互いに有意に異なるかどうかを判断するために使用されます もう

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

0226_ぱどMD表1-ol前

0226_ぱどMD表1-ol前 No. MEDIA DATA 0 B O O K 00-090-0 0 000900 000 00 00 00 0000 0900 000900 AREA MAP 0,000 0,000 0,000 0,000 00,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 00,000 0,000

More information

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上 平成 7 年度数学 数学 ( 問題 ) 問題 から問題 3 を通じて必要であれば ( 付表 ) に記載された数値を用いなさい 問題. 次の ()~() の各問について 空欄に当てはまる最も適切なものをそれぞれの選択肢 の中から選び 解答用紙の所定の欄にマークしなさい なお 同じ選択肢を複数回選択してもよい 各 5 点 ( 計 6 点 ) ()つのサイコロを振る試行を 回繰り返すこととする 回目と 回目の試行でともにの目が出る事象を

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

読めば必ずわかる 分散分析の基礎 第2版

読めば必ずわかる 分散分析の基礎 第2版 2 2003 12 5 ( ) ( ) 2 I 3 1 3 2 2? 6 3 11 4? 12 II 14 5 15 6 16 7 17 8 19 9 21 10 22 11 F 25 12 : 1 26 3 I 1 17 11 x 1, x 2,, x n x( ) x = 1 n n i=1 x i 12 (SD ) x 1, x 2,, x n s 2 s 2 = 1 n n (x i x)

More information

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良

More information

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - 三次元座標測定 ppt 冗長座標測定機 ()( 三次元座標計測 ( 第 9 回 ) 5 年度大学院講義 6 年 月 7 日 冗長性を持つ 次元座標測定機 次元 辺測量 : 冗長性を出すために つのレーザトラッカを配置し, キャッツアイまでの距離から座標を測定する つのカメラ ( 次元的なカメラ ) とレーザスキャナ : つの角度測定システムによる座標測定 つの回転関節による 次元 自由度多関節機構 高増潔東京大学工学系研究科精密機械工学専攻

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研 CAE シミュレーションツール を用いた統計の基礎教育 ( 株 ) 日本科学技術研修所数理事業部 1 現在の統計教育の課題 2009 年から統計教育が中等 高等教育の必須科目となり, 大学でも問題解決ができるような人材 ( 学生 ) を育てたい. 大学ではコンピューター ( 統計ソフトの利用 ) を重視した教育をより積極的におこなうのと同時に, 理論面もきちんと教育すべきである. ( 報告 数理科学分野における統計科学教育

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から

More information

数理言語

数理言語 知識工学 第 13 回 二宮崇 1 教科書と資料 教科書 Artificial Intelligence: A Modern Approach (3rd Edition): Stuart Russell, Peter Norvig ( 著 ), Prentice Hall, 2009 この講義のウェブサイト http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ke/ 2

More information

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札 解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札を入れまず1 枚取り出す ( 仮に1 番とする ). 最初に1 番の学生を選ぶ. その1 番の札を箱の中に戻し,

More information

解析センターを知っていただく キャンペーン

解析センターを知っていただく キャンペーン 005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図

More information

<4D F736F F F696E74202D2091BD8F6494E48A7282CC8AEE916282C B C815B F96405F947A957A97702E >

<4D F736F F F696E74202D2091BD8F6494E48A7282CC8AEE916282C B C815B F96405F947A957A97702E > 第 27 回創薬情報研究会 多重比較の基礎とゲートキーピング法 日本開発センタークリニカルデータサイエンス部舟尾暢男 おわび 後で読み返していただいた際に理解しやすい様 細かなところまで説明するよう努めました そのため 内容が盛りだくさんとなってしまい 早口で説明させていただくこととなります ご容赦下さい また 全てをお話してしまうと時間が大幅に超過してしまいますので本講演では タイトルに があるスライド

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

様々なミクロ計量モデル†

様々なミクロ計量モデル† 担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

目次 はじめに P.02 マクロの種類 ---

目次 はじめに P.02 マクロの種類 --- ステップワイズ法による重回帰分析の 予測マクロについて 2016/12/20 目次 はじめに ------------------------------------------------------------------------------------------------------------------------------ P.02 マクロの種類 -----------------------------------------------------------------------------------------------------------------------

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生 0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,

More information

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft PowerPoint - Lecture 10.ppt [互換モード] 講義予定 環境プラニング演習 II 第 0 回 009. 6. 7 千葉大学工学部都市環境システム学科 山崎文雄 http://ares.tu.cha-u.jp/ tu ujp/ ( 009 年 4 月 8 日 ( 土 :50 ー 4:0 演習の説明, 微分 積分と数値計算 ( 009 年 4 月 5 日 ( 土 :50 ー 4:0 微分 積分と数値計算 (3 009 年 5 月 9 日 ( 土 :50

More information

Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる

More information

JUSE-StatWorks/V5 活用ガイドブック

JUSE-StatWorks/V5 活用ガイドブック 4.6 薄膜金属材料の表面加工 ( 直積法 ) 直積法では, 内側に直交配列表または要因配置計画の M 個の実験, 外側に直交配列表または要因配置計画の N 個の実験をわりつけ, その組み合わせの M N のデータを解析します. 直積法を用いることにより, 内側計画の各列と全ての外側因子との交互作用を求めることができます. よって, 環境条件や使用条件のように制御が難しい ( 水準を指定できない )

More information

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63> 第 5 回統計的推定 実験計画学 A. 統計的推定と検定母集団から無作為抽出した標本から母集団についてなんらかの推論を行う. この場合, 統計から行う推論には統計的 ( ) と統計的 ( ) の 2つがある. 推定統計的に標本の統計量から母集団の母数 ( 母平均, 母標準偏差など ) を推論することを統計的推定という. 例 : 視聴率調査を 200 人に対して行い, 番組 Aの視聴率を推定した. 検定統計的に標本の統計量から母数に関する予想の真偽を検証することを統計的検定という.

More information

統計学の基礎から学ぶ実験計画法ー1

統計学の基礎から学ぶ実験計画法ー1 第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3

More information

Microsoft Word - apstattext05.docx

Microsoft Word - apstattext05.docx 5 章 群間の量的データの検定 5. 対応のない検定手順例えば 男女の成績を比較しようとして試験を実施した場合 男性の集団 ( 群 ) と女性の集団 ( 群 ) との比較になりますから つの集団に同一人物は 人もいません しかしその試験で英語と国語の平均点を比較する場合 英語と国語を受験した集団には必ず同じ人がいます 前者のような場合を対応のないデータ 後者の場合を対応のあるデータと呼びます 対応のあるデータについては特別の処理ができるので

More information

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団 統計学 Ⅱ(16 11-1 章 11 章母集団パラメータの推定 1. 信頼区間 (1 点推定と区間推定 ( 区間推定のシミュレーション (3 母平均 μの信頼区間 (4 母比率 pの信頼区間 (5 母比率 pのより厳密な信頼区間. 点推定量の特性 (1 標本平均 X の持つ望ましい性質 ( 不偏性 (3 推定量の分散と有効性 (4 平均 乗誤差 MEと最小分散性 (5 一致性 (6 チェビシェフの不等式

More information

Microsoft Word - VBA基礎(3).docx

Microsoft Word - VBA基礎(3).docx 上に中和滴定のフローチャートを示しました この中で溶液の色を判断する部分があります このような判断はプログラムではどのように行うのでしょうか 判断に使う命令は IF 文を使います IF は英語で もし何々なら という意味になります 条件判断条件判断には次の命令を使います If 条件式 1 Then ElseIf 条件式 2 Then ElseIf 条件式 3 Then 実行文群 1 実行文群 2 実行文群

More information

較バンディットアルゴリズムを いた クラウドソーシングにおける 品質 コストトレードオフの 動調整 畠正和, 宮 純平, 場雪乃 北海道 学 /NTT, 東京 学, 京都 学

較バンディットアルゴリズムを いた クラウドソーシングにおける 品質 コストトレードオフの 動調整 畠正和, 宮 純平, 場雪乃 北海道 学 /NTT, 東京 学, 京都 学 較バンディットアルゴリズムを いた クラウドソーシングにおける 品質 コストトレードオフの 動調整 畠正和, 宮 純平, 場雪乃 北海道 学 /NTT, 東京 学, 京都 学 今 のお話 ( 枚概要 ) 2 問題 クラウドソーシングの品質 コストトレードオフを調整 最終成果物の品質をできるだけ下げず コストを削減 法 較バンディットアルゴリズムを利 有 な Worker を推定しながら Task を依頼

More information

untitled

untitled 分析の信頼性を支えるもの データ評価のための統計的方法 確率分布と平均値の推定 検定 田中秀幸 1 はじめに前回は, 統計的手法を適用するために意味のあるデータをどのように取得するのかについて, 母集団と標本について, 期待値 分散 標準偏差について解説した 今回は, 統計的推定 検定の基礎となる確率分布とその確率分布を用いた推定 検定について解説する 2 確率分布 測定データを取得したとき, そのデータのばらつきを視覚的に表すために,

More information

: : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :

: : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1 1 1 1.1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1 1.2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1 1.2.1 t :

More information

スライド 1

スライド 1 6B-1. 表計算ソフトの操作 ( ) に当てはまる適切な用語とボタン ( 図 H 参照 ) を選択してください ( 選択肢の複数回の選択可能 ) (1) オートフィルオートフィルとは 連続性のあるデータを隣接 ( りんせつ ) するセルに自動的に入力してくれる機能です 1. 図 1のように連続した日付を入力します *( ア ) は 下欄 ( からん ) より用語を選択してください セル A1 クリックし

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.jp website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx

コンピュータリテラシ 第 6 回表計算 2 このスライド 例題   /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 http://cobayasi.com/jm/6th/6th.pdf /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx 今日の学習要点 ( テキスト P152-167) IF 関数の使い方 IF 関数による条件判定 複合条件による判定 順位付け (RANK.EQ)

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m

融合規則 ( もっとも簡単な形, 選言的三段論法 ) ll mm ll mm これについては (ll mm) mmが推論の前提部になり mmであるから mmは常に偽となることがわかり ll mmはllと等しくなることがわかる 機械的には 分配則より (ll mm) mm (ll mm) 0 ll m 知識工学 ( 第 5 回 ) 二宮崇 ( ninomiya@cs.ehime-u.ac.jp ) 論理的エージェント (7 章のつづき ) 証明の戦略その 3 ( 融合法 ) 証明の戦略その 1 やその 2 で証明できたときは たしかにKKKK ααとなることがわかるが なかなか証明できないときや 証明が本当にできないときには KKKK ααが成り立つのか成り立たないのかわからない また どのような証明手続きを踏めば証明できるのか定かではない

More information

Microsoft Word - Stattext07.doc

Microsoft Word - Stattext07.doc 7 章正規分布 正規分布 (ormal dstrbuto) は 偶発的なデータのゆらぎによって生じる統計学で最も基本的な確率分布です この章では正規分布についてその性質を詳しく見て行きましょう 7. 一般の正規分布正規分布は 平均と分散の つの量によって完全に特徴付けられています 平均 μ 分散 の正規分布は N ( μ, ) 分布とも書かれます ここに N は ormal の頭文字を 表わしています

More information

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A

NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, A NLMIXED プロシジャを用いた生存時間解析 伊藤要二アストラゼネカ株式会社臨床統計 プログラミング グループグルプ Survival analysis using PROC NLMIXED Yohji Itoh Clinical Statistics & Programming Group, AstraZeneca KK 要旨 : NLMIXEDプロシジャの最尤推定の機能を用いて 指数分布 Weibull

More information

模擬試験問題(第1章~第3章)

模擬試験問題(第1章~第3章) 基本情報技術者試験の練習問題 - 第 10 回 この問題は平成 19 年度春期の問題から抜粋しています 問 1 次のプログラムの説明及びプログラムを読んで, 設問 1~3 に答えよ プログラムの説明 整数型の 1 次元配列の要素 A[0],,A[N](N>0) を, 挿入ソートで昇順に整列する副プログラム InsertSort である (1) 挿入ソートの手順は, 次のとおりである (i) まず,A[0]

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

次元圧縮法を導入したクエリに基づくバイクラスタリング 情報推薦への応用 武内充三浦功輝岡田吉史 ( 室蘭工業大学 ) 概要以前, 我々はクエリに基づくバイクラスタリングを用いた情報推薦手法を提案した. 本研究では, 新たに推薦スコアが非常に良く似たユーザまたはアイテムを融合する次元圧縮法を導入した. 実験として, 縮減前と縮減後のデータセットのサイズとバイクラスタ計算時間の比較を行う. キーワード

More information

数値計算法

数値計算法 数値計算法 011/5/5 林田清 ( 大阪大学大学院理学研究科 ) レポート課題 1( 締め切りは 5/5) 平均値と標準偏差を求めるプログラム 入力 : データの数 データ データは以下の 10 個 ( 例えばある月の最高気温 ( )10 日分 ) 34.3,5.0,3.,34.6,.9,7.7,30.6,5.8,3.0,31.3 出力 :( 標本 ) 平均値 標準偏差 ソースプログラムと出力結果をメイルの本文にして

More information

<4D F736F F D208D5C91A297CD8A7793FC96E591E631308FCD2E646F63>

<4D F736F F D208D5C91A297CD8A7793FC96E591E631308FCD2E646F63> 第 1 章モールの定理による静定梁のたわみ 1-1 第 1 章モールの定理による静定梁のたわみ ポイント : モールの定理を用いて 静定梁のたわみを求める 断面力の釣合と梁の微分方程式は良く似ている 前章では 梁の微分方程式を直接積分する方法で 静定梁の断面力と変形状態を求めた 本章では 梁の微分方程式と断面力による力の釣合式が類似していることを利用して 微分方程式を直接解析的に解くのではなく 力の釣合より梁のたわみを求める方法を学ぶ

More information