05_水本・竹内
|
|
|
- さあしゃ たけくま
- 9 years ago
- Views:
Transcription
1 より良い外国語教育研究のための方法 (pp ) 外国語教育メディア学会 (LET) 関西支部メソドロジー研究部会 2010 年度報告論集 効果量と検定力分析入門 統計的検定を正しく使うために 水本篤 関西大学 竹内理 関西大学 キーワード : 統計的検定, 有意差, 効果量, 検定力, 検定力分析 1. 本稿の目的統計的検定は, 標本から得たデータ分析結果を母集団にまで一般化させる目的で行われる 統計的検定では, サンプル サイズ, 有意水準, 効果量, 検定力の4つが検定結果の良し悪しを決定する重要な要素であるため, その基礎的概念の理解が検定を正しく使うためには重要である そこで, 本稿では, 効果量と検定力分析の2つの概説を行い, 統計的検定を用いている研究において, 効果量報告と検定力分析の使用を推奨することを目的とする 2. 効果量 2.1 統計的検定と効果量統計的検定では, たとえば, 手元のデータ ( 標本,sample) である 2 つのグループの平均値に差がありそうだと考える場合に, 母集団 (population) でもその平均値差は同じように見られるであろうかということを推定する その際に, 平均値には差がない という, 主張したいこととは逆の仮説をとりあえず立てて, その 平均値の差がない 確率が低い場合には, 平均値差がある と判断するという論法になっている その確率は英語の probability から,p 値と呼ばれており, 手元のデータから計算することが可能である p 値がどれくらい小さければ統計的に有意な差があるかは, データ収集よりも前に設定する有意水準 (significance level) に基づいて判断される 慣例として, 有意水準は 5% ( 分野や研究内容によっては 1%) に定められている 1 そのため, 収集したデータに対して検定を行い, 結果が p <.05 であれば 差がある と判断される 統計的検定は基本的に 差がある と主張するために行われるため,p <.05 であれば, 望ましい結果が得られたと結論づける 通常, どの分野のジャーナルでも, 有意な結果 (p <.05) が出た研究論文を掲載する傾向があるため,p 値が統計的検定においてもっとも重要な指標であると考えてしまう
2 しかし,p 値はサンプル サイズ ( 標本数, サンプル数 ) が大きくなればなるほど, 実質的な差がなかった場合でも,p 値は小さくなり, 統計的に有意であるという結果が得られやすくなるという大きな問題を持っている そのため, ある検定を行ったところ,50 人では有意ではなく,100 人のデータの場合には有意になるということも十分にあり得る その具体例としてシミュレーションによるデータを表 1 に示す データセット A, データセット B ともに, グループ 1 は平均値 40, 標準偏差 10, グループ 2 は平均値 43, 標準偏差 10 となるように設定して, 正規分布の乱数を発生させた 2 平均値の差は両データセットとも 3.0 である これら 2 つのデータセットに対して, 対応のない t 検定 (independent t-test) を行った結果, データセット A では p = 0.137(p >.05), データセット B では p = 0.015(p <.05) という結果となる ( つまり, 人数の違いによって, 有意差のあり なしが変わっている ) この例は, 同じ平均値, 標準偏差であっても, サンプル サイズが大きくなればなるほど p 値が小さくなり, 有意差あり という判断をしやすくなるということを示している また, よくある誤った解釈である p 値が小さければ小さいほど, 差が大きい というものが間違いであるということもわかる 表 1 シミュレーション データでの n の違いによる p 値の比較 データセット グループ n 平均値標準偏差 平均値差 対応のない t 検定 効果量 d A グループ グループ p = d = 0.3 B グループ グループ p = d = 0.3 効果量 d の基準 :d = 0.2( 効果量小 ),d = 0.5( 効果量中 ),d = 0.8( 効果量大 ) 上述のように,p 値はサンプル サイズによって変わるものなので, 実質的な差が大きいか小さいかについての情報は何も与えてくれない そこで, サンプル サイズによって変化しない, 標準化された指標である効果量 (effect size) が解釈に役立つ グループごとの平均値の差を標準化した効果量 の代表的な指標である Cohen s d は,t 検定のような 2 グループの平均値の差を比較するときに使用し, 平均値の差の効果量を以下のような式 (1) で求めることができる ( 実験群と統制群のサンプル サイズが同じ場合 ) 3 一見, 難しそうに見えるかもしれないが, 実は平均値と標準偏差しか使われていない 48
3 d = ( ) 式 (1) この計算から得られる値はグループごとの平均値の差を標準化したもの (standardized mean difference) になっている 算出される数値は, 標準偏差を単位として平均値がどれだけ離れているかを表しており, たとえば,d = 1 なら,1 標準偏差 (SD) 分だけ離れていることを意味する 表 1 のデータを例にしてみると, 平均値差を 2 グループの標準偏差の平均で割れば効果量 d が計算できる 単純化した式で書くと,3.00 [( ) 2] = 0.30 となる つまり, グループ 1 の標準偏差 (10.00) とグループ 2 の標準偏差 (10.00) の平均が であり, この標準偏差 1 つ分 (1SD = 10.00) のうち, 平均値差 3.00 の占める割合を見ているのである 表 1 では, 効果量 d は両データとも 0.3 で効果量小 (small effect size) という結果で, 実質的な差は小さいということがわかる このように, 効果量は, 平均値と標準偏差のみでの直感的な判断とほとんど同じ解釈ができるものなのである また, 効果量は p 値のようにサンプル サイズによって影響されることはないので, 実質的な差を考えた場合には, 統計的検定の枠組み (p 値 ) ではなく, 効果量による解釈がふさわしいといえる つまり, 統計的検定の結果を解釈する際には,p 値を判断の最終材料とするべきではなく, まずは平均値, 標準偏差, そして効果量によって, 実質的な差を検討すべきである また, 研究における実験条件によっては, 有意差があっても(p <.05) 効果量が小さい場合 もあれば, 有意差がなくても (p >.05) 効果量が大きい場合 も考えられるため, 有意差があろうがなかろうが, どちらにしても効果量は報告しなければならない (American Psychological Association, 2009; Field, 2009; Kline, 2004 など ) よくある疑問としては, 効果量で実質的な差がわかるのであれば, 統計的検定を行って p 値を見る必要はないのではないのか? というものであるが, 効果量のみでよい ということはない そもそも, 効果量は ( 母集団の特性を示そうする目的は同じであるが ) 確率を用いる推測統計とは目的が違うものであり, 手元のデータから母集団にまで一般化を目指すのが統計的検定の目的なのである データのサンプリングがうまくいっていないために, 手元のデータが たまたま 大きな差が得られるデータだったという場合は, 効果量だけの解釈ではその可能性が否定できない つまり, 実質的な差を示す効果量が大きく, なおかつ統計的有意差もある (p <.05) というのが, 理想的な統計的検定の形である 2.2 効果量の指標と注意点 表 2 は検定 分析の種類別に代表的な効果量の指標と大きさの目安をまとめたものである ( 水 49
4 本 竹内,2008) この表と効果量計算シート( は, 発表されて以来, 外国語教育学のみならず他分野でも利用されている 水本 竹内 (2008) では, t 検定には繰り返しありと繰り返しなしのパターンがあるが,r と d ともに計算式は同じ形で効果量を求めることができる (p. 63) という記述があるが, これについては間違った解釈を導いてしまう可能性があるため, 説明を加える必要がある なぜならば, 繰り返しありの場合は, 同一実験参加者が2 度データ収集をされることになるため, データに対応が出てくる そのため, 効果量算出においてもデータの対応 ( 相関係数 ) を考慮に入れるべきであるという考え方で計算されているものもある 以下の計算式 (2) は, 後述の検定力分析を行うソフトである G*Power 3 で算出される, 対応のある t 検定の場合の d である 式からわかるように, 対応なしの場合の d を用いて, それを対応のあるデータの相関係数を用いることで調整している d Diff = 対応なしの場合の d 2 (1 対応のあるデータの相関係数 ) 式 (2) 一方, 実験デザイン ( 対応のあり なし ) に関わらず,d は ( 対応のないときと ) 同じ値が得られるべきであるという考え方に基づいた計算方法もある この計算方法がメタ分析で用いられていることからも (Borenstein, Hedges, Higgins & Rothstein, 2009), 水本 竹内 (2008) では, r と d ともに計算式は同じ形で効果量を求めることができる (p. 63) と記述した しかし, r を用いた場合は, 計算過程で繰り返しありの場合の t 値が使われており, データの対応 ( 相関係数 ) を考慮に入れた値が計算されているため, 対応のない場合の d とは違う意味を持った数値になっている そのため, 解釈には注意が必要になる 4 対応がある場合の d ( もしくはそれに関連した指標 ) の計算式はいくつか存在するが, まとめると (a) 対応のない場合の d と同じ値になるように計算しているもの (Cortina & Nouri, 2000, p. 49; Grissom & Kim, 2005, p. 67; Kline, 2004, p. 106) と,(b) データの対応を考慮して相関係数や平均値差で調整しているもの (Faul, Erdfelder, Lang & Buchner, 2007; Kline, 2004, p. 105, 豊田, 2009, p. 55) の2つに集約される 5 これらの d の値がデータ間の相関係数の変化によって, どのように変わるのかということを調べるために, 次のようなシミュレーションを行った まず, データ 1 (n = 100,000, Mean = 40, SD = 10) とデータ 2 (n = 100,000, Mean = 50, SD = 10) の 2 つのデータを, 正規分布に従う形で 1,000 回発生させ,1 回ごとに効果量を計算し, 最後に平均を出した ( モンテカルロ シミュレーション ) これらデータで, 対応のない場合の d と同じ値が得られる計算式 ( グループ a) を用いると, 必ず d = 1 になるはずので,2 つのデータの相関係数を 0.1 ずつ増加させていった場合に, 対応のある d と同じ値が得られる計算式 ( グループ b) を使用すると, 値がどのように変化するかを確認した ( 表 3 と図 1) 50
5 表 2 検定 分析の種類別の代表的な効果量の指標と大きさの目安 使用される検定 ( 分析 ) 対象と注意効果量の指標 小 (Small) 効果量の目安 中 (Medium) 大 (Large) 相関分析 r 重回帰分析 t 検定 (t test) 一元配置分散分析 (One-way ANOVA) 二元配置分散分析 (Two-way ANOVA) 多元配置分散分析 * (Multi-way ANOVA) * 三元配置以上の分散分析 共分散分析 (ANCOVA) 多変量分散分析 (MANOVA) 多変量共分散分析 (MANCOVA) カイ 2 乗検定 (χ 2 test) <ノンパラメトリック検定 > マン ホイットニーの U 検定ウィルコクスンの符号順位和検定 クラスカル ウォリスの順位和検定 フリードマン検定 r と d は 対応ありの場合 は注意 全体の検定 多重比較 主効果 交互作用 多重比較 多変量検定 従属変数ごとの 分散分析 R f r d η partial η 2 ω f r d η partial η 2 ω η partial η 2 ω r d 共変量の影響を取り除いて分析し, 主効果, 交互作用, 多重比較の効果量は他の分散分析と同じ multivariate η 2 (multivariate R 2 ) multivariate partial η 2 主効果, 交互作用, 多重比較の効果量は他の分散分析と同じ 2 2 の分割表 φ (= w) 以外 Cramer's V 検定統計量を Z に変換して r を求める r 水本 竹内 (2008, p. 62) を基に作成 多重比較の場合, 検定のように有意水準を調整する必要はない η 2 の大きさの目安は文献によっては,r を 2 乗した r 2 に合わせて,η 2 =.01( 効果量小 ),η 2 =.09 ( 効果量中 ), η 2 =.25( 効果量大 ) としているものもある また,partial η 2 の効果の大きさの基準は明確なものがない multivariate η 2 と multivariate partial η 2 の値は従属変数 (dependent variable) の数によって変わるため, 効果量の目安は Cohen (1988) を参照 51
6 表 3 2 つのシミュレーション データの相関関係による効果量 d の変化 グループ 計算式 2 つのデータの相関係数 対応のない場合の d (a) Borenstein et al. (2009, p. 29) Cortina & Nouri (2000, p. 50) 式 (2) で調整 (b) Kline (2004, p. 105) 豊田 (2009, p. 55) 効果量 d グループ (a) 対応のない場合の d と同じ値 グループ (b) データの対応を考慮して調整 つのデータの相関係数 図 1 2 つのデータの相関関係による効果量 d の変化 52
7 図 1からわかるように,2 つのデータの相関係数が変化しようとも, 対応のない場合の d と同じ値が得られる計算式については, 一定して d = 1.00 が得られている 一方, データの対応を考慮して相関係数や平均値差で調整している計算式は,2 つのデータの相関係数が 0.5 のときは, 対応のない場合と同じ値になる (d = 1) そして,0.5 より相関係数が小さい場合は, 対応のない場合よりも値が小さくなり, 相関係数が 0.5 より大きい場合は, 対応のない場合よりも値が大きくなっている 2 つのデータの相関係数が 0.9 の場合は, 対応のない場合の d 値 (d = 1) に比べて 2 倍以上になっている (d = 2.24) これら 2 つの効果量の違いは, 注目が 集団にあるのか ( 対応のない場合の d と同じ値 ), 個人の変化( データの対応を考慮して調整 ) にあるのか の違いであり, どちらも有効な情報をもたらしていると考えればよい ( 豊田,2009,pp ) 以上に示したシミュレーションの結果からわかるように, 繰り返しのあるデータで効果量の d や r を報告するときは, どの計算式を使ったのかわかるように, 参考文献や可能であれば式を明記しておくほうがよいだろう また, 繰り返しのあるデータの分析結果を論文で提示する際には, できる限り 2 つのデータの相関係数 ( もしくは差得点の平均値と標準偏差 ) を報告すべきである 相関係数が提示されていない場合は, 後述する検定力分析でも, 効果量を使って先行研究の結果を考察するメタ分析でも, データの対応を考慮して調整するグループ (b) の計算が正しく行えない (Dunlap, Cortina, Vaslow & Burke, 1996) 分析の再現性は量的研究の最低必要条件であるため, 後から誰がデータ分析をしたとしても再現できるような結果の提示を心がけるべきである 3. 検定力分析 3.1 統計的検定における 2 つの誤りと検定力統計的検定においては,(a) サンプル サイズ,(b) 有意水準,(c) 効果量,(b) 検定力の 4 つが, 検定結果の良し悪しを決定する要素である これらの要素に関連して, 統計的検定における 2 種類の誤り について理解しておく必要がある 有意水準は, 2.1 節で説明したとおり, 実験の前に慣例として 5% に定めておき, 実験で得られたデータから計算される p 値がその基準よりも小さければ, 有意差がある と判断する 5% で設定されている有意水準は α( アルファ ) で表される 有意水準は α を 5% と設定するということは, 同時に,100 回中 5 回までは, 推定を誤る可能性を認めている つまり,p <.05 だからといって, 常に有意差があるというわけではなく, 本当は有意差がないのに有意差がある という誤った結論を下してしまう可能性を排除していないのである そのため, 有意水準 α は 実際には差がないのに差がある と判断してしまう第 1 種の誤り (Type I error) を犯す確率を表している 第 1 種の誤りのイメージを分かりやすく説明するために, コンセプトのみを捉えた 53
8 形で以下に図を使って説明する ( あくまでコンセプトであるため, 厳密な統計学の考え方に基づいたものではないことに注意していただきたい ) 図 2 は検定を行ったあとに統計量として得られた値を 本当は 2 つのグループの平均値の差はないのが真実 というものさしを使って, どこに位置するかを測っている様子を表している ( 数値は実際には確率を表している ) グループの間の距離が離れているほど, 平均値の差が大きいとして, 実際に 2 つのグループに 差がない 場合には,(1) のようになる このものさしの右端に位置すればするほど, 差がないのが真実 のものさしでは測りきれないくらいの差があると考える ( 実際は, この差を作り出すのにサンプル サイズが関係するため, 実質的な差の大きさとイコールにはならないことに注意する 2.1 節参照 ) どれほど右に行けば, 差がある と考え始めることが可能かという基準が有意水準 (α) であり,95% のところに基準を作る すると残りは 5% になるので, ここに入るぐらいの差が得られた (2) のような場合は, p <.05 で有意差がある と解釈するとこの例では考えるようにする グループ 1 グループ 2 (1) 差がない場合 グループ 1 グループ 2 (2) 差がある場合 差がないのが真実 のものさし α 図 2 第 1 種の誤り (α) のイメージ しかし, 実際には差がないのに, たまたま設定した α よりも右の位置にくる値が得られることが 100 回に 5 回はある その場合には, 差がないのに差がある と誤った判断していることから, 第 1 種の誤りを犯していることになる その一方で, 実際には有意差があるのに有意差なし であるとしてしまう第 2 種の誤り (Type II error) も存在する 第 2 種の誤りの確率は β( ベータ ) で表される α は 0.05 と通常設定されているが, 第 2 種の誤りを犯す確率は,β = 0.20(20%) が望ましい 54
9 とされている (Cohen, 1988) 本当は有意差がないのに有意差がある といってしまう第 1 種の誤りに比べると, 本当は有意差があるのに有意差がない と判断するのは罪が軽いと考えられるため,α のように 0.05 ではなく,β は 0.20 とゆるめに設定されると考えればよい 第 1 種の誤りは, 差がないのが真実 のものさしを使っていたときに問題になっていたが, 第 2 種の誤りは, 図 3 下のような 差があるのが真実 のものさしを使うと考える グループ 1 グループ 2 差がないのが真実 のものさし α β 差があるのが真実 のものさし 図 3 第 2 種の誤り (β) のイメージ 第 1 種の誤り (α) と第 2 種の誤り (β) は図 3 からもわかるように, 同一のものさしを使っていないため,α + β = 1.0 とはならない しかし, 拮抗する性質があるため ( 豊田, 2009, p. 31), 第 1 種の誤りを犯す確率の α を小さく設定すると,β が大きくなってしまう つまり, どちらか一方に注意を向ければ良いというものではなく, 同時に考えなければならない ( ただし, 後述の検定力が高くなれば,β のみを小さくすることができる ) 図 3 の中の α を右にずらした場合 ( 有意水準を小さく設定した場合 ),β が大きくなることがわかるだろう 差があるのが母集団の本当の状態である という前提で, 実際に有意差を正しく検出できた場合には, 統計的検定の目的が達成されているといえる このように有意差を正しく検出できる確率のことを, 検定力 もしくは 検出力 (power) という 検定力は 1-β で定義される つまり, 本当は差があるのに, 差がない と判断してしまう確率の β を 1 から引くことで, 残りの 本当は差があり, 差がある と判断する確率を表している ( 図 4) 例えば,Cohen(1988) が推奨している β = 0.2 の場合,1-0.2 で 0.8 になる 検定力が 0.8 ということは, 実際に有意差があるときには,80% の確率でそれを検出できることを意味している また,Cohen(1992) は, 0.80 以下の検定力の場合には, 第 2 種の誤りを犯す可能性が高くなる (p. 156) としていて, 検定力と第 2 種の誤りは表裏一体の関係にあることがわかる 55
10 差がないのが真実 のものさし α 検定力 (1-β) β 差があるのが真実 のものさし 図 4 第 1 種の誤りと第 2 種の誤り, 検定力の関係 3.2 検定力分析の目的サンプル サイズ, 有意水準 (α), 検定力 ( 1-β), 効果量の 4 つは, 他の 3 つが決まれば残りの 1 つが決まるという関係である 前節のように, 推奨される検定力 (1-β) は 0.8, 有意水準 (α) は 0.05 と決まっているので, 6 統計的検定を用いる研究を計画する際に実際に考慮しなければならないのは, サンプル サイズと効果量になってくる サンプル サイズが, 研究においてどれくらい必要かという疑問に答えることができるのが検定力分析である サンプル サイズが小さすぎると, 検定力が下がってしまう可能性があり, 大きすぎると検定力が大きくなりすぎて, 実質的な差がなくても有意差があると判断してしまう 例えば, サンプル サイズが非常に大きい場合などは, 手元の比較的小さなサンプルから, 母集団の特性を推測する という, 統計的検定のそもそもの目的とは離れた行為になってしまう つまり, できるだけ小さなサンプル サイズで, 検定力を大きく ( 第 2 種の誤りを小さく ) し, 検定を行うことが理想的といえる ( 豊田, 2009, p. 35) このような観点から, 実験を行う前に検定力分析 (power analysis) を利用し, サンプル サイズを決定することが推奨される 検定力分析は, おもに以下の 2 つの目的で行われる ( その他の検定力分析は,Faul, Erdfelder, Lang, & Buchner, 2007 を参照 ) (1) サンプル サイズを決める ( 事前の分析 : A priori) 実験を実施する前に, これまでの先行研究からわかっている ( 推測される ) 効果量, 有意水準 (α), 目指している検定力 ( 1-β) からサンプル サイズを決定する (2) 検定力を調べる ( 事後の分析 : Post hoc) 実験を実施した後に, サンプル サイズ, 効果量, 有意水準 (α) から, 検定力 (1-β) を確認する 56
11 検定力分析は, 図 5 の統計的検定における 4 つの要素では,3 つが決まれば残り 1 つが決まる関係にある性質を利用して求めることができる 例えば, 上記の検定力分析の (1) で実験前にサンプル サイズを決める場合は, 図 5 のサンプル サイズ以外の 3 つ ( 有意水準, 検定力, 効果量 ) の値を使えば計算することが可能である また,(2) の検定力を事後の分析で求める場合も, 図 5 の検定力以外の 3 つ ( 有意水準, サンプル サイズ, 効果量 ) の値を使えばよい 図 5 統計的検定における 4 つの要素 3.3 G*Power 3 を使った各種検定の検定力分析検定力分析は, ネット上で入手できるフリーソフト G*Power 3(Faul, Erdfelder, Lang & Buchner, 2007: 7 を使って比較的簡単に実行できる ( 図 6 のように G*Power 3 は Mac 版も Windows 版も提供されている ) 以下では,G*Power 3 を使って, 主要な各種検定の検定力分析 ( 事前と事後 ) を行う方法を説明する (2011 年 3 月現在,G*Power 3 のホームページでは説明が未だに不十分であるため有用であると思われる ) なお, 検定力を実験後に分析する事後の分析 (Post hoc) では, 得られる情報が少ないと考えられているため (Hoening & Heisey, 2001; O Keefe, 2007), 検定力分析の実際の適用例は, より重要な実験前のサンプル サイズの計画である事前の分析 (A priori) のみに限定した 57
12 <G*Power 3 での検定力分析の方法を本稿で説明する各種検定 > (1) 対応なしの t 検定 (independent t-test) (2) 対応ありの t 検定 (dependent t-test) (3) 対応なしの一元配置分散分析 (one-way ANOVA) (4) 対応ありの一元配置分散分析 (one-way repeated measures ANOVA) (5) 二元配置分散分析 (two-way ANOVA) (6) 共分散分析 (ANCOVA) (7) 多変量分散分析 (MANOVA) (8) カイ 2 乗検定 (χ 2 test) (9) ノンパラメトリック検定 (nonparametric tests) (10) 相関係数 (correlation) (11) 単回帰 重回帰分析 (regression analysis) 図 6 G*Power 3 起動時 ( 左が Windows 版, 右が Mac 版 ) 58
13 (1) 対応なしの t 検定 (independent t-test) Test family t tests Statistical test Means: Difference between two independent means (two groups) Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Tails(s): Two( 普通は両側検定 ) Effect size d: 先行研究からわかっている効果量の大きさを入力 もし, 先行研究での効果量がわからなければ,d = 0.2( 効果量小 ),0.5 ( 効果量中 ),0.8( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.5 ( 効果量中 ) にしておく Power (1 β error prob): 0.8(Cohen, 1992 で推奨されている検定力 ) Allocation ratio N2/N1: 2 つのグループの n の比 事後の分析(Post hoc) の場合 Tails(s): Two( 普通は両側検定 ) Effect size d: 得られたデータの効果量 Determine をクリックすると,Mean や SD を入力することで効果量を計算できる この d は本稿表 4 のグループ B の計算で求められたもの Sample size group 1: グループ 1 の人数 ( サンプル サイズ ) Sample size group 2: グループ 2 の人数 ( サンプル サイズ ) 適用例事前の分析 (A priori) 両側検定, 中程度の効果量 (d = 0.5), α = 0.05,Power = 0.8,Allocation ratio = 1 以上の条件で, サンプル サイズは各群 64 名 ( 計 128 名 ) 必要 59
14 (2) 対応ありの t 検定 (dependent t-test) Test family t tests Statistical test Means: Difference between two dependent means (matched pairs) Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Tails(s): Two( 普通は両側検定 ) Effect size d: 先行研究からわかっている効果量の大きさを入力 もし, 先行研究での効果量がわからなければ,d = 0.2( 効果量小 ),0.5 ( 効果量中 ),0.8( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.5 ( 効果量中 ) にしておく Power (1 β error prob): 推奨されている検定力 0.8(Cohen, 1992) 事後の分析(Post hoc) の場合 Tails(s): Two( 普通は両側検定 ) Effect size d: 得られたデータの効果量 この d は表 4 のグループ B の計算で求められたもの Determine をクリックすると,Mean や SD を入力することで効果量を計算できる ( グループ間の相関係数が必要 ) この d は表 4 のグループ B の計算で求められたもの Total sample size: 実験参加者数 ( サンプル サイズ ) 適用例事前の分析 (A priori) 両側検定, 中程度の効果量 (d = 0.5), α = 0.05,Power = 0.8 以上の条件で, サンプル サイズは 34 名必要 ( 対応なしの場合の約半分になっている ) (3) 対応なしの一元配置分散分析 (one-way ANOVA) Test family F tests Statistical test ANOVA: Fixed effects, omnibus, one-way Type of power analysis 60
15 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size f: 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での効果量がわからなければ,f = 0.10( 効果量小 ),0.25( 効果量中 ),0.40( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.25( 効果量中 ) にしておく Power (1 β error prob): 0.8 Number of groups: グループの数 事後の分析(Post hoc) の場合 Effect size f: 得られたデータの効果量を計算する Determine をクリックすると, 平均や分散,partial η 2 などから効果量 f を計算できる Total sample size: すべてのグループの人数の合計 Number of groups: グループの数 適用例事前の分析 (A priori) 中程度の効果量 (f = 0.25), α = 0.05,Power = 0.8,3 群 以上の条件で, サンプル サイズは合計 159 名必要 (1 群あたり 53 名 [159 名 /3 群 ]) (4) 対応ありの一元配置分散分析 (one-way repeated measures ANOVA) Test family F tests Statistical test ANOVA: Repeated measures, within factors Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size f: 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での効果量がわからなければ,f = 0.10( 効果量小 ),0.25( 効果量中 ),0.40( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果 61
16 量を入力しておく もし何もわからなければ,0.25( 効果量中 ) にしておく Power (1 β error prob): 0.8 Number of groups: グループの数 ( 一元配置なので 1 を入力 ) Number of measurements: 水準の数 ( 繰り返した測定の数 ) 例えば,pre, post, delayed と 3 回測定を行った場合は,3 と入力する Corr among rep measures: 水準間の相関 先行研究やパイロットスタディで相関がわかるのであればそれを入力 もしわからなければ,0.5 としておく Nonsphericition correction ε: 球面性の仮定 (sphericity assumption) が満たされていたら 1 球面性の仮定が満たされていない場合は,1/( 水準数 1) で下限値を入力しておけばよい (Faul, Erdfelder, Lang & Buchner, 2007, p. 181) MANOVA で検定力を求める方法の場合は, 球面性の仮定は必要ない ( MANOVA: Repeated measures, within factors で実行できる ) 事後の分析(Post hoc) の場合 Effect size f: 得られたデータの効果量を計算する Determine をクリックすると,partial η 2 などから効果量 f を計算できる Total sample size: すべてのグループの人数の合計 Number of groups: グループの数 ( 一元配置の場合は 1) Number of measurements: 水準の数 ( 繰り返した測定の数 ) 例えば,pre, post, delayed と 3 回測定を行った場合は,3 と入力する Corr among rep measures: 水準間の相関 ( 級内相関 ) Nonsphericition correction ε: 球面性の仮定 (sphericity assumption) が満たされていたら 1 球面性の仮定が満たされていない場合は,1 / ( 水準数 -1) で下限値を入力しておけばよい (Faul, Erdfelder, Lang & Buchner, 2007, p. 181) SPSS などでは, イプシロン として Greenhouse-Gaisser( グリーンハウス ゲイザー ) や,Huynh-Feldt( ホイン フェルト ) の値が出力されるので, そちらの数値を使えば正確な値が得られる 適用例事前の分析 (A priori) 中程度の効果量 (f = 0.25), α = 0.05,Power = 0.8,1 群 ( 一元配置のため ),3 回の測定 (pre, post, delayed など ), 相関は 0.5,Nonsphericition correction ε = 1 以上の条件で, サンプル サイズ 28 名 62
17 (5) 二元配置分散分析 (two-way ANOVA) 二元配置以上 ( 多要因 ) の分散分析では, 要因の主効果と交互作用, それぞれに対して検 定力分析を行うことになる Test family F tests Statistical test (2 要因とも対応なしの場合 )ANOVA: Fixed effects, special, main effects and interactions Type of power analysis 事前の分析の場合 事後の分析の場合 Input parameters 事前の分析 (A priori) の場合 A priori: Compute required sample size given α, power, and effect size Post hoc: Compute achieved power given α, sample size, and effect size Effect size f: 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での Power (1 β error prob): 0.8 Numerator df: 水準数 1 効果量がわからなければ,f = 0.10( 効果量小 ),0.25( 効果量中 ),0.40( 効 果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果 量を入力しておく もし何もわからなければ,0.25( 効果量中 ) にしておく 二元配置では 2 つの要因のうち水準の多い方を用いれば, より多い必要 人数がわかる 交互作用は,( 要因 A-1) ( 要因 B-1) になる 主効果か交互 作用のどちらを使ってサンプル サイズを計算するかは, 研究の目的によ る ( 交互作用があることが期待されて, それが研究の目的に関連している 場合は, 交互作用でのサンプル サイズを算出する ) Number of groups: グループの数 ではなく, 要因 A の水準 要因 B の水準で計算され る数 ( 総セル数 ) 事後の分析(Post hoc) の場合 要因の主効果と交互作用, それぞれに対して検定力分析を行う Effect size f: 得られたデータの効果量を計算する Determine をクリックすると,partial η 2 などから効果量 f を計算できる Total sample size: すべてのグループの人数の合計 Numerator df: 水準数 1( 主効果, 交互作用ごとに計算する ) 交互作用は,( 要因 A-1) ( 要因 B-1) になる Number of groups: グループの数 ではなく, 要因 A の水準 要因 B の水準で計算される数 ( 総セル数 ) 63
18 適用例事前の分析 (A priori) 要因 A(3 水準 ) 要因 (3 水準 ) の二元配置分散分析を行う場合 中程度の効果量 (f = 0.25), α = 0.05,Power = 0.8,Numerator df = 2( 両要因とも 3 水準なので 3-1), Number of groups = 9(3 水準 3 水準 ) 以上の条件で, セル 1 つにつき 18 名必要 (= 合計 158 名 /[3 群 3 水準 ]) < 追加説明 > 対応のない要因 (3 水準 ) と対応のある要因 (3 水準 ) の二元配置分散分析の場合 対応のない要因 対応のある要因 交互作用 ANOVA: Repeated measures, 2between factors で検定力算出 Effect size f: 0.25( 効果量中 ) α error prob: 0.05 Power (1 β error prob): 0.8 Number of groups: 3 Number of measurements: 3 Corr among rep measures: 0.5 Total sample size: 108(1 群につき 36 名必要 ) ANOVA: Repeated measures, within factors で検定力算出 Effect size f: 0.25( 効果量中 ) α error prob: 0.05 Power (1 β error prob): 0.8 Number of groups: 3 Number of measurements: 3 Corr among rep measures: 0.5 Nonsphericition correction ε: 1 Total sample size: 30(1 群につき 10 名必要 ) ANOVA: Repeated measures, within-between interaction で検定力算出 Effect size f: 0.25( 効果量中 ) α error prob: 0.05 Power (1 β error prob): 0.8 Number of groups: 3 Number of measurements: 3 Corr among rep measures: 0.5 Nonsphericition correction ε: 1 Total sample size: 36(1 群につき 12 名必要 ) 64
19 (6) 共分散分析 (ANCOVA) Test family F tests Statistical test ANCOVA: Fixed effects, main effects and interactions Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size f: 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での効果量がわからなければ,f = 0.10( 効果量小 ),0.25( 効果量中 ),0.40( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.25( 効果量中 ) にしておく Power (1 β error prob): 0.8 Numerator df: グループの数 1 Number of groups: グループの数 Number of covariates: 使用する共変量の数 事後の分析(Post hoc) の場合 Effect size f: 得られたデータの効果量を計算する Determine をクリックすると,partial η 2 などから効果量 f を計算できる Total sample size: すべてのグループの人数の合計 Numerator df: グループの数 1 Number of groups: グループの数 Number of covariates: 使用する共変量の数 適用例事前の分析 (A priori) 中程度の効果量 (f = 0.25), α = 0.05,Power = 0.8,3 群, 共変量 1 つ 以上の条件で, サンプル サイズは合計 158 名必要 (1 群あたり 53 名 3 群 ) 65
20 (7) 多変量分散分析 (MANOVA) Test family F tests Statistical test MANOVA: Global effects( 一元配置多変量分散分析モデルの場合 ) 二元配置以上の多変量分散分析の場合は, 目的に応じて以下を使用 ( 二元配置分散分析の説明を参照 ) MANOVA: Special effects and interactions MANOVA: Repeated measures, between factors MANOVA: Repeated measures, within factors MANOVA: Repeated measures, within-between interaction Type of power analysis 事前の分析の場合 事後の分析の場合 A priori: Compute required sample size given α, power, and effect size Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size f 2 (V): 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での効果量がわからなければ,f 2 = 0.02( 効果量小 ),0.15( 効果量中 ),0.35 ( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.15( 効果量中 ) にしておく Power (1 β error prob): 0.8 Number of groups: グループの数 Response variables: 従属変数の数 事後の分析 (Post hoc) の場合 Effect size f 2 (V): 得られたデータの効果量を計算する Determine をクリックすると, Pillai V(Options でその他の効果量を選ぶことも可能 ) から効果量 f 2 を計 算できる Total sample size: 人数の合計 Number of groups: グループの数 Response variables: 従属変数の数 適用例事前の分析 (A priori) 中程度の効果量 (f 2 = 0.15), α = 0.05,Power = 0.8,3 群, 従属変数 2 つ 66
21 以上の条件で, サンプル サイズは合計 45 名必要 (1 群あたり 15 名 3 群 ) MANOVA であれば, 上記のように 1 群あたりの人数は比較的少なくて構わないが, 同じサンプル サイズで MANOVA のあとに ANOVA を行うような場合には, MANOVA の基準では検定力が非常に低くなってしまうため, 実験計画段階で後の ANOVA までを考慮してサンプル サイズを算出しておかなければならない (8) カイ 2 乗検定 (χ 2 test) Test family χ 2 tests Statistical test Goodness-of-fit tests: Contingency tables Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size w: 先行研究からわかっている効果量の大きさを入力 もし, 先行研究での効果量がわからなければ,w = 0.1( 効果量小 ),0.3 ( 効果量中 ),0.5( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.3 ( 効果量中 ) にしておく Power (1 β error prob): 0.8 Df: 自由度 1 変数を扱う適合度検定の場合は カテゴリ数 1 となる クロス表の検定である独立性検定では ( 行の数 1) ( 列の数 1) となる 事後の分析(Post hoc) の場合 Effect size w: 得られたデータの効果量 Total sample size: 合計人数 Df: 自由度 1 変数を扱う適合度検定の場合は カテゴリ数 1 となる クロス表の検定である独立性検定では ( 行の数 1) ( 列の数 1) となる 適用例事前の分析 (A priori) 中程度の効果量 (w = 0.3), α = 0.05,Power = 0.8,3 4 のクロス表 以上の条件で, サンプル サイズは 152 名必要 67
22 (9) ノンパラメトリック検定 (nonparametric tests) G*Power 3 では, ノンパラメトリック検定の検定力は, マン ホイットニーの U 検定 (2 群, データの対応なし ) とウィルコクスンの符号順位和検定 (2 群, データの対応あり ) が用意されているが, その他の場合は, 対応するパラメトリック検定で検定力分析を行えばよい ただし, パラメトリック検定の前提を満たしている場合に, ノンパラメトリック検定を行うと検定力が下がる (Siegel & Castellan, 1988) <2 群の場合 > マン ホイットニーの U 検定 (2 群, データの対応なし ) t tests Means: Wilcoxon-Mann-Whitney test (two groups) ウィルコクスンの符号順位和検定 (2 群, データの対応あり ) t tests Means: Wilcoxon signed-rank test (matched pairs) <3 群以上の場合 > クラスカル ウォリスの順位和検定 (3 群以上, データの対応なし ) F tests ANOVA: Fixed effects, omnibus, one-way フリードマン検定 (3 群以上, データの対応あり ) F tests ANOVA: Repeated measures, within factors (10) 相関係数 (correlation) 相関係数の検定は 無相関検定 と呼ばれており, 母集団の相関が 0 である (ρ = 0) という帰無仮説を検定する 相関係数の強さには関係がないことからも, この検定自体にはほとんど意味がない ( 前田, 2004, p. 66) つまり, 母相関が 0 ではないか という点を, 手元のデータの相関係数から行えるだけのサンプル サイズがあるかということだけを確認できる Test family Exact Statistical test Correlation: Bivariate normal model Type of power analysis 事前の分析の場合 事後の分析の場合 A priori: Compute required sample size given α, power, and effect size Post hoc: Compute achieved power given α, sample size, and effect size 68
23 Input parameters 事前の分析(A priori) の場合 Tails(s): Two Correlation ρ H1: 先行研究からわかっている効果量の大きさを入力 もし, 先行研究での効果量がわからなければ,ρ = 0.1( 効果量小 ),0.3 ( 効果量中 ),0.5( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.3 ( 効果量中 ) にしておく Power (1 β error prob): 0.8 Correlation ρ H0: 0 ( 検定の帰無仮説 母相関は 0 である という値を入力 ) 事後の分析(Post hoc) の場合 Tails(s): Two Correlation ρ H1: 得られたデータの効果量 ( 相関係数の場合は,r をそのまま入力 ) Total sample size: サンプル サイズ Correlation ρ H0: 0 ( 検定の帰無仮説 母相関は 0 である という値を入力 ) 適用例事前の分析 (A priori) 両側検定, 中程度の効果量 (ρ = 0.3), α = 0.05,Power = 0.8 以上の条件で, サンプル サイズは 84 名必要 (11) 単回帰 重回帰分析 (regression analysis) 回帰分析では, 回帰係数の検定を行うが, この検定は (10) で説明している相関係数の無相関検定と同じく, 母集団での回帰係数(β) が 0 である という帰無仮説を検定する 以下は単純な回帰分析の場合の G*Power 3 での検定力分析であるが, その他の回帰分析の場合は,Faul, Erdfelder, Buchner and Lang (2009) を参照 Test family F tests Statistical test Linear multiple regression: Fixed model, R 2 deviation from zero 単回帰 重回帰分析ともにできるが, 重回帰の決定係数の増分に関する検定については,Linear multiple regression: Fixed model, R 2 increase を使用する Number of tested predictors に増加分の説明変数の数を入れて,Total 69
24 number of predictors に全説明変数の数を入れれば分析可能 Type of power analysis 事前の分析の場合 A priori: Compute required sample size given α, power, and effect size 事後の分析の場合 Post hoc: Compute achieved power given α, sample size, and effect size Input parameters 事前の分析(A priori) の場合 Effect size f 2 : 先行研究からわかっている効果量の大きさを入力する もし, 先行研究での効果量がわからなければ,f 2 = 0.02( 効果量小 ),0.15( 効果量中 ),0.35 ( 効果量大 ) の Cohen(1988) の基準を用いて, 自分の研究での予測される効果量を入力しておく もし何もわからなければ,0.15( 効果量中 ) にしておく Power (1 β error prob): 0.8 Number of predictors: 説明変数の数 ( 単回帰の場合は 1, 重回帰の場合は 2 以上 ) 事後の分析(Post hoc) の場合 Effect size f 2 : 得られたデータの効果量 Total sample size: サンプル サイズ Number of predictors: 説明変数の数 ( 単回帰の場合は 1, 重回帰の場合は 2 以上 ) 適用例事前の分析 (A priori) 中程度の効果量 (f 2 = 0.15), α = 0.05,Power = 0.8, 説明変数 3 つ 以上の条件で, サンプル サイズは 77 名必要 4. まとめ本稿では, 効果量がなぜ必要なのかを説明し, いくつかある効果量の指標の中で, 対応のあるデータにおける d の算出方法について, シミュレーションを用いながら検証を行った 次に, 検定力分析の基礎的な考え方と,G*Power 3 を使った検定力分析の具体的な方法の解説を行った 効果量と検定力分析という, 統計的検定における重要概念は, いくつかの応用言語学関連の国際ジャーナルでも論文中で報告するようにと推奨されているため, 今後はさらに利用が増えていくはずである たとえば, 我々の分野における有力国際誌の TESOL Quarterly における Quantitative Research Guidelines( 量的研究ガイドライン ) では次のよう 70
25 なセクションがある ( Power and sample size. Provide information on the sample size and the process that led to the decision to use that size. Provide information on the anticipated effect size as you have estimated it from previous research. Provide the alpha level used in the study, discussing the risk of Type I error. Provide the power of your study (calculate it using a standard reference such as Cohen, 1988, or a computer program). Discuss the risk of Type II error. このガイドラインからも, 本稿で説明した, 効果量や検定力 ( そして, 第 1 種の誤りと第 2 種の誤り ) を理解し, 活用していくことは非常に重要であるといえるだろう 最後に, 効果量と検定力分析の概念がわかっていれば, 論文中で提示されているデータへの洞察力が深まるということを示す例を一つ挙げておく 以下の表 4 は, コンピュータを使った学習 指導についての研究を専門にしている, ある有名な国際ジャーナルに掲載されていた論文から抜粋したものである ( 表の見た目は手を加えてあるが,p 値の記載方法も含めて, 数値はそのままにしている ) この 統計的に有意な差が見られた という結果から, 著者はコンピュータを使った学習 ( 処置群 ) が, 使わなかった学習 ( 対照群 ) よりも効果的であったという主張を行っている 表 4 ある研究論文に掲載されていた結果 グループ 人数 テストの点数 ( 平均点 ) 標準偏差 処置群 (treatment) 対照群 (contrast) 対応のない t 検定 p = この結果を効果量で解釈すると,d = 0.26( 効果量小 ) となり,p = という p 値にも関わらず, 効果量は小さいということがわかる また, 検定力の事後の分析 (Post hoc) では,Power(1 β) が 0.09 となり, 非常に検定力が低い検定であったこともわかる 同じ効果量で,α =.05, 検定力 0.8 を得るためには, サンプル サイズは各グループに 228 名必要であることからも, そもそも p = という値は得られないのではないかという疑問が湧いてくる そこで, 同じ人数, 平均値, 標準偏差のデータを再現し, シミュレーションを行ってみたところ p =.54 であった つまり, 論文で報告されている p 値は間違い ( もしくは偽り ) なのである 山森 (2004) が述べているように, 査読者も編集者も万能ではない (p. 158) というのが, このような結果が堂々と国際ジャーナルに掲載されている原因になっていると思われるが, このような論文が 1 本掲載されているだけで, ジャー 71
26 ナル自体の価値が下がってしまうといっても過言ではないため, 査読者や編集者の責任は重いだろう このように, 効果量と検定力分析が使用できれば,p 値のみで間違った結果の解釈を行っている論文に警笛を鳴らすことも可能なのである 外国語教育学研究でも, 効果量と検定力分析の考え方が広まり, 論文での報告が増え, 正しい統計的検定 が行われることを期待している 謝辞 本稿は, 平成 20 年度 ~22 年度科学研究費補助金 ( 基盤研究 (C) 外国語学習方略の脳内基盤 : 読解方略の意識化と指導モデルの視点から 課題番号 : , 研究代表者 : 関西大学外国語学部竹内理 ) の内容の一部を基にしたものである また, 内容については, 印南洋氏 ( 豊橋技術科学大学 ), 小泉利恵氏 ( 常磐大学 ) から貴重なアドバイスを頂いた ここに記して感謝する 注 1. 有意水準は検定前に一定の値に決めておく基準で,p 値は検定後に得られる具体的な数値であって 2 つは似ているが同じものではない また, 有意水準を.05 に設定するというのは全く恣意的 ( そして慣例的 ) なものであるので, 絶対的な基準ではない 2. この乱数は, 群馬大学の青木繁伸先生のホームページ ( を参考にして,R で発生させた 3. Kline (2004, p. 102) は, この計算によって得られる値は Hedges s g であり, 厳密には, この指標を d と呼ぶのは間違いであるとしている しかし,d として使われることが圧倒的に多いため, 本稿でもこの指標を d として扱う 4. 繰り返しのある場合の効果量 r は, 繰り返しのある場合の t 検定の t 値を計算式に用いるが, データの相関により, 実際の効果量よりは高めの値が算出されることになる (Field, 2009, p. 332) また, 一般に知られている, 効果量 r から d への変換式である, d = 2r / sqrt (1 r 2 ) は, 対応のない場合の計算式であるので, 対応のある場合に正確な d には変換できない 5. 比較した計算式は以下のもの Borenstein, et al. (2009, p. 29) d = 平均値差 平均値差の!"!(!!!) Cortina & Nouri (2000, p. 50) d = 対応ありの t 値!(!!!)! Kline (2004, p. 107) d = 対応ありの t 値 Grissom & Kim (2005, p. 67); Kline (2004, p. 105) d =! 平均値差の!"!( データ! の!"!! データ! の!"! ) 平均値差平均値差の!" 豊田 (2009, p. 55) d = 対応ありの t 値! 6. これらは推奨されている値であるため, もちろん, 研究の目的によっては違う値に変えても構わない 7. 検定力分析は R でも実行可能 ( 豊田, 2009; 山田 杉澤 村井, 2008)! 72
27 参考文献 American Psychological Association. (2009). Publication manual of the American Psychological Association (6th ed.). Washington, DC: American Psychological Association. Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R. (2009). Introduction to metaanalysis. West Sussex, U.K. John Wiley & Sons. Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum. Cohen, J. (1992). A power primer. Psychological Bulletin, 112, Cortina, J. M., & Nouri, H. (2000). Effect size for ANOVA designs. Thousand Oaks, CA: Sage. Dunlap, P. W., Cortina, M. J., Vaslow, B. J., & Burke, J. B. (1996). Meta-analysis of experiments with matched groups or repeated measures designs. Psychological Methods, 1, Faul, F., Erdfelder, E., Lang, A.-G. & Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39, Retrieved from Field, A. (2009). Discovering statistics using SPSS (3rd ed.). London: SAGE. Grissom, R. J., & Kim, J. J. (2005). Effect sizes for research: A broad practical approach. Mahwah, NJ: Lawrence Erlbaum. Hoenig, J. M., & Heisey, D. M. (2001). The abuse of power : The pervasive fallacy of power calculations for data analysis. The American Statistician, 55, Retrieved from Kline, R. B. (2004). Beyond significance testing: Reforming data analysis methods in behavioral research. Washington, DC: American Psychological Association. 前田啓朗 (2004). テスト得点間の関係の検討 相関分析. 前田啓朗 山森光陽 ( 編 ) 磯田貴道 廣森友人 ( 著 ) 英語教師のための教育データ分析入門: 授業が変わるテスト 評価 研究 (pp ). 東京 : 大修館書店. 水本篤 竹内理 (2008). 研究論文における効果量の報告のために 基礎的概念と注意点 関西英語教育学会紀要英語教育研究 31, Retrieved from OʼKeefe, D. J. (2007). Post hoc power, observed power, a priori power, retrospective power, prospective power, achieved power: Sorting out appropriate uses of statistical power analyses. Communication Methods and Measures, 1, Retrieved from Siegel, S., & Castellan, N. J. Jr. (1988). Nonparametric statistics for the behavioral sciences. (2nd ed.). New York: McGraw-Hill. 豊田秀樹 ( 編著 )(2009). 検定力分析入門 R で学ぶ最新データ解析 東京 : 東京図書. 山田剛史 杉澤武俊 村井潤一郎 (2008). R によるやさしい統計学 東京 : オーム社. 山森光陽 (2004). 分析結果の書き方ガイド. 前田啓朗 山森光陽 ( 編 ) 磯田貴道 廣森友人 ( 著 ) 英語教師のための教育データ分析入門: 授業が変わるテスト 評価 研究 (pp ). 東京 : 大修館書店. 73
Microsoft Word - Power_Analysis_Jp_ docx
Power Analysis using G*Power Version 1.0 013 年 3 月 03 日 評価学博士 佐々木亮 サンプルサイズの検討方法 1. 最低のサンプルサイズサンプルサイズに関する考え方 統計分析を用いた調査報告書では サンプルサイズとして 30 あるいは 5 を用いている場合が頻繁に見られる 事前 事後比較のための 1 群の t 検定では まさに 30 あるいは 5 が必要ということになり
(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説
第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
PowerPoint プレゼンテーション
1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定
<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>
重回帰分析 (2) データ解析演習 6.9 M1 荻原祐二 1 発表の流れ 1. 復習 2. ダミー変数を用いた重回帰分析 3. 交互作用項を用いた重回帰分析 4. 実際のデータで演習 2 復習 他の独立変数の影響を取り除いた時に ある独立変数が従属変数をどれくらい予測できるか 変数 X1 変数 X2 β= 変数 Y 想定したモデルが全体としてどの程度当てはまるのか R²= 3 偏相関係数と標準化偏回帰係数の違い
Medical3
Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
ANOVA
3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.
Microsoft PowerPoint - e-stat(OLS).pptx
経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
Medical3
1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー
Excelによる統計分析検定_知識編_小塚明_5_9章.indd
第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
Microsoft Word - Stattext12.doc
章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
Microsoft PowerPoint - 資料04 重回帰分析.ppt
04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline
Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (
http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています
基礎統計
基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
Chapter 1 Epidemiological Terminology
Appendix Real examples of statistical analysis 検定 偶然を超えた差なら有意差という P
経済統計分析1 イントロダクション
1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,
PowerPoint プレゼンテーション
学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: [email protected]) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合
青焼 1章[15-52].indd
1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし
13章 回帰分析
単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える
Microsoft PowerPoint - A1.ppt [互換モード]
011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)
Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]
R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ
こんにちは由美子です
Sample size power calculation Sample Size Estimation AZTPIAIDS AIDSAZT AIDSPI AIDSRNA AZTPr (S A ) = π A, PIPr (S B ) = π B AIDS (sampling)(inference) π A, π B π A - π B = 0.20 PI 20 20AZT, PI 10 6 8 HIV-RNA
1.民営化
参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方
現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」
URL: http://tsigeto.info/statg/ I () 3 2016 2 ( 7F) 1 : (1); (2) 1998 (70 20% 6 9 ) (30%) ( 2) ( 2) 2 1. (4/14) 2. SPSS (4/21) 3. (4/28) [] 4. (5/126/2) [1, 4] 5. (6/9) 6. (6/166/30) [2, 5] 7. (7/78/4)
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと
異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと 使用する標本は母集団から無作為抽出し 母集団を代表している値と考える 標本同士を比較して得た結果から
Ⅱ 方法と対象 1. 所得段階別保険料に関する情報の収集 ~3 1, 分析手法
67 論文 要旨 : 1507 キーワード : Ⅰ 緒言 65 2014 89 5 2 3 5 6 2 5 6 3 4 3 4 2006 2015 9 9 68 2018. 3 2015 Ⅱ 方法と対象 1. 所得段階別保険料に関する情報の収集 6 2015 7 2016 2 ~3 1,507 2. 分析手法 69 3 3 3 A B C 3 A 4 1 1 2 2 2014 2014 2014 5
仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています
MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良
Microsoft PowerPoint - ch04j
Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数
<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>
第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(
簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟
濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟度別クラス編成を実施している 本稿では さらにの導入へ向けて 既存のプレイスメントテストを活用したクラス編成の可能性について検討した 3 教科に関するプレイスメントテストの偏差値を説明変数
Microsoft Word - mstattext02.docx
章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で
先端社会研究所紀要 第12号☆/1.巻頭言
Kwansei Gakuin University Rep Title Author(s) Citation < 研 究 ノート> 他 者 問 題 解 決 の 遅 延 要 因 としての 正 統 性 : 実 験 的 手 法 による 検 討 寺 島, 圭 関 西 学 院 大 学 先 端 社 会 研 究 所 紀 要 = Annual review of advanced social research,
<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>
3 群以上の比率の差の多重検定法 013 年 1 月 15 日 017 年 3 月 14 日修正 3 群以上の比率の差の多重検定法 ( 対比較 ) 分割表で表記される計数データについて群間で比率の差の検定を行う場合 全体としての統計的有意性の有無は χ 検定により判断することができるが 個々の群間の差の有意性を判定するためには多重検定法が必要となる 3 群以上の比率の差を対比較で検定する方法としては
Microsoft Word - SPSS2007s5.doc
第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では
切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (
統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない
Microsoft Word - apstattext04.docx
4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1
Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt
重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?
Microsoft Word doc
. 正規線形モデルのベイズ推定翠川 大竹距離減衰式 (PGA(Midorikawa, S., and Ohtake, Y. (, Attenuation relationships of peak ground acceleration and velocity considering attenuation characteristics for shallow and deeper earthquakes,
MedicalStatisticsForAll.indd
みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18
Stata 11 Stata ROC whitepaper mwp anova/oneway 3 mwp-042 kwallis Kruskal Wallis 28 mwp-045 ranksum/median / 31 mwp-047 roctab/roccomp ROC 34 mwp-050 s
BR003 Stata 11 Stata ROC whitepaper mwp anova/oneway 3 mwp-042 kwallis Kruskal Wallis 28 mwp-045 ranksum/median / 31 mwp-047 roctab/roccomp ROC 34 mwp-050 sampsi 47 mwp-044 sdtest 54 mwp-043 signrank/signtest
Microsoft Word - å“Ÿåłžå¸°173.docx
回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw
データ科学2.pptx
データ科学 多重検定 2 mul%ple test False Discovery Rate 藤博幸 前回の復習 1 多くの検定を繰り返す時には 単純に個々の検定を繰り返すだけでは不十分 5% 有意水準ということは, 1000 回検定を繰り返すと, 50 回くらいは帰無仮説が正しいのに 間違って棄却されてすまうじちがあるということ ex) 1 万個の遺伝子について 正常細胞とガン細胞で それぞれの遺伝子の発現に差があるかどうかを検定
回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)
回帰分析の用途 実験計画法の意義 グラフィカルモデリングの活用 早稲田大学創造理工学部 経営システム工学科 永田靖, The Institute of JUSE. All Rights Reserved. 内容. 回帰分析の結果の解釈の仕方. 回帰分析による要因効果の把握の困難さ. 実験計画法の意義 4. グラフィカルモデリング 参考文献 : 統計的品質管理 ( 永田靖, 朝倉書店,9) 入門実験計画法
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.
日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー
日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チーム 日本新薬 ( 株 ) 田中慎一 留意点 本発表は, 先日公開された 生存時間型応答の評価指標 -RMST(restricted
Microsoft Word - 保健医療統計学112817完成版.docx
講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均
Microsoft Word - 補論3.2
補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は
0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌
0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい
Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ
カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では
1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな
1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC
Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる
<4D F736F F F696E74202D204D C982E682E892B290AE82B582BD838A E8DB782CC904D978A8BE68AD482C98AD682B782E988EA8D6C8E402E >
SAS ユーザー総会 2017 Mantel-Haenszel 法により調整したリスク差の信頼区間に関する一考察 武田薬品工業株式会社日本開発センター生物統計室佐々木英麿 舟尾暢男 要旨 Mantel-Haenszel 法により調整したリスク差に関する以下の信頼区間の算出方法を紹介し 各信頼区間の被覆確率をシミュレーションにより確認することで性能評価を行う Greenland 信頼区間 Sato 信頼区間
Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]
R で統計解析入門 (4) 散布図と回帰直線と相関係数 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. の場所に移動し, データを読み込む 4. データ DEP から薬剤
Rの基本操作
Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa 機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり
JUSE-StatWorks/V5 活用ガイドブック
4.6 薄膜金属材料の表面加工 ( 直積法 ) 直積法では, 内側に直交配列表または要因配置計画の M 個の実験, 外側に直交配列表または要因配置計画の N 個の実験をわりつけ, その組み合わせの M N のデータを解析します. 直積法を用いることにより, 内側計画の各列と全ての外側因子との交互作用を求めることができます. よって, 環境条件や使用条件のように制御が難しい ( 水準を指定できない )
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝
ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって
際 正規分布に従わない観測値に対して通常の t 検定を適用した場合 どのような不都合が生じるかを考える 一般に通常の t 検定や Wilcoxon 検定などの仮説検定を行う場合 2つの処理の間に差がないことが真実であるにもかかわらず差があると主張する過誤確率 ( 第 1 種の過誤確率 ) 2つの処理
連載 第 2 回 医学データの統計解析の基本 2 つの平均の比較 * 朝倉こう子 濱﨑俊光 Fundamentals of statistical analysis in biomedical research:two-sample tests for comparing means 1 基礎研究や臨床研究を問わず医学研究において 新しい化合物や治療法を発見し その性能を特徴づける場合 何らかの対照
Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5
第 4 章 この章では 最小二乗法をベースにして 推計上のさまざまなテクニックを検討する 変数のバリエーション 係数の制約係数にあらかじめ制約がある場合がある たとえばマクロの生産関数は 次のように表すことができる 生産要素は資本と労働である 稼動資本は資本ストックに稼働率をかけることで計算でき 労働投入量は 就業者数に総労働時間をかけることで計算できる 制約を掛けずに 推計すると次の結果が得られる
Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth
Studies of Foot Form for Footwear Design (Part 9) : Characteristics of the Foot Form of Young and Elder Women Based on their Sizes of Ball Joint Girth and Foot Breadth Akiko Yamamoto Fukuoka Women's University,
相関分析・偏相関分析
相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理 MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う 相関とは
Probit , Mixed logit
Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,
Microsoft PowerPoint ppt
情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています
Microsoft PowerPoint - GLMMexample_ver pptx
Linear Mixed Model ( 以下 混合モデル ) の短い解説 この解説のPDFは http://www.lowtem.hokudai.ac.jp/plantecol/akihiro/sumida-index.html の お勉強 のページにあります. ver 20121121 と との間に次のような関係が見つかったとしよう 全体的な傾向に対する回帰直線を点線で示した ところが これらのデータは実は異なる
モジュール1のまとめ
数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差
不偏推定量
不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)
8 A B B B B B B B B B 175
4.. 共分散分析 4.1 共分散分析の原理 共分散分析は共変数の影響を取り除いて平均値を比較する手法 (1) 共分散分析 あるデータを群間比較したい そのデータに影響を与える他のデータが存在する 他のデータの影響を取り除いて元のデータを比較したい 共分散分析を適用 共分散分析 (ANCOVA:analysis of covariance アンコバ ) は分散分析に回帰分析の原理を応 用し 他のデータの影響を考慮して目的のデータを総合的に群間比較する手法
と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと
.5 Gage R&R による解析.5.1 Gage R&Rとは Gage R&R(Gage Repeatability and Reproducibility ) とは 測定システム分析 (MSA: Measurement System Analysis) ともいわれ 測定プロセスを管理または審査するための手法である MSAでは ばらつきの大きさを 変動 という尺度で表し 測定システムのどこに原因があるのか
自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好
. 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :
EBNと疫学
ノンパラメトリック検定 94 質的変数と質的変数の関連性を調べる - クロス表 行周辺度数 肺がん合計発生発生しないあり 100 人 900 人 1000 人喫煙なし 10 人 990 人 1000 人合計 110 人 1890 人 2000 人 列周辺度数 95 クロス表 - 行パーセント 各行のセルの度数を行周辺度数で割って 100 をかけたもの 行周辺度数 肺がん合計発生発生しない 10%(100
Microsoft PowerPoint - Econometrics pptx
計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: [email protected] webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
カイ二乗フィット検定、パラメータの誤差
統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,
66-1 田中健吾・松浦紗織.pwd
Abstract The aim of this study was to investigate the characteristics of a psychological stress reaction scale for home caregivers, using Item Response Theory IRT. Participants consisted of 337 home caregivers
Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students A Dissertation Submitted t
Exploring the Art of Vocabulary Learning Strategies: A Closer Look at Japanese EFL University Students MIZUMOTO, Atsushi Graduate School of Foreign Language Education and Research, Kansai University, Osaka,
こんにちは由美子です
Analysis of Variance 2 two sample t test analysis of variance (ANOVA) CO 3 3 1 EFV1 µ 1 µ 2 µ 3 H 0 H 0 : µ 1 = µ 2 = µ 3 H A : Group 1 Group 2.. Group k population mean µ 1 µ µ κ SD σ 1 σ σ κ sample mean
