区間推定に基づくサンプルサイズの設計方法 7.7. 株式会社応用数理研究所佐々木俊久 永田靖 サンプルサイズの決め方 朝倉書店 (3) の 章です 原本とおなじ 6 種類を記述していますが 平均値関連 4 つをから4 章とし, 分散の つを 5,6 章に順序を変更しました 推定手順 サンプルサイズの設計方法は, 原本をそのまま引用しています R(S-PLUS) 関数での計算方法および例を追加しました. 母分散が既知の場合の母平均. 母平均の推定手順 x, x,, x が互いに独立に正規分布 N(, ) に従っているとする ここで母分散は既知とする 点推定 : ^ x xi / (.) 区間推定 : 信頼率を とする x z x z /, / (.) z は, 標準正規分布 N(, ) の上側 P% 点である p この式は x が N(, / ) に従うから, 標準化することにより u x / は標準正規分布 N(, ) に従う これより Pr z u z / / を展開して求まります. サンプルサイズの設計方法 (.) 式に示した信頼区間の区間幅が一定値 ( デルタ ) 以下になるようにサンプルサイズ を設計する すなわち, z / (.3) としたい, これより, 4z / (.4) となる R(S-PLUS) での関数
(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 -. 95 として, サイズ 7 での信頼区間幅 > siki.3(7,.5, ) [].96387 サンプルサイズの計算 alpha( ), sigma( ),elta( 区間幅 ) から, サイズ ( ) を計算 <-fuctio(alpha, sigma, elta) <- (( qorm(-alpha/) sigma /elta))^ <- ceilig() [ 例 ], 信頼率 -. 95 とし, 信頼区間幅の期待値が 3. 以下になるサ. ンプルサイズ > (.5,, 3) [] 7. 母分散が未知の場合の母平均. 母平均の推定手順 x, x,, x が互いに独立に正規分布 N(, ) に従っているとする ここで母平均 と 母分散 はともに未知である 点推定 : ^ x (.) 区間推定 : 信頼率を とする V V x t(, ), x t(, ) (.)
S ( xi x) xi ( xi ) / ここで, V である t(, ) は自由度 のt 分布 t( ) の両側 P% 点である この式はt ( x ) / V / が t( ) に従うから, Pr t (, ) t t(, ) を展開して求まります. サンプルサイズの設計方法 (.) 式で示した信頼区間の区間幅は t (, ) V / である 区間幅の期待値が一定値 ( デルタ ) 以下になるようにサンプルサイズ を設計する すなわち, E( V) t(, ) (.3) ここで E( V ) c を使用 すると, となります ここで c t(, ) (.4) (( )/ ) c (.5) ( / ) であり, である, () はガンマ関数であり, m を正の整数とするとき, ( m) ( m )( m ) 3 ( m )! 3 3 ( m m m が成り立つ c の値を図 -に示す が 5 程度より大きくなれば c の値はかなり に近くなる この c の値は,R(S-PLUS) で下記の関数を使用しました c.star <- fuctio(fai) cc <- sqrt(/fai) gamma((fai+)/) / gamma(fai/) の値が大きい場合は, ガンマ関数の精度が悪くなるので, ガンマのログ (log) 計算の次の関 数の方がよいでしょう 証明は, 元本の練習問題.8,5. 参照 3
c.star.log <- fuctio(fai) cc <- sqrt(/fai) exp(lgamma((fai+)/) - lgamma(fai/)) (.4) 式には未知数 が含まれているから, この値をあらかじめ想定しておく必要がある 従来の値, 予備的な実験値により求めた値, または何らかの情報から を想定し, それを と想定して (.4) 式を満たす を求めることになる まず, 章の (.4) 式を用いて の値を求め, この値から順次大きくしていきながら (.4) 式を満たす を求めればよい 図 - c の値 R(S-PLUS) での関数 c (.4) 式 t(, ) の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.4<-fuctio(, alpha, sigma) elta <- qt(-alpha/, -) sigma /sqrt() c.star(-) elta 4
[ 例 ], 信頼率 -. 95 として, サイズ 7,8, 9 での信頼区間幅. > siki.4(7,.5, ) [] 3.54973 > siki.4(8,.5, ) [] 3.743 > siki.4(9,.5, ) [].9833 サンプルサイズの計算 alpha( ), sigma( ),elta( 区間幅 ) から, サイズ ( ) を計算 <-fuctio(alpha, sigma, elta) <- (( qorm(-alpha/) sigma /elta))^ # (.4) 式 <- ceilig() for(i i :) haba <siki.4(, alpha, sigma) if (haba <= elta) break <- + [ 例 ], 信頼率 -. 95 とし, 信頼区間幅の期待値が 3. 以下になるサ. ンプルサイズ > (.5,., 3.) [] 9 3. つの母平均の差 3. つの母平均の差の推定手順母集団をつ設定する 第 母集団では x, x,, x が互いに独立に正規分布 N(, ) に従っているとする また, これとは独立に, 第 母集団では x, x,, x が互いに独立に正規分布 N(, ) に従っているとする 母平均 と および母分散 のすべては未知である ただし, つの母集団の母分散は等しいと想定している このとき, つの母平均の差の点推定と区間推定は次のように行う 点推定 : x (3.) x 5
区間推定 : 信頼率を とする x x t(, ) V, x x t(, ) V (3.) t(, P) は自由度 のt 分布 t( ) の両側 P 点である この式は x x ( ) t V (/ / ) が t( ) に従う これより Pr t (, ) t t(, ) を展開して求まります (3.3) 3. サンプルサイズの設計方法 (3.) 式で示した信頼区間の区間幅は t(, ) V (/ / ) である として,. 節の場合と同様に, 区間幅の期待値が一定値 ( デルタ ) 以下になるようにサンプルサイズ を設計する すなわち, t(, ) E( V ) t(, ) c (3.4) ここで, c は. 節の (.5) 式により定まる値で, である (3.4) 式には未知母数 が含まれているから, この値をあらかじめ想定しておく必要がある すなわちと想定して (3.4) 式を満たす を求めることになる o (, ) z / 8z / (3.5) (3.4) 式において t, c と想定して について解くと となる そこで, まず,(3.5) 式を用いて の値を求め, この値から順次大きくしていきながら (3.4) 式を満たす を求めればよい R(S-PLUS) での関数 (3.4) 式 t(, ) c の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki3.4<-fuctio(, alpha, sigma) elta <- qt(-alpha/, -) sigma /sqrt(/) c.star.log(-) elta 自由度が大きいと t 分布は, 正規分布 N(, ) で近似できる ( 注 t 分布は両側 P 点 正規分布は上側 P 点 ) 6
[ 例 ], 信頼率 -. 95 として, サイズ 8, 9 での信頼区間幅. > siki3.4(8,.5, ) [].6859 > siki3.4(9,.5, ) [].967699 サンプルサイズの計算 alpha( ), sigma( ),elta( 区間幅 ) から, サイズ ( ) を計算 3<-fuctio(alpha, sigma, elta) <- 8((qorm(-alpha/) sigma /elta))^ # (3.5) 式 <- ceilig() for(i i :) haba <-siki3.4(, alpha, sigma) if (haba <= elta) break <- + [ 例 ]., 信頼率 -. 95 とし, 信頼区間幅の期待値が. 以下になるサン プルサイズ > 3(.5,.,.) [] 9 4. 対応がある場合の母平均の差 4. つの母平均の差の推定手順対応のある対 x, x ) が 個あるとする ( i,,, ) それぞれの構造式を ( i i x i ii xi ii, ~ N(, ) i, ~ N(, ) i i, i と想定する ( i,,, ) ( i,,, ) はすべて互いに独立である ここで, i は i 番目のデータにおける対応の効果であり, の推定を行いたい 対応の効果を消去するために, 第 i 番目の対の差 x x i i i i i をとると, ~ N(, ) となる ( i,,, ) ここで i とき, 対応のある場合の母平均の差の点推定と区間推定は次のように行う 点推定 : (4.) 区間推定 : 信頼率を とする である この 7
V V t(, ), t(, ) (4.) t(, ) は自由度 のt 分布 t( ) の両側 P% 点である この式は t ( )/ V / が t( ) に従うから, ) Pr t (, ) t t(, ) を展開して求まります 4. サンプルサイズの設計方法 (4.) 式で示した信頼区間の区間幅は t(, ) V / である. 節の場合と同様に, 区間幅の期待値が一定値 ( デルタ ) 以下になるようにサンプルサイズ を設計する すなわち, E( V) c t(, ) t(, ) (4.3) ここで, c は. 節の (.5) 式により定まる値で, である (4.3) 式には未知母数 が含まれているから, この値をあらかじめ想定しておく必要があ る すなわち を勘案して想定 と想定しておく必要がある これは, o する必要がある まず,(.4) 式を用いて の値を求め, この値から順次大きくしていきながら (4.3) 式を満たす を求めればよい R(S-PLUS) での関数 c (4.3) 式 t(, ) の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki4.3<-fuctio(, alpha, sigma) elta <- qt(-alpha/, -) sigma /sqrt() c.star.log(-) elta [ 例 ]., 信頼率. 95 - として, サイズ 8,9, 3での信頼区間幅 > siki4.3(8,.5, ) [].536746 > siki4.3(9,.5, ) [].57997 > siki4.3(3,.5, ) 8
[].4886 サンプルサイズの計算 alpha( ), sigma( ),elta( 区間幅 ) から, サイズ ( ) を計算 4<-fuctio(alpha, sigma, elta) <- ((qorm(-alpha/) sigma /elta))^ # (.4) 式 <- ceilig() for(i i :) haba <-siki4.3(, alpha, sigma) if (haba <= elta) break <- + [ 例 ]., 信頼率 -. 95 とし, 信頼区間幅の期待値が. 5 以下になるサン プルサイズ > 4(.5,.,.5) [] 3 5. 母分散 5. 母分散の推定手順 x, x,, x が互いに独立に正規分布 N(, ) に従っているとする 母平均 および母 分散 の両者とも未知である 点推定 : S V (5.) 区間推定 : 信頼率を とする S S, (, / ) (,/ ) V, V (5.) (, / ) (,/ ) (, P) は自由度 の 分布 ( ) の上側 P% 点である この式は S / が ( ) に従うから, Pr (, / ) を展開して求まります (, / ) 5. サンプルサイズの設計方法 母分散の信頼区間については, 区間幅を小さくすることよりも, 信頼上限と信頼下限の比を小さくすることを考える方が妥当である そこで (5.) 式の信頼限界の比が一定値 以下 9
になるようにサンプルサイズ を設計する ( ) 信頼上限 (, / ) 信頼下限 (, / ) (5.3) (, P) / z フィッシャーの近似法に基づく P% 点の近似式 いることにより, を求める近似式を得る ( ) z / 3 (5.4) ただし, z / ( ) とする ( z /. 96 なら 4が必要 ) 近似値計算なので, 端数を切捨てたり, 切上げて, この値の前後で逐次 (5.3) 式を満たす値 を求めればよい R(S-PLUS) での関数 (5.3) 式 (, / ) の計算 (, / ), alpha( ) から, 値 ( 信頼限界の比 ) を計算 siki5.3<-fuctio(, alpha) elta <- qchisq(-alpha/, -) / qchisq(alpha/, -) elta [ 例 ] 信頼率 -. 95 として, サイズ 7, 8 での信頼限界の比 > siki5.3(7,.5) [] 3.876 > siki5.3(8,.5) [].96393 p を用 サンプルサイズの計算 alpha( ), elta( 信頼限界の比 ) から, サイズ ( ) を計算 5<-fuctio(alpha, elta) <-.5((+sqrt(elta))qorm(-alpha/)/(sqrt(elta)-))^ + 3/ # (5.4) 式 <- ceilig() hi <- siki5.3(, alpha) if(hi < elta) for(i i :3) <- - hi <- siki5.3(, alpha) if(hi > elta) break hi <- hi
else <- - for(i i :3) <- + beta <- siki5.3(, alpha) if(beta < elta) break [ 例 ] 信頼率 -. 95 とし, 信頼限界の比が 3. 以下になるサンプルサイズ > 5(.5, 3.) [] 8 6. つの母分散の比 6. つの母分散の比の推定手順母集団を つ設定する 第 母集団では x, x,, x が互いに独立に正規分布 N(, ) に従っているとする また, これとは独立に, 第 母集団では x, x,, x が互いに独立に正規分布 N(, ) に従っているとする 母平均 と および母分散 と のすべては未知である このとき,つの母分散の比の点推定と区間推定は次のように行う 点推定 : V S /( ) / (6.) V S /( ) 区間推定 : 信頼率を とする V V, F(, ; / ) (6.) F(, ; / ) V V F, ; ) は自由度, ) の F 分布 F, ) の上側 P% 点である ( P ( / ) /( V / ( この式は F ( V ) が F(, ) に従うから, Pr F (, ; / ) F F(, ; / ) を展開して求まります 6. サンプルサイズの設計方法母分散の信頼区間の場合と同様に, 信頼上限と信頼下限の比を小さくすることを考える として,(6.) 式の信頼限界の比が一定値 以下になるようにサンプルサイズ を設計する 信頼上限信頼下限 F (, ; / ) (6.3)
z F 分布の正規近似式 p F(, ; P) exp に基づき, を求める近似式を得る z p (6.4) log( ) この値から順次大きくしていきながら (6.3) 式を満たす を求めればよい R(S-PLUS) での関数 F(, ; / ) (6.3) 式 の計算, alpha( ) から, 値 ( 信頼限界の比 ) を計算 siki6.3<-fuctio(, alpha) elta <- qf(-alpha/, -, -) / qf(alpha/, -, -) elta [ 例 ] 信頼率 -. 95 として, サイズ 4, 5 での信頼限界の比 > siki6.3(4,.5) [] 9.73447 > siki6.3(5,.5) [] 8.87984 サンプルサイズの計算 alpha( ), elta( 信頼限界の比 ) から, サイズ ( ) を計算 6<-fuctio(alpha, elta) <- ( qorm(-alpha/) /log(sqrt(elta)))^ +. # (6.4) 式 <- ceilig() for(i i :) haba <- siki6.3(, alpha) if (haba <= elta) break <- + [ 例 ] 信頼率 -. 95 とし, 信頼限界の比が 9. 以下になるサンプルサイズ > 6(.5, 9) [] 5 付録正規分布近似 サンプルサイズ の逐次計算の初期値計算では, 各分布関数の正規分布近似を使用してい ます 信頼区間幅や信頼限界の比が一定値 以下になる式を満たす最小値 を求めていま す
() t 分布 t(, P) zp/ () 分布 (, P ) / z p (3) F 分布 以上 z p F(, ; P) exp 3