第 7 章順位和検定第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, ス

第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, スコア化データおよび等分散検定で有意差を示した集団について用いられる. 一部の統計学者は, 生物の反応に対して順位和検定の方が分布を利用した検定法と比較して有用と述べている. 最近順位和検定のいくつかは, 検出力が低いため使用を避けた方が無難との意見が散見される. したがって,Bartlett の等分散検定の有意水準を 5% から % へ変更して少しでも多くのデータが分布を利用した Parametric 検定で実施できるような傾向にもある ( 最近の日本毒科学会誌 (997-998) にも散見されている ). しかし, この様な傾向は日本のみのものである. なぜならば, 多群間検定を重視したことによって検出力の極めて低い検定法,Dunnett, Tukey 型順位和検定による検定法が普及してきたことによる. 諸外国では, 検出力の高い群間検定である Mann-Whitney の U 検定および多重比較検定の Williams-Wilcoxon や Steel の順位和検定が多用されている. 毒性試験の分野では, 等分散が確保できない場合, 多重性を考慮した Steel の検定が常用されている.. 二群間検定に使用する Wilcoxon の順位和検定群間の比較手法で一般的に使用されている. また計算式も紹介者によっていくつか紹介されている. ここでは標準正規分布を用いた方法を紹介する ( 吉村ら, 99). 試験の得点は正規分布をしない場合が多い. このような場合, 順位和検定が最良である. 表のデータは個体数が各群 6 と小さいため正規性 (Shapiro-Wilk の U 検定 ) は保たれている. 表に正規性が保たれないといわれる試験の得点結果を示した. 表. ある地区における複数会場の試験点数と順位化データクラス毎の平均採点東京校 79.5 85.5 83.5 93.5 9.5 77.5 九州校 95.5 87.5 89.5 98.0 97.5 8.5 順位化したデータ順位和東京校 5 4 9 8 9 九州校 0 6 7 3 49 標本数 ( クラスの数 ) は各群 6. 九州校の順位和 R 067349 é ( - 6.5) (5-6.5) (4-6.5) (9-6.5) (8-6.5) ( - 6.5) ù ê ú 6 6 êë (0-6.5) (6-6.5) (7-6.5) ( - 6.5) ( - 6.5) (3-6.5) ú V û 39 9 49 6.5 ( 総標本数 ) 6 標本数東京校と九州校の標本数の合計東京校と九州校の標本数の合計 - 3 49-6 T.60 39 3 東京校と九州校の標本数の合計定数有意水準 α を 0.05 とする. 規準正規分布表のパーセント点, 数表 7- の 0.05 の点,u(α).644854 と比較して算出値 T.60 は, 小さいことから学校間に有意差がないことになる. 両側検定を希望する場合は,.959964 と比較する. 85

同一順位がある場合は平均順位を用いる. SAS JMP による解析結果を下記に示した. 数表 7-. 規準正規分布表のパーセント点 ( 吉村ら, 987) 両側確率上側確率 % 点 α α U(α) 0.05000 0.05000.959964 0.06000 0.030000.88079 0.07000 0.035000.89 0.08000 0.040000.750686 0.09000 0.045000.695398 0.0000 0.050000.644854 正規分布表では有意水準が 0.8, カイ分布では有意水準が 0.093 でいずれも 5% 水準で有意差が認められなかった. 各群の標本数が 3 で同順位がない場合 ( 表 ), 有意差が検出されることは周知のごとくである. その計算根拠を下記に示した. 標本数は各群 3. 投薬群の順位和, R 4565 V 表. 標本数が 3 で同順位がない場合測定値または順位順位合計 A 群,, 3 6 B 群 4, 5, 6 5 [( - 3.5) ( - 3.5) (3-3.5) (4-3.5) (5-3.5) (6-3.5) ] 3 3 5. 5 6 5 86

3 標本数 6 対照群と投薬群の標本数の合計 5 対照群と投薬群の標本数の合計 - 7 対照群と投薬群の標本数の合計有意水準 α( 片側検定 ) を 0.05 とする. 6 5 3.5 ( 6 総標本数 ) 5-3 T 5.5 7.964 規準正規分布表のパーセント点, 数表 7- の 5% の点,u(α).644854 と比較して算出値 T.964 は, 大きいことから A と B 間に有意差が認められたことになる. 両側検定を希望する場合は,.959964 と比較する. この場合, 5% いっぱいで有意差を認めたことになる. SAS JMP による解析結果を下記に示した.. 二群間検定に使用する Mann-Whitney の U 検定各群の標本数が 7 以下の場合は, Mann-Whitney の U 検定を利用すると良い. N および N に対して簡易表数表 7-, 7-3( 高木, 00) が与えられている. クラス毎の平均採点のデータ ( 表 3) を Mann-Whitney の U 検定で実施する. 表 3. 表のデータを順位化したデータ順位化したデータ U 値東京校 (6) 5(5) 4(5) 9(3) 8(3) (6) 8 九州校 0(0) 6() 7() (0) (0) 3(4) 8 東京校の各個体値に対して大きい値の九州校の数をカッコ内へ表す. 同様に九州校の各個体値に対して大きい値の東京校の数をカッコ内へ表す. 各群の合計値を U 値とする. 小さい U 値を数表 7- の U 値の確率とする. 87

数表 7-. Mann-Whitney の U 検定の U 統計量の分布 ( 片側検定, 標本数 : N 6, N 6) 確率 P 0.00 0.00 0.004 0.008 0.03 0.0 0.03 0.047 0.066 0.090 U 値 0 3 4 5 6 7 8 9 確率 P 0.0 0.55 0.97 0.4 0.94 0.350 0.409 0.469 0.53 U 値 0 3 4 5 6 7 8 - 両側検定は, 表中の棄却限界値を倍する. U 値 8 に該当する確率, は 0.066(P>0.05) となり有意差が認められない. 次に各群の標本数が 3 の場合を Mann-Whitney の U 検定 ( 表 4) で計算する. 表 4. 各群の標本数が 3 の場合測定値または順位 U 値 A 群 (3), (3), 3(3) 9 B 群 4(0), 5(0), 6(0) 0 小さい U 値を数表 7-3 の U 値の確率とする. 数表 7-3. Mann-Whitney の U 検定の U 統計量の分布 ( 片側検定, 標本数 : N 3, N 3) 確率 P 0.050 0.00 0.00 0.500 0.650 U 値 0 3 4 U 値 0 に該当する確率は, 0.050(P 0.05) となり有意差が認められる. N および N から計算された大きい U 値および小さい U 値を加えた数値は, 各群の標本数の積となる. 同順位の場合は,0.5 個と数える. 検定は, 小さい U 値の 4.5 を N N 5 の数表 ( 割愛 ) の U 値 5 に該当する確率とする. 表 5 に Mann-Whitney の U 検定の U 統計量の計算手順を示した. 表 5. Mann-Whitney の U 検定の U 統計量の計算群病理所見のグレード個体値に対する大きい個体数 U 値対照 (N 5) 0,0,0,, 4.5(0.54)4.5(0.54)4.5(0.54)3.5(0.53)3.5(0.53) 0.5 用量 (N 5) 0,,,3,3 3.5(0.50.50.5)(0.50.5)000 4.5 SAS JMP による解析は標本数が少ないと標本サイズが小さい. 大標本近似ではなく, 統計表を使って検定と注意のメッセージが表示される. この場合は上述の Mann-Whitney の U 検定の簡易表を用いること. その他にも Gad, C.G. and Weil, S.W. (986): Statistics for Toxicologists, Principles and Methods of Toxicology. In: Edition by A. Wallace Hayes. Raven Press, New York, p59-67. による手法が公表されている. Wilcoxon と Mann-Whitney の U 検定の検出力は同一である. SAS JMP では, サンプルデータの財務の業種 Drug と Oil について解析. 3. 3 群以上の多群間検定に使用する Kruskal-Wallis の順位検定この検定法は多群間検定法である. Parametric 検定の分散分析に相当する. 一般的には,Bartlett の等分散検定などで各群が同様の分布でない場合, 次の検定を実施するための検定である. 別名順位和による分散分析ともいわれている. 全個体を大きい方から順に並べ, 小さい方から,, 3, と順位を付け, 各数値をその順位で置き換える. Kruskal-Wallis の順位検定の基本的計算式 ( 吉村, 987) X æ r r r ö a N N Na - 3( N ) N( N -) 同順位があるときは, 平均順位を用い, 検定統計量を次のように修正する. X ì ï æ í r ï î N - ö ( N -) S æ r 88 ana N - ö ü ï ý ïþ

æ r - N( N ) ö S N æ r - N( N ) ö N æ ra - Na( N ) ö N 算出した X 値とカイ分布表からの値を比較し, 算出した X 値が大きければ, 分散分析と同様にどこかの群間に有意差があることを示している. 表 6 に治検薬によるリンパ球 (%) への影響のデータを示した.Kruskal-Wallis の順位検定で解析する. 表 6. 治検薬によるリンパ球 (%) への影響 A 群 B 群 C 群 D 群 40.6 3.9 3.7 30.6 38.0 36.8 3.3 35.9 4. 3.4 3.9 9.6 5.7 34.8 3.9 9. 48.8 43. 8.5 8.5 4. 39.0 3. 30.8 39.9 33.6 33. 30.5 43. 34.3 34. 9.4 3.7 34.0 3. 30.8 30. 33.8 3.7 3.0 平均値 40.8 35.4 3.9 30.7 標本数 0 0 0 0 手順群数は 4 群, 総個数 N40, データを順位に変換すると次のようになる. 表 6 の測定値を順位化して表 7 に示した. 表 7. 表 6 を順位化したデータ A 群 B 群 C 群 D 群 34 5.5 9.5 8 3 30 3 9 35.5 8 5 40 8 5.5 3 39 37.5.5.5 35.5 3.5 9.5 33 3 7 37.5 7 6 4 9.5 5.5 9.5 6 4 4 7 順位平均 3. 6 5.55 9.35 各群の順位和は, r 343 9.563, r 60, r 355.5, r 493.5 同順位があるので, a æ 0 4ö 3- S 0 æ 0 4ö 60-0 æ 0 4ö 55.5-0 æ 0 4ö 93.5-0 94.35 X æ (40 ) ö 34 - (40 -) 94.35 æ (40 ) æ ö (40 ) 3 ö - 9.5 - æ (40 ) ö 7 -.8 カイ分布表 ( 数表 7-3) より自由度 N3, すなわち群数 - の 0.% 水準値 6. と比較すると,.8 は大きい. したがって,P<0.00 となり, この 4 群間中どこかの群間の順位に有意差が認められたことになる. 89

数表 7-3. カイ分布のパーセント点 ( 吉村ら, 987) DF\ α 0. 0.05 0.0 0.00.706 3.84 6.635 0.88 4.605 5.99 9.0 3.86 3 6.5 7.85.345 6.66 4 7.779 9.488 3.77 8.467 5 9.36.070 5.086 0.55 以後どこの群間に有意差が認められるのかを検索するため,Dunnett, Tukey, Steel および Scheffé などの多重性を踏まえた順位和検定が用意されている. SAS JMP による解析結果を下記に示した. SAS JMP による計算値は.3 で手計算の値.8 と若干異なる. 90

4. 3 群以上の検定に使用する Dunn's test (Hollander and Wolf, 973 and Gad, et al., 986) の多重比較型順位和検定本法は世界的に使用されている. 表 8 に表 6 の集計データを示した. 表 8. 治検薬によるリンパ球 (%) への影響 A 群 B 群 C 群 D 群順位平均 3. 6 5.55 9.35 標本数 0 0 0 0 合計 40 計算手順 A 群対 B 群平均順位の差は 3.-65. 確率テストの値 é0.05ù ê ú ë 4(3) û Z A 対 C 群平均順位の差は 3.-5.65.5 確率テストの値 é0.05ù ê ú ë 4(3) û A 群対 D 群平均順位の差は 3.-9.4.7 確率テストの値 é0.05ù ê ú ë 4(3) û Z Z.63 (40)(4) 0 0 0.0047.63 (40)(4) 0 0 0.0047.63 (40)(4) 0 0 0.0047.63 は数表の Z 値, は定数, 分母の 0 は群内標本数. 4 (3); 群数群数 -.63; 数表 7-4 の Z 値から読む. 計算値の 0.0047 は, 約 0.004 この値は Z 値の数表の 0.0043 と 0.004 の間に位置する. この場合は 0.0043 を採用した. この数値に対応する Z 値は.63 である. 数表 7-4. Z score for normal distribution の表 (Gad et al., 986) Z 値比例部分 3.7 3.7 3.7 0.00 0.0 0.0 0.03 0.04 0.05 0.06 0.07 0.08 0.09.6 0.0047 0.0045 0.0044 0.0043 0.004 0.0040 0.0039 0.0038 0.0037 0.0036 (40) (4)/; 40 は総標本数, (4) は総標本数, は定数. /0; A 群および各群内の標本数. この場合は全て同数の 0. しかし, 各群内標本数が変化すればその値を使用する. 有意差の判定 ; 各計算値の値, この場合は全て 3.7 で, この 3.7 と平均順位の差と比較する. 平均順位の差が大きければ 5% 水準で有意差を認めたことになる. この場合, A 群の平均順位は 3. に対して B 群の平均順位は 6 でその差は 5. で 3.7 より小さいことから,A 群と B 群間では有意差が認められない.A 群に対して C および D 群の平均順位の差は, それぞれ 5.55 および.75 でいずれも 3.7 に比較して大きいことからこの両群は有意差を示したことになる. % 水準で検定したい場合は 0.05 の代わりに 0.0 を代入して計算する. 9

5. 3 群以上の検定に使用する Steel の多重比較検定この検定は多重性を考慮した順位和検定の中でも検出力が高い. 用量相関が最高の場合, 標本数が 4 で対照群の順位に近い群 ( 毒性試験では低用量群 ) で有意差が検出できる ( 吉村, 大橋, 99, 稲葉, 994). 別名 Dunnett のセパレート型ともいわれる. ジョイント型 (Dunnett type) は極めて検出力が低く最近では使用されていない. 今回標本数が各群 4 で用量相関が最も高い場合を表 9 に示した. 解析には順位化したデータを使用する. 表 9. 試験より得られた定量値群対照低用量中用量高用量 () 5 (5) 9 (5) 3 (5) 個体値 () 6 (6) 0 (6) 4 (6) 3 (3) 7 (7) (7) 5 (7) 4 (4) 8 (8) (8) 6 (8) 平均順位.5 6.5 0.5 4.5 括弧の数値は, 対照群と各群の比較による順位で下記の計算に使用する. 計算手順対照群対低用量群 ; ) 低用量群の順位の和を求める. R 56786 ) 平方和 S と分散 V を求める. S (-4.5) (-4.5) (3-4.5) (4-4.5) (5-4.5) (6-4.5) (7-4.5) (8-4.5) 4 4.5 は各群内標本数の和を群数で割った値 44/ 4.5 4 4 V 0.75 4 8 7 4 4 は対照群の標本数 4 S の 4, 4 8 7 は低用量群の標本数 4 ( 対照群と低用量群の標本数の和 ) ( 対照群と低用量群の標本数の和 -) 0.75. 3)t を求める. t 6 4 4-4 75 0.866 9.309 6/4 は R / 低用量群の標本数 4, (44)/ は ( 対照群と低用量群の標本数の和 )/ 4) 検定結果 ; 算出された値.309 を Dunnett の多重比較検定の片側 % 点の数表 7-5 から棄却限界値を求める. 有意水準 5% (α0.05) とする. 5) 各群の大きさが一定なので, 棄却限界値は (, 4, 0.05).06( 片側検定 ) となる. 数表 7-5. Dunnett の多重比較のパーセント点 ( 片側 5%)( 吉村ら,987) 群数 3 4 5 6 7 8.064.96.06.60.34.9.340 Dunnett の棄却限界値 ( 表 ) の横軸は, 群数を示す. 原著 (Dunnett, 964) は, 対照群を除いた群数 ( 群数 -) を表示している. 吉村らは群数を表示している. 両者とも数値は同一である. 多重性の調整は, 自由度を無限大 ( ) に設定している. 6) 判定 ;.06 に比較して計算値.309 は大きいことから 5% 水準で有意差 (P<0.05) を示したことになる. 7) 以下同様に計算する. 括弧内の数値を用いて, 対照群に対して中用量群 (t 3) および高用量群 (t 4) に対する計算値を算出する. 対照群対中用量群 ; 対照群と比較による順位に変換した値を用いて計算手順 ) より同様に求める. この場合対照群に対して低中高用量とも計算時には同一の順位となる. 対照群対高用量群 ; 対照群と比較による順位に変換した値を用いて計算手順 ) より同様に求める.

この場合対照群に対して低中高用量とも計算時には同一の順位となる. 本法は二群間検定の Mann-Whitney の U 検定と並んで検出力が高い部類に入る. したがって, 毒性試験などのように有意差を検出したい調査や試験に対して適当である. 6. 順位和検定に対する注意点順位和検定を使用する場合, あらかじめ群内の標本数が幾つあれば有意差が検出できるか把握する必要がある. 各順位和検定で有意差の検出できる群内最低標本数を表 0 に示した. Mann-Whitney の U 検定を除いては, 多群間検定である. 表 0. 順位和検定で有意差の検出できる群内最低標本数検定法 4 群設定 5 群設定 Scheffé type 40 Hollander-Wolfe* 9 30 Tukey type 8 3 Dunnett type 5 6 Williams-Wilcoxon 8 Steel 4 6 Mann-Whitney U** 3 - * Dunn's test. ** 群間検定 ( 参考のため表示した ). 上記の順位和検定の中で国際的に使用されている検定法は,Williams-Wilcoxon, Dunn's test, Steel および群間検定の Mann-Whitney の U と Wilcoxon 検定である.Type が付いている検定は, 我が国で開発し使用されているものが多い. 7. 順位和検定の一事例表に示したデータの平均値を見ると高用量群に有意差印 (*) が, また順位和検定で実施した旨の N (Nonparametric 検定 ) が対照群の平均値に付いている. この二者の平均値は同一にもかかわらず有意差が認められる. この事例はめったにないことである. この理由は,Bartlett の等分散検定の結果, 有意差を示し Nonparametric 型の Dunnett type の検定を採用したためである. この順位和検定は, 定量値自体の検定ではなく, 全ての群の個体値を小さい順に並べて順位化したものに対して有意差の吟味を実施する検定法である. したがって, 検定結果は, 平均順位に対して付けるのが分かり易い. しかし, この例のように高用量群に.96 と極めて飛び離れた大きい値が存在する. この値がたとえ 0.89( 対照群の 0.88 の次に大きい値と仮定した ) となっても順位は変化せず順位和検定の結果は不変である. しかし, 定量値の平均値は, 小さくなり有意差が認められれば納得することができる. このような事例は滝沢 (99) も指摘している. 表. F344 ラットの投薬後 5 週の血漿クレアチニン濃度 (mg/dl) 群個体値 (0 匹 / 群 ) 平均値 ± 標準偏差 0.70 0.68 0.70 0.74 0.60 0.65 0.65 0.7 0.63 0.78 対照 0.69±0.07N 0.67 0.64 0.63 0.66 0.88 0.73 0.57 0.79 0.78 0.65 低用量中用量高用量 0.7 0.64 0.66 0.66 0.88 0.68 dead 0.5 0.65 0.63 0.79 0.60 0.69 0.68 0.6 0.57 dead 0.66 0.59 0.54 0.56 0.59 0.66 0.68 0.57 0.67 0.70 0.83 0.86 0.68 0.60 0.68 0.57 0.67 0.53 0.57 0.64 0.6 0.86 0.67 0.5 0.59 0.49 0.60 0.58 0.6 0.5 0.57 0.60.96 0.56 0.65 0.7 0.55 0.54 0.4 0.5 0.6 0.59 0.59 N: 順位和検定.** 対照群に対して % 水準で有意差を示す. 0.65±0.09 0.66±0.0 0.69±0.54** この場合の解決法は,Thompson および Smirnov-Grubbs などの棄却検定を用いてこの値を吟味して棄却するのが最良である. しかし, 毒性試験ではいかなる場合でも対応できる決定樹を使用していることからこのような処理となる. 少しでも標本数を減らしたくないこと, 標本を棄却した場合, 正当な理由付け難しいことにある. 群 0 匹以上を使用した試験の場合, 著しくかけ離れた値の動物は, 勇気を持って理由付けし, 何らかの手法で除外して, ほぼきれいな分布にした後, 定量値自体を Dunnett の多重比較検定で検定したい. 棄却によって第二種の過誤を防ぐことができる. この方法によって棄却検定後の再検定結果を表に示した. 93

表. 高用量群の.96 を除外後の検定結果群個体値平均値 ± 標準偏差対照 0 0.69±0.07 低用量 8 0.65±0.09 中用量 0 0.66±0.0 高用量 9 0.57±0.07** ** 対照群に対して % 水準で有意差を示す. 引用文献および引用資料稲葉太一 (994): 酵素阻害剤 X の薬剤評価に用いた多重比較法の問題点, 医薬安全性研究会会報,No. 40, 33-36. 高木廣広 (00): ナースのための統計学,pp4, 医学書院, 東京. 滝沢毅 (99): 決定樹方式での統計処理法の注意点質疑. 医薬安全性研究会,No. 34, 54. 日本卒後教育中心の統計学集中講座 (986):50 頁および参考資料の表 8. 吉村功 ( 編 )(987): 毒性薬効データの統計解析, サイエンティスト社, 東京. 吉村功, 大橋靖雄 (99): 毒性試験データの統計解析,pp0-04, 地人書館, 東京. Dunnett, C.W. (964): New tables for multiple comparisons with a control, Biometrics, September 48-49. Gad, S. and Weil, C. S. (986): Statistics and experimental design for toxicologists, pp6-65, The Telford Press, New Jersey. Hollander, M., and Wolf, D.A. (973): Non-parametric statistical methods, pp4-9. John Wiley, New York. 94