数表 4-1. つづき i\n

Similar documents
Microsoft Word - Stattext12.doc

Microsoft Word - 保健医療統計学112817完成版.docx

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

EBNと疫学

Medical3

情報工学概論

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 7 章順位和検定 第 7 章分布を利用しない順位和検定この検定法は, 定量値に対する平均値の差の吟味ではなく, 定量値を大きさの順番に置き直し, その平均順位の差を吟味する検定法である. したがって, 応用される値は, 平均値に対してかなり広い分布をしている非正規性データ, 区間中の発生率, ス

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft Word - apstattext04.docx

Microsoft Word - å“Ÿåłžå¸°173.docx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Medical3

基礎統計

PowerPoint プレゼンテーション

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

Microsoft Word - apstattext05.docx

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft PowerPoint - A1.ppt [互換モード]

PowerPoint プレゼンテーション

モジュール1のまとめ

ビジネス統計 統計基礎とエクセル分析 正誤表

スライド 1

スライド 1

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - Stattext13.doc

青焼 1章[15-52].indd

Microsoft PowerPoint - statistics pptx

Microsoft Word - lec_student-chp3_1-representative

第7章

Microsoft PowerPoint - e-stat(OLS).pptx

統計的データ解析

_KyoukaNaiyou_No.4

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

横浜市環境科学研究所

経営統計学

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

講義「○○○○」

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード]

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

解析センターを知っていただく キャンペーン

ANOVA

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - ch04j

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft PowerPoint - Statistics[B]

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

Microsoft PowerPoint - 基礎・経済統計6.ppt

MedicalStatisticsForAll.indd

Microsoft Word - Stattext07.doc

Microsoft PowerPoint ppt

. 測定方法 7 尺度化 ( 数値化 ) 8 絶対判断 評点法採点法カテゴリー尺度法 図示法 / 線分法 心理物理学的測定法 相対判断 分類法 格付け分類法 順位法 一対比較法 リッカート法 カテゴリー尺度法 / 評定尺度法 あなたは ですか? 9 SD(Semantic Differential)

Microsoft Word - Stattext11.doc

分散分析表を表 に示した. 表. 分散分析表 要因 平方和 自由度 分散 分散比 確率 全体 群間 P<0.001 誤差 F- 分布表,0.1% 水準の数表 6-1 の縦軸 7, 横軸 の交点 と比較して, 算出された値の

経済統計分析1 イントロダクション

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

この三者は, 度数分布が左右対称なとき以外, 同じ値をとらない. ヒストグラムが右 ( 歪度がプラスを示している ) に偏っている場合は,mode<median<mean となりスペルが辞書に出てくる逆順, 左に偏っている場合は, mean<median<mode となりスペルが辞書に出てくる順とな

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

0415

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft Word - mstattext02.docx

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft Word - SPSS2007s5.doc

学生による授業評価のCS分析

統計学の基礎から学ぶ実験計画法ー1

スライド 1

際 正規分布に従わない観測値に対して通常の t 検定を適用した場合 どのような不都合が生じるかを考える 一般に通常の t 検定や Wilcoxon 検定などの仮説検定を行う場合 2つの処理の間に差がないことが真実であるにもかかわらず差があると主張する過誤確率 ( 第 1 種の過誤確率 ) 2つの処理

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint - Econometrics pptx

Microsoft Word - mstattext01.docx

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

Microsoft Word - mstattext03.docx

3章 度数分布とヒストグラム

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>

1

Microsoft Word - apstattext03.docx

「スウェーデン企業におけるワーク・ライフ・バランス調査 」報告書

散布度

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft PowerPoint - データ解析基礎2.ppt

カイ二乗フィット検定、パラメータの誤差

Probit , Mixed logit

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Transcription:

第 4 章正規性の検定分布を利用する検定,t- 検定, 分散分析および各種多重比較 範囲検定などは, 正規分布が前提となる. 同時に群間の分散の一様性も要求される. しかし, 一般的に等分散性の検定は利用されているが, 正規分布の検定を実施した後の多重比較検定などの例は極めて少ない ( 野村,2002). おそらく等分散性を確認すれば正規性をカバーできるということで正規性の検定を省略していると考えられる. 正規性の検定法は, あまり使用していないためかその手法について知られていない. 正規性を検定するためには, いつかの手法 ( 武藤,2000) が紹介されている. 標本が抽出された母集団の分布は正規分布である という帰無仮説を検定する. 下記に幾つかの解析法を示した. Kolmogorov-Smirnov 検定 Lilliefors 検定 Shapiro-Wilk の W 検定 ( 後述 ) カイ分布を用いる適合度検定 ( 後述 ) 1. Shapiro-Wilk( シャピロウィルク ) の W 検定計算し易いように少数例を用い説明する. 表 1 は F344 ラットの 3 週間の増体重である. 表 1. 雄若齢 F344 ラットの増体重 動物番号 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 増体重 (g) 71 86 92 95 100 102 105 108 118 123 観察度数 1 1 2 4 1 1 Shapiro-Wilk の W 検定の計算 ( 椿ら, 2001) 平方和 =2072 123-71=52, 118-86=32, 108-92=16, 105-55=10, 102-100=2 これら算出した値はいずれもバラツキを表す値である. 標本数が奇数の場合, 残った値は使用しない. 次にこれらの値と算出した係数 ( 数表 4-1) との積を算出して結合する. この場合, 標本数は,10(n) で i=1, 2, 3, 4, 5 に対する値,0.5739, 0.3291, 0.2141, 0.1224, 0.0399 を下記の式に代入する. (0.5739)(52)+(0.3291)(32)+(0.2141)(16)+(0.1224)(10)+(0.0399)(2)=45.10 そして, 統計量 W を算出する. W = 2 45.10 2072 = 0.98166 数表 4-2 から 0.98166 は P>0.95 (P=0.95~0.98) で, これらの 10 個の値は, 非常に正規分布に近いことがわかる. SAS JMP による解析結果を表 2 に示した. 表 2. SAS JMP による Shapiro-Wilk の W 検定結果 (W 値と P 値 ) W P 値 (Prob<W) 0.981120 0.9673 数表 4-1. Coefficient for Shapiro-Wilk Test (Conover, 1999) i\n 2 3 4 5 6 7 8 9 10 1 0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5885 0.5739 2-0.0000 0.1667 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291 3 - - - 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141 4 - - - - - 0.0000 0.0561 0.0947 0.1224 5 - - - - - - - 0.0000 0.0399 37

数表 4-1. つづき i\n 11 12 13 14 15 16 17 18 19 20 1 0.5601 0.5475 0.5359 0.5251 0.5150 0.5056 0.4968 0.4886 0.4808 0.4734 2 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.3211 3 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.2565 4 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.2085 5 0.0695 0.0922 0.1099 0.1240 0.1353 0.1449 0.1524 0.1587 0.1641 0.1686 6 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.1334 7 - - 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.1013 8 - - - - 0.0000 0.0196 0.0359 0.0496 0.0612 0.0711 9 - - - - - - 0.0000 0.0163 0.0303 0.0422 10 - - - - - - - - 0.0000 0.0140 数表 4-1. つづき i\n 21 22 23 24 25 26 27 28 29 30 1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.4254 2 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.2944 3 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.2487 4 0.2119 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.2148 5 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1864 0.1870 6 0.1399 0.1443 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.1630 7 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.1415 8 0.0804 0.0878 0.0941 0.0997 0.1046 0.1089 0.1128 0.1162 0.1192 0.1219 9 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0965 0.1002 0.1036 10 0.0263 0.0368 0.0459 0.0539 0.0610 0.0672 0.0728 0.0778 00822 0.0862 11 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.0697 12 - - 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.0537 13 - - - - 0.0000 0.0094 0.0178 0.0253 0.0320 0.0381 14 - - - - - - 0.0000 0.0084 0.0159 0.0227 15 - - - - - - - - 0.0000 0.0076 数表 4-1. つづき i\n 31 32 33 34 35 36 37 38 39 40 1 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 0.4040 0.4015 0.3989 0.3964 2 0.2921 0.2898 0.2876 0.2854 0.2834 0.2813 0.2794 0.2774 0.2755 0.2737 3 0.2475 0.2462 0.2451 0.2439 0.2427 0.2415 0.2403 0.2391 0.2380 0.2368 4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 0.2110 0.2104 0.2098 5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1833 0.1883 0.1881 0.1880 0.1878 6 0.1641 0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1686 0.1689 0.1691 7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526 8 0.1243 0.1265 0.1284 0.1301 0.1317 0.1331 0.1344 0.1356 0.1366 0.1376 9 0.1066 0.1093 0.1118 0.1140 0.1160 0.1179 0.1196 0.1211 0.1225 0.1237 10 0.0899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1056 0.1075 0.1092 0.1108 11 0.0739 0.0777 0.0812 0.0844 0.0873 0.0900 0.0924 0.0947 0.0967 0.0986 12 0.0585 0.0629 0.0699 0.0706 0.0739 0.0770 0.0798 0.0824 0.0848 0.0870 13 0.0435 0.0485 0.0530 0.0572 0.0610 0.0645 0.0677 0.0706 0.0733 0.0759 14 0.0289 0.0344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0592 0.0622 0.0651 15 0.0144 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 0.0481 0.0515 0.0546 16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444 17 - - 0.0000 0.0062 0.0119 0.0172 0.0220 0.0264 0.0305 0.0343 18 - - - - 0.0000 0.0057 0.0110 0.0158 0.0203 0.0244 19 - - - - - - 0.0000 0.0053 0.0101 0.0146 20 - - - - - - - - 0.0000 0.0049 38

数表 4-1. つづき i\n 41 42 43 44 45 46 47 48 49 50 1 0.3940 0.6917 0.3894 0.3872 0.3850 0.3830 0.3808 0.3789 0.3770 0.3751 2 0.2719 0.2701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 0.2574 3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260 4 0.2091 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0.2038 0.2032 5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847 6 0.1693 0.1694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 0.1692 0.1691 7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.1551 0.1553 0.1554 8 0.1384 0.1392 0.1398 0.1405 0.1410 0.1415 0.1420 0.1423 0.1427 0.1430 9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1300 0.1306 0.1312 0.1317 10 0.1123 0.1136 0.1149 0.1160 0.1170 0.1180 0.1189 0.1197 0.1205 0.1212 11 0.1004 0.1020 0.1035 0.1049 0.1062 0.1073 0.1085 0.1095 0.1105 0.1113 12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.1020 13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 0.0932 14 0.0677 0.0701 0.0724 0.0745 0.0765 0.0783 0.0801 0.0817 0.0832 0.0846 15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764 16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 0.0685 17 0.0379 0.0411 0.0422 0.0471 0.0497 0.0522 0.0546 0.0568 0.0588 0.0608 18 0.0283 0.0318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 0.0511 0.0532 19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 0.0459 20 0.0094 0.0136 0.0175 0.0211 0.0245 0.0277 0.0307 0.0355 0.0361 0.0386 21 0.0000 0.0045 0.0087 0.0126 0.0163 0.0197 0.0229 0.0259 0.0288 0.0314 22-0.0000 0.0042 0.0081 0.0118 0.0153 0.0185 0.0215 0.0244 23 - - - - 0.0000 0.0039 0.0076 0.0111 0.0143 0.0174 24 - - - - - - 0.0000 0.0037 0.0071 0.0104 25 - - - - - - - - 0.0000 0.0035 数表 4-2.Quantiles of the Shapiro-Wilk Test Statistic n 0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99 3 0.753 0.756 0.767 0.789 0.959 0.998 0.999 1.000 1.000 4 0.387 0.707 0.748 0.792 0.935 0.987 0.992 0.996 0.997 5 0.386 0.715 0.762 0.806 0.927 0.979 0.986 0.991 0.993 6 0.713 0.743 0.788 0.826 0.927 0.974 0.981 0.986 0.989 7 0.730 0.760 0.803 0.838 0.928 0.972 0.979 0.985 0.988 8 0.749 0.778 0.818 0.851 0.932 0.972 0.978 0.984 0.987 9 0.764 0.791 0.829 0.859 0.935 0.972 0.978 0.984 0.986 10 0.781 0.806 0.842 0.869 0.938 0.972 0.978 0.983 0.986 11 0.792 0.817 0.850 0.876 0.940 0.973 0.979 0.984 0.986 12 0.805 0.828 0.859 0.883 0.943 0.973 0.979 0.984 0.986 13 0.814 0.837 0.866 0.889 0.945 0.974 0.979 0.984 0.986 14 0.825 0.846 0.874 0.895 0.947 0.975 0.980 0.984 0.986 15 0.835 0.855 0.881 0.901 0.950 0.975 0.980 0.984 0.987 16 0.844 0.863 0.887 0.906 0.852 0.976 0.981 0.985 0.987 17 0.851 0.869 0.892 0.910 0.954 0.977 0.981 0.985 0.987 18 0.858 0.874 0.897 0.914 0.956 0.978 0.982 0.986 0.988 19 0.863 0.879 0.901 0.917 0.957 0.978 0.982 0.986 0.988 20 0.868 0.884 0.905 0.920 0.959 0.979 0.983 0.986 0.988 21 0.873 0.888 0.908 0.923 0.960 0.980 0.983 0.987 0.989 22 0.878 0.892 0.911 0.926 0.961 0.980 0.984 0.987 0.989 23 0.881 0.895 0.914 0.928 0.962 0.981 0.984 0.987 0.989 24 0.884 0.898 0.916 0.930 0.963 0.981 0.984 0.987 0.989 39

数表 4-2. つづき n 0.01 0.02 0.05 0.10 0.50 0.90 0.95 0.98 0.99 25 0.888 0.901 0.918 0.931 0.964 0.981 0.985 0.988 0.989 26 0.891 0.904 0.920 0.933 0.965 0.982 0.985 0.988 0.989 27 0.894 0.906 0.923 0.935 0.965 0.982 0.985 0.988 0.990 28 0.896 0.908 0.924 0.936 0.966 0.982 0.985 0.988 0.990 29 0.898 0.910 0.926 0.937 0.966 0.982 0.985 0.988 0.990 30 0.900 0.912 0.927 0.939 0.967 0.983 0.985 0.988 0.990 31 0.902 0.914 0.929 0.940 0.967 0.983 0.986 0.988 0.990 32 0.904 0.915 0.930 0.941 0.968 0.983 0.986 0.988 0.990 33 0.906 0.917 0.931 0.942 0.968 0.983 0.986 0.989 0.990 34 0.908 0.919 0.933 0.943 0.969 0.983 0.986 0.989 0.990 35 0.910 0.920 0.934 0.944 0.969 0.984 0.986 0.989 0.990 36 0.912 0.922 0.935 0.945 0.970 0.984 0.986 0.989 0.990 37 0.914 0.924 0.936 0.946 0.970 0.984 0.987 0.989 0.990 38 0.916 0.925 0.938 0.947 0.971 0.984 0.987 0.989 0.990 39 0.917 0.927 0.939 0.948 0.971 0.984 0.987 0.989 0.991 40 0.919 0.928 0.940 0.949 0.972 0.985 0.987 0.989 0.991 41 0.920 0.929 0.941 0.950 0.972 0.985 0.987 0.989 0.991 42 0.922 0.930 0.942 0.951 0.972 0.985 0.987 0.989 0.991 43 0.923 0.932 0.943 0.951 0.973 0.985 0.987 0.990 0.991 44 0.924 0.933 0.944 0.952 0.973 0.985 0.987 0.990 0.991 45 0.926 0.934 0.945 0.953 0.973 0.985 0.988 0.990 0.991 46 0.927 0.935 0.945 0.953 0.974 0.985 0.988 0.990 0.991 47 0.928 0.936 0.946 0.954 0.974 0.985 0.988 0.990 0.991 48 0.929 0.937 0.947 0.954 0.974 0.985 0.988 0.990 0.991 49 0.929 0.937 0.947 0.955 0.974 0.985 0.988 0.990 0.991 50 0.930 0.938 0.947 0.955 0.974 0.985 0.988 0.990 0.991 40

SAS JMP による解析結果を下記に示した. 41

SAS JMP では, サンプルデータの ダイェット の Quack および Quick の体重変化を開く. 分析 一変量の分布 Quack および Quick の体重変化を Y, 列へ アクション OK 各図の赤三角をクリック 表示オプション より高次のモーメントのひずみ度およびとがり度を読み取る. 表 3 にひずみ度ととがり度からデータの分布を把握する. 表 3. ひずみ度ととがり度の把握 データ Quack の体重変化 Quick の体重変化 ひずみ度 -0.12 1.3 とがり度 0.13 2.8 ワイド Skewness: 歪度 歪み度 ゆがみ : ひずみ度は, 左右対称か否かを判定する統計量である. 正規分布では, 歪み度は 0 である. 右に裾を引く場合は, 正である. 左に裾を引く場合は, 負になる. スキューネスと読む. センド Kurtosis: 尖度 尖り度 : とがり度は, 正規分布の場合 0 となる. 扁平の分布は負となる. カート-シスと読む ( 新村,2000). 歪み度と尖り度を加えて絶対値 2 以上の場合, 正規性は保証できない傾向にある. 同様の例題 ( 表 1) に対してカイ分布を用いた適合検定によって実施してみる. 解析ソフトは群馬大学の青木先生の無料ソフト (http://aoki2.si.gunma-u.ac.jp/javascript/ ) を使用した. 解析結果を表 3 に示した. 正規分布へのあてはめ ( 面積を計算する方法 ) 平均値 = 100.950( 各クラスにおける個体数を入力するため前述の 100.0 とは異なる. したがって, 分散および標準偏差も同様に異なる ) 分散 = 184.000 標準偏差 = 13.5647 表 3. 雄若齢 F344 ラットの増体重の分布 階級開始値 観察度数 相対度数 理論比 期待値 60.0000 0 0.00000 0.01115 0.11146 70.0000 1 0.10000 0.04965 0.49648 80.0000 1 0.10000 0.14791 1.47908 90.000 2 0.20000 0.26191 2.61913 100.000 4 0.40000 0.27588 2.75875 110.000 1 0.10000 0.17286 1.72857 120.000 1 0.10000 0.06439 0.64390 130.000 0 0.00000 0.06439 0.16262 合計 10 1.00000 1.00000 10.00000 適合度の検定 最初の 3 カテゴリーを併合した. 最後の 3 カテゴリーを併合したカイ二乗値 = 0.82141 自由度 = 1( カテゴリーマイナス 3= 4-3=1), したがって, カテゴリー ( 区間 ) は 4 以上を設定する. 有意確率 = 0.36477 有意差を認めず正規性を確認できた. したがって, この場合 Shapiro-Wilk の W 検定と同一の結果となった. 42

2. カイ分布を用いた手計算 ( 柴田,1970) および SAS JMP による Shapiro-Wilk の W 検定ある学生が Crimson clover の花粉粒の直径を測定しクラス分けをした結果 ( 表 4) である. この標本の母集団は正規分布をしているといえるか? カイ分布を用いた手計算および SAS JMP による Shapiro-Wilk の W 検定の結果を示す. カイ分布を用いた計算 適合検定, 標本分布 ( 観測値 ) が正規分布 ( 理論値 ) に一致しているかどうかを検定する. 表 4. Crimson clover の花粉粒の 直径を測定 クラス * 観測値 (x) 17-19 - 19-21 1 21-23 1 23-25 9 25-27 12 27-29 31 29-31 40 31-33 20 33-35 13 35-37 6 37-39 1 39-41 2 41-43 1 43-45 - * 接眼ミクロメータの目盛り数. 1 目盛は約 1.43μs である. この表では観測値の実際の分布よりも上下 1 区間 ( クラス ) 各々余分にとっている. これは正規分布が限りなく続くことを考慮してある. 表 4 から計算に必要な数値を表 5 の如く作成する. x - x 表 5. 計算に必要な諸数値 x - x Sx ( 面積 )* の差 の差 N 19-10.90 3.07 0.4989 0.0052 0.71 21-8.90 2.51 0.4937 0.0199 2.73 23-6.90 1.94 0.4738 0.0576 7.89 25-4.90 1.38 0.4162 0.1223 16.76 27-2.90 0.82 0.2939 0.1952 26.74 29-0.09 0.25 0.0987 0.2204** 30.19 31 1.10 0.31 0.1217 0.1862 25.51 33 3.10 0.87 0.3079 0.1172 16.06 35 5.10 1.44 0.4251 0.0522 7.15 37 7.10 2.00 0.4773 0.0175 2.40 39 9.10 2.56 0.4948 0.0043 0.59 41 11.10 3.13 0.4991 0.0008 0.11 43 13.10 3.69 0.4999 - - x は観測値, x は平均値 =29.90,Sx は標準偏差 =3.55,N は総観察数 =137 * 正規分布の面積表 ( 数表 4-3) による.** ここだけは和で,0.0987+0.1217=0.2204 とする. 43

数表 4-3. 正規分布の面積と高さ ( 柴田,1970) Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 0.00.39894.00000 0.45.36053.17364 0.90.26609.31594 1.35.16038.41149 0.01.39892.00399 0.46.35889.17724 0.91.26369.31859 1.36.15822.41309 0.02.39886.00798 0.47.35723.18082 0.92.26129.32121 1.37.15608.41466 0.03.39876.01197 0.48.35553.18439 0.93.25888.32381 1.38.15395.41621 0.04.39862.01595 0.49.35381.18793 0.94.25647.32639 1.39.15183.41774 0.05.39884.01994 0.50.35207.19146 0.95.25406.32894 1.40.14973.41924 0.06.39822.02392 0.51.35029.19497 0.96.25164.33147 1.41.14764.42073 0.07.39797.02790 0.52.34849.19847 0.97.24923.33398 1.42.14556.42220 0.08.39767.03188 0.53.34667.20194 0.98.24681.33646 1.43.14350.42364 0.09.39735.03586 0.54.34482.20540 0.99.24439.33891 1.44.14146.42507 0.10.39695.03983 0.55.34294.20884 1.00.24197.34134 1.45.13943.42647 0.11.39654.04380 0.56.34105.21226 1.01.23955.34375 1.46.13742.42786 0.12.39608.04776 0.57.33912.21566 1.02.23713.34614 1.47.13542.42922 0.13.39559.05172 0.58.33718.21904 1.03.23471.34850 1.48.13344.43056 0.14.39505.05567 0.59.33521.22240 1.04.23230.35083 1.49.13147.43189 0.15.39448.05962 0.60.33322.22575 1.05.22988.35314 1.50.12952.43319 0.16.39387.06356 0.61.33121.22907 1.06.22747.35543 1.51.12758.43448 0.17.39322.06749 0.62.32918.23237 1.07.22506.35769 1.52.12566.43574 0.18.39253.07142 0.63.32713.23565 1.08.22265.35993 1.53.12376.43699 0.19.39181.07535 0.64.32506.23891 1.09.22025.36214 1.54.12188.43822 0.20.39104.07926 0.65.32297.24215 1.10.21785.36433 1.55.12001.43943 0.21.39024.08317 0.66.32086.24537 1.11.21546.36650 1.56.11816.44062 0.22.38940.08706 0.67.31874.24857 1.12.21307.36864 1.57.11632.44179 0.23.38853.09095 0.68.31659.25175 1.13.21069.37076 1.58.11450.44295 0.24.38762.09483 0.69.31443.25490 1.14.20831.37286 1.59.11270.44408 0.25.38667.09871 0.70.31225.25840 1.15.20594.37493 1.60.11092.44562 0.26.38568.10257 0.71.31006.26115 1.16.20357.37698 1.61.10915.44630 0.27.38466.10642 0.72.30785.26424 1.17.20121.37900 1.62.10741.44738 0.28.38361.11026 0.73.30563.26730 1.18.19886.38100 1.63.10567.44845 0.29.38251.11409 0.74.30339.27035 1.19.19652.38298 1.64.10396.44950 0.30.38139.11791 0.75.30114.27337 1.20.19419.38493 1.65.10226.45053 0.31.38023.12172 0.76.29887.27637 1.21.19186.38686 1.66.10059.45154 0.32.37903.12552 0.77.29659.27935 1.22.18954.38877 1.67.09893.45254 0.33.37780.12930 0.78.29431.28230 1.23.18724.39065 1.68.09728.45352 0.34.37654.13307 0.79.29200.28524 1.24.18494.39251 1.69.09566.45449 0.35.37524.13683 0.80.28969.28814 1.25.18265.39435 1.70.09405.45543 0.36.37391.14058 0.81.28737.29103 1.26.18037.39617 1.71.09246.45637 0.37.37255.14431 0.82.28504.29389 1.27.17810.39796 1.72.09089.45728 0.38.37115.14803 0.83.28269.29673 1.28.17585.39973 1.73.08933.45818 0.39.36973.15173 0.84.28034.29955 1.29.17360.40147 1.74.08780.45907 0.40.36827.15542 0.85.27798.30234 1.30.17137.40320 1.75.08628.45994 0.41.36678.15910 0.86.27562.30511 1.31.16915.40490 1.76.08478.46080 0.42.36526.16276 0.87.27324.30785 1.32.16694.40658 1.77.08329.46164 0.43.36371.16640 0.88.27086.31057 1.33.16474.40824 1.78.08183.46246 0.44.36213.17003.0.89.26848.31327 1.34.16256.40988 1.79.08038.46327 44

数表 4-3. つづき Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 Z* 高さ 面積 1.80.07895.46407 2.25.03174.48778 2.70.01042.49653 3.15.00279.49918 1.81.07754.46485 2.26.03103.48809 2.71.01014.49664 3.16.00271.49921 1.82.07614.46562 2.27.03034.48840 2.72.00987.49674 3.17.00262.49924 1.83.07477.46638 2.28.02965.48870 2.73.00961.49683 3.18.00254.49926 1.84.07341.46712 2.29.02898.48899 2.74.00935.49693 3.19.00246.49929 1.85.07206.46784 2.30.02833.48928 2.75.00909.49702 3.20.00238.49931 1.86.07074.46856 2.31.02768.48956 2.76.00885.49711 3.21.00231.49934 1.87.06943.46926 2.32.02705.48983 2.77.00861.49720 3.22.00224.49936 1.88.06814.46995 2.33.02643.49010 2.78.00837.49728 3.23.00216.49938 1.89.06687.47062 2.34.02582.49036 2.79.00814.49736 3.24.00210.49940 1.90.06562.47128 2.35.02522.49061 2.80.00792.49774 3.25.00203.49942 1.91.06439.17193 2.36.02463.49086 8.81.00770.49752 3.26.00196.49944 1.92.06316.47257 2.37.02406.49111 2.82.00748.49760 3.27.00190.49946 1.93.06195.47320 2.38.02349.49134 2.83.00727.49767 3.28.00184.49948 1.94.06077.47381 2.39.02294.49158 2.84.00707.49774 3.29.00178.49950 1.95.05959.47441 2.40.02239.49180 2.85.00687.49781 3.30.00172.49952 1.96.05844.47500 2.41.02186.49202 2.86.00668.49788 3.31.00167.49953 1.97.05730.47558 2.42.02134.49224 2.87.00649.49795 3.32.00161.49955 1.98.05618.47615 2.43.02083.49245 2.88.00631.49801 3.33.00156.49957 1.99.05508.47670 2.44.02033.49266 2.89.00613.49807 3.34.00151.49958 2.00.05399.47725 2.45.01984.49286 2.90.00595.49813 3.35.00146.49960 2.01.05292.47778 2.46.01936.49305 2.91.00578.49819 3.36.00141.49961 2.02.05186.47831 2.47.01889.49324 2.92.00562.49825 3.37.00136.49962 2.03.05082.47882 2.48.01842.49343 2.93.00545.49831 3.38.00132.49964 2.04.04980.47932 2.49.01797.49361 2.94.00530.49836 3.39.00127.49965 2.05.04879.47982 2.50 0.1753.49379 2.95.00514.49841 3.40.00123.49966 2.06.04780.48060 2.51.01709.49396 2.96.00499.49846 3.41.00119.49968 2.07.04682.48077 2.52.01667.49413 2.97.00485.49851 3.42.00115.49969 2.08.04586.48124 2.53.01625.49430 2.98.00471.49856 3.43.00111.49970 2.09.04491.48169 2.54.01585.49446 2.99.00457.49861 3.44.00107.49971 2.10.04398.48214 2.55.01545.49461 3.00.00443.49865 3.45.00104.49972 2.11.04307.48257 2.56.01506.49477 3.01.00430.49869 3.46.00100.49973 2.12.04217.48300 2.57.01468.49492 3.02.00417.49874 3.47.00097.49974 2.13.04128.48341 2.58.01431.49506 3.03.00405.49878 3.48.00094.49975 2.14.04041.48382 2.59.01394.49520 3.04.00393.49882 3.49.00090.49976 2.15.03955.48422 2.60.01358.49534 3.05.00381.49886 3.50.00087.49977 2.16.03871.48461 261.01323.49547 3.06.00370.49889 3.51.00084.49978 2.17.03788.48500 2.62.01289.49560 3.07.00358.49893 3.52.00081.49978 2.18.03706.48537 2.63.01256.49573 3.08.00348.49897 3.53.00089.49979 2.19.03626.48574 2.64.01223.49585 3.09.00337.49900 3.54.00076.49980 2.20.03547.48610 2.65.01191.49598 3.10.00327.49903 3.55.00073.49981 2.21.03470.48645 2.66.01160.49609 3.11.00317.49906 3.56.00071.49981 2.22.03394.48679 2.67.01130.49621 3.12.00307.49910 3.57.00068.49982 2.23.03319.48713 2.68.01100.49632 3.13.00298.49913 3.58.00066.49983 2.24.03246.48745 2.69.01071.49643 3.14.00288.49916 3.59.00063.49983 45

数表 4-3. つづき Z* 高さ 面積 Z* 高さ 面積 3.60.00061.49984 3.80.00029.49993 3.61.00059.49985 3.81.00028.49993 3.62.00057.49985 3.82.00027.49993 3.63.00055.49986 3.83.00026.49994 3.64.00053.49986 3.84.00025.49994 3.65.00051.49987 3.85.00024.49994 3.66.00049.49987 3.86.00023.49994 3.67.00047.49988 3.87.00022.49995 3.68.00046.49988 3.88.00021.49995 3.69.00044.49989 3.89.00021.49995 3.70.00042.49989 3.90.00020.49995 3.71.00041.49990 3.91.00019.49995 3.72.00039.49990 3.92.00018.49996 3.73.00038.49990 3.93.00018.49996 3.74.00037.49991 3.94.00017.49996 3.75.00035.49991 3.95.00016.49996 3.76.00034.49992 3.96.00016.49996 3.77.00033.49992 3.97.00015.49996 3.78.00031.49992 3.98.00014.49997 3.79.00030.49999 3.99.00014.49997 *= σ X 4.00.000134.4999683 4.50.000016.4999966 5.00.000001.4999997 クラス 粒数 観測値 (x) 表 6. 計算過程および計算結果 理論値 の差 N=T x - T 2 ( x - T ) ( x - T ) T 17-19 - - - - - 19-21 1 0.71 21-23 1 +2.73-0.33 0.11 0.010 23-25 9 +7.89=11.33 25-27 12 16.76-4.76-22.66 1.352 27-29 31 26.74 4.26 18.15 0.678 29-31 40 30.19 9.81 96.24 3.188 31-33 20 25.51-5.51 30.36 1.190 33-35 13 16.06-3.06 9.36 0.583 35-37 6 37-39 1 39-41 2 41-43 1 7.15 +2.40 +0.59 +0.11=10.25-0.25 0.06 0.006 43-45 - - - - - Total のカイ二乗値 = 0.010+1.352+0.678+3.188+1.190+0.583+0.006= 7.007 この場合の自由度であるが, 当初は 12 にクラス分けされたが, 理論値 5 以下のクラス分けに統合したため T= の差 N で見られる如く 7 クラスになった. 故に自由度は 7-3=4 である. カイ二乗計算値 = X 2 = 7.007( 表 6) 自由度 4,X 2 の分布表 ( 数表 4-3) から 7.007 に対する確率は,5% 水準値が 9.488 でこの値より小さいことから 5% 水準で有意 (P>0.05) を認められなかったことになる. カイ分布から逸脱していないことがわかる. すなわち, 標本の母集団は正規分布をしていると結論される. 本検定法は階級幅 ( クラス ) を幾つに設定するかによって有意水準が異なってくる. 2 46

数表 4-3. カイ二乗分布のパーセント点 ( 吉村ら,1987) 有意水準点,α 0.100 0.050 0.010 0.001 階級 - 3 1 2.706 3.841 6.635 10.828 2 4.605 5.991 9.210 13.816 3 6.251 7.815 11.345 16.266 4 7.779 9.488 13.277 18.467 5 9.236 11.070 15.086 20.515 6 10.645 12.592 16.812 22.458 第 4 章正規性の検定 クラス ( 階級幅 ) の設定により有意差が変化する.3 種類のクラス設定による検出力の違いを表 7 に示した ( 前述の青木先生のプログラムによる ). データの整理 表 7. クラス ( 階級幅 ) の設定による有意差の変化 観測値 観察個数 クラス 観測値 観察個数 クラス 観測値 観察個数 クラス 17-15 - 13 0 4 19 1 2 19 4 19 11 11 21 1 23 21 21 25 83 83 23 9 9 27 71 71 31 39 39 25 12 12 31 33 33 37 4 27 31 31 35 7 43 0 4 29 40 40 39 3 10 31 20 20 43 0 33 13 13 35 6 6 37 1 39 2 41 1 4 43 - クラスの数 9 5 4 カイ二乗値 8.197 6.983 4.093 自由度 9-3=6 5-3=2 4-3=1 有意水準 ( 直接確率 ) P=0.223 P=0.030 P=0.043 判定 正規性 非正規性 非正規性 区間の分けの選び方は, 自由度を, なるべく 5 以上 20 以下に設定する. 自由度は, クラス数を k で表せば k-3 で表される. この理由は, 通常は k-1 となるが, 平均値と標準偏差を標本から推定したので自由度はさらに 2 へるから,D.F.= (k-1)-2= k-3 となる. したがって, 正規性の検定は, 解析者によって検出力が異なることが示唆される. 47

SAS JMP による解析結果を下記に示した. Shapiro-Wilk の W 検定の結果は,0.9545 より大きな値をとる確率が 0.0009 であることを示している. したがって, 標本は正規母集団より抽出されたものではないと統計処理の結果は述べている. 数表 4-2 では自由度が 50 までにとどまっているため正確な棄却はできないが, 自由度が大きくなるにしたがって,W 値が 0.947 でも正規性が棄却されることから 0.954 はおそらく高い水準で有意差を示したことになることが推測される. カイ分布を用いる適合度検定とは, 結果が大きく異なる. しかし,Shapiro-Wilk の W 検定は, 極端に大きい数値から極端に小さい数値の差を利用していることから, 分布の違いを検定していることが肌で感じられる. 3. ほぼ同一分布で標本数が異なるデータに対する Shapiro-Wilk の W 検定の検出力 Shapiro-Wilk の W 検定は, 標本数の違いによって検出力が異なることが示唆されることからほぼ同一の分布を設定して, 標本数を異なる場合を想定して Shapiro-Wilk の W 検定を実施した. 使用したデータはラットの 3 週間の増体重から抜粋したデータを使用した. 例 1 では,70, 80, 85, 90, 94, 99, 101, 102, 104, 105, 108, 111, 112, 114, 121, 125, 131 の 17 標本. 例 2 では, 例 1 のデータを 2 回 (34 標本 ) 繰り返し使用した. 例 3 では, 例 1 のデータを 3 回 (51 標本 ) 繰り返し使用した. 例 4 では, 例 1 のデータを 4 回 (68 標本 ) 繰り返し使用した. 48

例 1: 標本数 17 ラット 13 週間の増体重 (g), N=17 例 2: 標本数 34 ラット 13 週間の増体重 (g), N=34 49

例 3: 標本数 51 ラット 13 週間の増体重 (g), N=51 例 4: 標本数 68 ラット 13 週間の増体重 (g), N=68 50

以上の結果を表 8 に集約する. 表 8. 数の違いによる Shapiro-Wilk の W 検定の検出力変動係数 Shapiro-Wilk の W 検定標本数ヒストグラム平均値 (%) W 値有意水準 17 15.5 0.987278 0.9891(NS) 34 15.3 0.968746 0.5017(NS) 103 51 15.2 0.959888 0.1486(NS) 70 80 90 100 110 120 130 68 15.2 0.954862 0.0383(S) N=68 NS, 有意差を示さない, 正規性を示す.S, 有意差を示す. 正規性を示さない. ほぼ同一な分布 ( ヒストグラム ) の場合, 標本数が小さいと W 値が大きくなる. 標本数が大きくなるに従って正規性の検出が低下する. カイ分布を利用した場合は, グループ数を適当に調節できるが,Shapiro-Wilk の W 検定ではグループの設定ができない. したがって, 大標本の場合,Shapiro-Wilk の W 検定は, 正規性の確保が難しいことが推測される. 以上を総括するとカイ分布を用いる適合度検定とは, 階級幅の設定の違いによって正規性の判断が異なる. すなわち, 階級に所属する個体数が大きい場合, 正規性を保つことが困難となり, 逆にクラス数を多く設定すると正規性が保たれる傾向にある. 実際の使用場面では,Shapiro-Wilk の W 検定またはカイ分布を用いる適合度検定のどちらを選択するかは, 試験責任者にお任せする. 4. 正規分布の不思議実際の毒性試験から得られた定量データに対して正規分布の検定を実施した結果, 興味ある現象が認められたので報告する. 定量値の中でも最も正規分布が保証されている項目の 1 つに体重がある.Table 9 に示すように 10 試験の各対照群は正規分布をしているが群内標本数が増加すると正規分布は保たれなくなる. 次に正規分布が保証できないといわれている血小板について同様に吟味した結果を Table 10 に示した. 各試験に用いる対照群で正規分布を示さない項目は, 群内標本数が増加しても正規分布は保証されない. このように正規性の検定は, 標本数が増加することによって, 正規分布は保証できなくなる. Table 9. Influence of number of samples on normal distribution of body weight of F344 control male rats at week 52 obtained from 10 toxicity studies Item Study No. 1 2 3 4 5 6 7 8 9 10 Mean±S.D. 355±20 396±26 344±24 351±21 361±22 384±20 355±18 358±18 371±29 358±16 N 59 70 50 60 49 69 50 50 50 49 CV (%) 5.6 6.6 7.0 6.0 6.1 5.2 5.1 5.0 7.8 4.5 Skewness -0.70911 0.33990 0.02128-0.14887 0.40923 0.26216 0.23044 0.39612-0.28367-0.19555 Kurtosis 5.775852-0.38485-0.40960-0.23998 0.14793 0.01995-0.12768 0.72421-0.11968 0.50738 W value 0.958792 0.972164 0.980042 0.792880 0.974313 0.978060 0.976035 0.976787 0.977877 0.978780 P (Prob<W) 0.0912 0.3140 0.7299 0.3964 0.5262 0.5499 0.5809 0.6089 0.6496 0.6895 0.1069 0.1218 0.0144 P (Prob<W) for cumulative effect 0.0070 0.1449 0.0460 0.0141 0.0365 0.0153 51

Table 10. Influence of number of samples on non-normal distribution of platelet counts of F344 control male rats at week 104 obtained from 7 toxicity studies Study No. Item 1 2 3 4 5 6 7 Mean±S.D. 611±136 648±137 647±104 797±194 679±125 724±115 733±150 N 41 38 40 37 40 38 41 CV (%) 22 21 16 24 18 16 20 Skewness 1.972014 1.708086 1.290418 0.240257-1.178269-1.864571 1.457151 Kurtosis 7.148736 7.770058 4.467973 5.235356 6.786090 8.887765 4.885960 W value 0.787694 0.848761 0.917248 0.869061 0.873100 0.836600 0.850105 P (Prob<W) <0.0001 <0.0001 0.0069 0.0003 0.0002 <0.0001 <0.0001 0.0000 P (Prob<W) for cumulative effect <0.0001 0.0000 <0.0001 <0.0001 0.0000 5. 正規分布を利用した段階の評価正規分布は, ガウス (Gauss, 1777~1855) によって発見された分布です. ガウスの活躍は幅広く, 純粋数学から物理, 天文学, 測地学などに至る. その中の天文学において, 天体の位置を測定するときできる誤差から誕生した分布で, 一度は皆さんも受験のとき目にした分布である. ヒトを含めた生物から得られる多くの定量値のデータは, 正規分布を示すといわれている. したがって, 多くの正書では, 正規性を確認してから群間比較の手法を用いることを奨めている (NTP report, 1997). しかし, 一般的には等分散性の検定のみで正規性は, 確認されず分散を利用した解析法で検定しているのが現状である. 正規分布の特性図 1 に示すように綺麗な釣り鐘状の分布となる. すなわち,[ 平均値 +1.96 標準偏差 ]~[ 平均値 -1.96 標準偏差 ] の間にあるのは全体のうちの 95% に相当する. 同じようにして次のよく使われる数値が得られる. [ 平均値 +1 標準偏差 ]~[ 平均値 -1 標準偏差 ] の間にあるのは全体のうちの 68.3% [ 平均値 +3 標準偏差 ]~[ 平均値 -3 標準偏差 ] の間にあるのは全体のうちの 99.7% 図 1. 標準正規分布. 正規分布の性質は, (1)y 軸に対し左右対称になっている. 面積は左半分 0.5, 右半分 0.5. (2) 平均は, 対称軸になっている. (3) 平均のところで最も大きな値を持つ. 正規分布の利用ある 200 点満点の模擬テストを 5000 人に行い, 平均 123.5 点, 標準偏差 21.3 点を得た. このとき, (1)180 点以上取った学生は何人いるか? 変数 x = u -123.5 を計算する. 21.3 180-123.5 = + 2.653 = 0.00400 21.3 52

+2.653 から 0.00400 の計算は, 数表 4-4 から 2.653% 点に対応する上側確率 0.00400 である. + の場合は以上 (180 点 ) を示す. 数表 4-4. 規準正規分布のパーセント点 両側確率 上側確率 % 点 2α α u(α) 0.00001 0.000005 4.417173 0.00002 0.000010 4.264891 0.00003 0.000015 4.173466 0.00004 0.000020 4.107480 0.00005 0.000025 4.055627 0.00006 0.000030 4.012811 0.00007 0.000035 3.976286 0.00008 0.000040 3.944400 0.00009 0.000045 3.916081 0.00010 0.000050 3.890592 0.00020 0.000100 3.719016 0.00030 0.000150 3.615300 0.00040 0.000200 3.540084 0.00050 0.000250 3.480756 0.00060 0.000300 3.431614 0.00070 0.000350 3.389579 0.00080 0.000400 3.352795 0.00090 0.000450 3.320054 0.00100 0.000500 3.290527 0.00200 0.001000 3.090232 0.00300 0.001500 2.967738 0.00400 0.002000 2.878162 0.00500 0.002500 2.807034 0.00600 0.003000 2.747781 0.00700 0.003500 2.696844 0.00800 0.004000 2.652070 0.00900 0.004500 2.612054 0.01000 0.005000 2.575829 0.02000 0.010000 2.326348 0.03000 0.015000 2.170090 0.04000 0.020000 2.053749 0.05000 0.025000 1.959964 0.06000 0.030000 1.880791 0.07000 0.035000 1.811911 0.08000 0.040000 1.750686 0.09000 0.045000 1.695398 0.10000 0.050000 1.644854 0.11000 0.055000 1.598193 0.12000 0.060000 1.554774 0.13000 0.065000 1.514102 0.14000 0.070000 1.475791 0.15000 0.075000 1.439531 0.16000 0.080000 1.405072 0.17000 0.850000 1.372204 0.18000 0.090000 1.340755 0.19000 0.095000 1.310579 0.20000 0.100000 1.281552 0.30000 0.150000 1.036433 53

0.40000 0.200000 0.841621 0.50000 0.250000 0.674490 0.60000 0.300000 0.524401 0.70000 0.350000 0.385320 0.80000 0.400000 0.253347 0.90000 0.450000 0.125661 1.00000 0.500000 0.000000 両側 5% 点は,2α=0.05 に対応する u(α) の列より 1.959964 となる. したがって,0.00400 となり,5000 0.004=20 人となる. (2)50 点から 100 点までの間に何人の学生がいるか? 50-123.5 = -3.4507 = 0.0003000 21.3 100-123.5 = -1.1033 = 0.150000~0.100000 21.3 0.15~0.1 の間は 0.135 とした. したがって, マイナスの数値は以下を示すので 100 点以下から 50 点以下を引く. 1.35-0.0003=1.3497 となる.5000 0.13497=675 人となる. 54

5 段階評価正規分布を利用してあるデータを段階に評価してみる. この手法は, 小中学校の成績評価に応用されているようである. 某本学の成績評価指針 (A, B, C および D) に記載されている. ここでは 5 段階評価のための計算法を手計算にて説明する. 表 11 のデータは, 著者が担当していた 2001-2003 年度の 多変量解析 / 慶大 の実際の試験結果である.2 名を除外して 100 名に改変した. 表 11. 試験結果 100, 100, 100, 100, 98, 98, 98, 96, 96, 96, 96, 95, 95, 94, 93, 92, 92, 92, 92, 91,90, 90, 90, 90, 90, 89, 88, 87, 86, 86, 86, 86, 84, 84, 84, 84, 84, 83, 82, 82,80, 80, 80, 78, 78, 78, 77, 77, 76, 76, 75, 75, 74, 74, 74, 74, 72, 72, 71, 70,70, 70, 70, 70, 69, 68, 68, 68, 68, 66, 66, 65, 65, 65, 63, 62, 62, 60, 58, 56, 54, 52, 51, 51, 50, 50, 48, 47, 46, 41, 40, 40, 37, 32, 32, 27, 27, 27, 20, 4 SAS JMP による解析結果を下記に示した. SAS JMP で正規性を吟味した結果, 正規性 (W=0.919671) は認められなかった (P<0.001). 55

SAS JMP のヒストグラム結果を参照して下さい. ヒストグラムと曲線のズレはさほど大きいとはいえないが統計学的には大きなズレがあるようである. Shapiro-Wilk の W 検定では正規性が 0.1% 水準で棄却されている. 正規性がないということになる. 新村 (2000) は, 正規分布からの呪縛からの解放の項で 正規分布であれば, 平均は分布のよい代表値であり, 標準偏差は, データのバラツキを表している. そしてこの 2 つのパラメータで, 完全に正規分布は決定される. さらに, 歪み度と尖り度は,0 になる. 多くのデータを分析すると, 特に人が介在するような人文社会学分野で観測される変数は, 正規性にならず右に裾を引く様な分布がよく現れる. このような場合, 平均値の代わりに中央値, 標準偏差の代わりに四分位偏差を用いるべきである. そして歪み度と尖り度でもって, 分布の形状が分かる と述べています. 前述のように正規性の検定法はいくつかあり標本数の変化によっても検定結果が大きく左右される. 著者は, Shapiro-Wilk の W 検定をあまり推奨していない. 標本数が増加すると正規性が保たれにくい傾向にある (Kobayashi, 2004). 5 段階評価の結果正規性を認めた試験得点データの入手は難しいようである. したがって, 表 11 データを使用して各段階に評価 ( 表 12) する. 平均得点 72, 標準偏差 21, 受験者 100 人.N(72, 21 2 ) と表示する. 表 12. 5 段階評価の結果 計算式 点数の範囲 修正点数の範囲 評点 人数 割合 (%) 72+1.5 21 102 以上 100 5 4 4 72+0.5 21 101~83 99~83 4 34 34 72-0.5 21 82~62 82~62 3 39 39 72-1.5 21 61~41 61~41 2 13 13 40 以下 40 以下 1 10 10 図 2. 正規分布データを 5 段階評価したときの 各段階に占める割合表 12 と図 2 を比較するとかなりのズレがある. (1)83 点以上取った学生は何人いるか? 変数 x = u - 72 を計算する. 21 83-72 = + 0.5238 = 0.300000 21 +0.5238 を数表 1 の規準正規分布のパーセント点から 0.3 を導き出す. 100 人 0.3=30 人となる. 実際は 38 人となる. 非正規性のためと推測する. 56

附録 : 分布を利用した検定のための正規分布と等分散検定一般的には, 二標本の t- 検定は, 正規分布かつ等分散である必要があり, 正規分布でも, 不等分散の場合には,Welch の方法が必要になる. 等分散とは各群のヒストグラムの形が似ているものである. 等分散の検定には, 二群間検定の場合は,F 検定が用いられる. 三群以上の場合は,Bartlett や Levene の等分散検定がある. 図 3. 2 群とも正規分布で等分散図 4. 非正規分布で等分散図 5. 非正規分布で不等分散 正規性の検定 (Shapiro-Wilk 検定など ) では, データ数が 30 程度は必要である. よって, 少数例では正規性の確認ができない. この場合どうするかというと, あまりにせず,t- 検定や分散分析を行ってもよいというものと, 正規性が確認できない場合には, 最初からノンパラメトリック法を使用すべきという学者がいる. 正規分布と等分散との組み合わせを図 3~5 に示した. 図 3 の場合が最も検出力が高く統計解析に適している. 附録 ;SAS JMP による男女の差の検定 : 生データは獲得点に対する男女の区別がある. ここでついでに, 男女間の得点差について吟味する.SAS JMP による結果を図 6, 表 13 および表 14 に示した. 得点 110 100 90 80 70 60 50 40 30 20 10 0 F 図 6. 男女による得点の一元配置分析 男女 M ペアごと Student の t 検定 0.05 表 13. 平均と標準偏差 水準 数 平均 標準偏差 F 28 80.0357 13.6775 M 72 69.3611 22.2535 表 14. 検定結果 水準 平均 F A 80.035714 M B 69.361111 同じ文字でつながっていない水準は有意に異なります. 結論 : 男女間の差 11 点は 5% 水準で有意差を認めた. したがって, 女性の方が男性に比較して点数が 11 高いことになる. 57

引用文献および引用資料 柴田寛三 (1970): 生物統計学講義, 東京農業大学, 東京. 椿美智子, 椿広計共訳 (2001): 医学研究のための統計的方法,pp356-357, サイエンティスト社, 東京. 新村秀一 (2000): パソコン楽々統計学,pp53, ブルーバックス B-1198, 講談社, 東京. 野村護 (2002):GLP 試験の日 欧相互承認協定発効に伴う統計解析の問題点, 医薬安全性研究会会報, No. 47, pp41, サイエンティスト社, 東京. 武藤眞介 (2000):STATISTICA によるデータ解析, 朝倉書店, 東京. Conover, W.J. (1999): Practical nonparametric statistics, Third edition, pp450-452, and 550-553. John Wiley & Sons Inc. New York, U.S.A. Katsumi Kobayashi: Evaluation of toxicity dose levels by cluster analysis, Journal of Toxicological Science, 29, No. 2, 125-129, 2004. National Toxicology Program (1997): Toxicology and carcinogenesis studies of t-butylhydroquinone, No. 459, pp27, National Institutes of Health (NIH), USA. 58