仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Similar documents
MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです ゲージ R&R 分析 ( 交差 ) 概要 測定システ

一元配置分散分析法 F 検定と Welch 検定 一元配置分散分析で一般的に使用される F 検定は すべてのグループが共通だが未知の標準偏差 (σ) を共有するという仮定に基づきます 実際には この仮定が当てはまることはまれで その結果 タイプ I 過誤率の制御が難しくなります タイプ I の誤りと

EBNと疫学

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

基礎統計

統計的データ解析

ビジネス統計 統計基礎とエクセル分析 正誤表

Medical3

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Medical3

Microsoft PowerPoint - sc7.ppt [互換モード]

情報工学概論

第7章

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

経済統計分析1 イントロダクション

カイ二乗フィット検定、パラメータの誤差

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

青焼 1章[15-52].indd

Microsoft Word - å“Ÿåłžå¸°173.docx

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

ANOVA

講義「○○○○」

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

PowerPoint プレゼンテーション

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft PowerPoint - e-stat(OLS).pptx

データ科学2.pptx

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

切断安定分布による資産収益率のファットテイル性のモデル化とVaR・ESの計測手法におけるモデル・リスクの数値的分析

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

数値計算法

Microsoft Word - appendix_b

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - ch04j

TOEIC(R) Newsletter

データ解析

EBNと疫学

日心TWS

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

解析センターを知っていただく キャンペーン

OpRisk VaR3.2 Presentation

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

Microsoft PowerPoint - statistics pptx

Microsoft Word - Stattext12.doc

異文化言語教育評価論 ⅠA 教育 心理系研究のためのデータ分析入門 第 3 章 t 検定 (2 変数間の平均の差を分析 ) 平成 26 年 5 月 7 日 報告者 :M.S. I.N. 3-1 統計的検定 統計的検定 : 設定した仮説にもとづいて集めた標本を確率論の観点から分析し 仮説検証を行うこと

リスク分析・シミュレーション

Microsoft PowerPoint - stat-2014-[9] pptx

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

PowerPoint プレゼンテーション

スライド 1

Microsoft PowerPoint - statistics pptx

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Adobe Acrobat DC 製品比較表

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft Word - HM-RAJ doc

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

Microsoft Word - Stattext13.doc

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word - 保健医療統計学112817完成版.docx

Probit , Mixed logit

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

サーバに関するヘドニック回帰式(再推計結果)

2013年 「上場企業における英語活用実態調査」報告書

Microsoft PowerPoint - statistics pptx

Microsoft Word - apstattext04.docx

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft Word doc

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

不偏推定量

モジュール1のまとめ

Microsoft PowerPoint - 資料04 重回帰分析.ppt

日本製薬工業協会シンポジウム 生存時間解析の評価指標に関する最近の展開ー RMST (restricted mean survival time) を理解するー 2. RMST の定義と統計的推測 2018 年 6 月 13 日医薬品評価委員会データサイエンス部会タスクフォース 4 生存時間解析チー

統計学の基礎から学ぶ実験計画法ー1

スライド 1

Excelにおける回帰分析(最小二乗法)の手順と出力

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

解答のポイント 第 1 章問 1 ポイント仮に1 年生全員の数が 100 人であったとする.100 人全員に数学の試験を課して, それらの 100 人の個人個人の点数が母集団となる. 問 2 ポイント仮に10 人を抽出するとする. 学生に1から 100 までの番号を割り当てたとする. 箱の中に番号札

Microsoft PowerPoint - 測量学.ppt [互換モード]

MedicalStatisticsForAll.indd

JUSE-StatWorks/V5 ユーザーズマニュアル

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

<4D F736F F F696E74202D2088E38A77939D8C7695D78BAD89EF313691E63589F194E497A682C695AA8A84955C2E >

加速試験の寿命予測精度に必要な実験水準の設定と破壊データ数に関する考察 | 清水 貴宏氏(パナソニック株式会社 デバイス社)

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

プロジェクトを成功させる見積りモデルの構築と維持・改善 ~CoBRA法による見積りモデル構築とその活用方法について~

untitled

Autodesk Inventor Skill Builders Autodesk Inventor 2010 構造解析の精度改良 メッシュリファインメントによる収束計算 予想作業時間:15 分 対象のバージョン:Inventor 2010 もしくはそれ以降のバージョン シミュレーションを設定する際

<4D F736F F F696E74202D204D C982E682E892B290AE82B582BD838A E8DB782CC904D978A8BE68AD482C98AD682B782E988EA8D6C8E402E >

<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>

1.民営化

Microsoft PowerPoint - 【配布・WEB公開用】SAS発表資料.pptx

Published by arragemet with the Food ad Agriculture Orgaizatio of Uited Natios by the Miistry of Health, Labour ad Welfare 本文書は 当初 国際連合食糧農業機関 (FAO) 及び

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

Microsoft PowerPoint - 基礎・経済統計6.ppt

Transcription:

MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良 / 良好などの 2 つのカテゴリや 最高 良い 普通 不適当などの 3 つ以上のカテゴリに分類される場合があります 別の例として ある財務部門では 請求書の延滞日数を追跡して 15 日以下 16~30 日 31~45 日 46 日以上のカテゴリに分類します その結果 各カテゴリ内の項目数が変数の対象となります カイ二乗検定は汎用性があるため カテゴリデータを伴う多くの用途で使用されます アシスタントでは 次の用途にカイ二乗検定を使用します 多項分布の適合度検定 この検定を使用して データが過去の分布と同じ分布に従うかどうかを判断できます 分布は 各結果カテゴリ内の項目のパーセントを定義する履歴パーセントまたは目標パーセントのグループの多項分布として定義されます カイ二乗検定は あるパーセントがそれぞれの履歴パーセントまたはターゲットパーセントと有意な違いがあるかどうかをまとめて検定します 3 グループ以上における不良 % の同等性の検定 この検定を使用して 異なるグループの不良率間に差があるかどうかを判断できます 各グループは 対象特性に関して 異なる作業者 異なる工場または異なる時間など製造された製品の違いによって異なります カイ二乗検定は 不良率が他の不良率と有意に異なるかどうかをまとめて検定します 2 つのカテゴリ変数間の関連性検定 この検定を使用して カテゴリ結果変数 (Y) が別のカテゴリ予測変数 (X) と関連しているかどうかを判断できます カイ二乗検定は 結果変数と予測変数間に関連性があるかどうかをまとめて検定します アシスタントでは 2 つ以上の個別値 (2 つ以上のサンプル ) を含む予測変数 (X) で関連性のカイ二乗検定を実行できます カイ二乗検定統計量の詳細は 付録 A を参照してください WWW.MINITAB.COM

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています アシスタントはこれらの近似法を使用して データで次のチェックを行い レポートカードに結果を表示します サンプルサイズ 検定の妥当性 区間の妥当性 本書では これらのデータチェックが実際にどのようにカイ二乗検定に関連するかを調査し アシスタントのデータチェックのガイドラインをどのように定めたかについて説明します カイ二乗検定 2

データチェック サンプルサイズ 通常 仮説の統計検定を実施する主な目的は 差がない という帰無仮説を棄却する証拠を集めることです サンプルが小さすぎる場合 検定の検出力は実際に存在する不良率間の差を検出するには不十分で タイプ II の誤りになる可能性があります そのため 実質的に重要な差を高い確率で検出するのに十分な大きさのサンプルサイズであるかどうかが極めて重要です サンプルサイズのデータチェックは 検定の検出力に基づきます この計算では 実際の母数と帰無仮説値間の有意な差をユーザーが指定する必要があります カイ二乗適合度と関連性のカイ二乗検定でこの実質的な差を判断して表すことは非常に難しいため アシスタントでは 3 つ以上のサンプルがあるカイ二乗不良率検定のサンプルサイズのみをチェックします 目的 データから帰無仮説に対する十分な証拠が得られない場合 サンプルサイズが 対象とする特性の実際の差を 高い確率で検出する上で十分な大きさであるかを判断します サンプルサイズ計画の目的は 重要な差を 高い確率で検出するのに十分な大きさのサンプルサイズを確保することですが 無意味な差が 高い確率で統計的に有意になってしまう程にはサンプルサイズを大きくしないようにする必要があります 方法 検出力とサンプルサイズの分析は 付録 B に示す計算式に基づきます 結果 データから帰無仮説に対する十分な証拠が得られず 具体的な差が指定されていない場合 アシスタントはサンプルサイズに基づいて 80% と 90% の確率で検出できる実質的な差を計算します さらに 対象となる特性の具体的な差をユーザーが指定した場合 アシスタントはその差を検出する確率が 80% と 90% になるサンプルサイズを計算します 検出力とサンプルサイズをチェックするときに 3 つ以上のサンプルでのカイ二乗不良率検定のアシスタントレポートカードに次のステータスインジケータが表示されます ステータス 状態 検定で不良 % 間の差が見つかるため 検出力は問題ではありません または 十分な検出力があります 検定で 不良率間の差は見つかりませんでしたが サンプルサイズは 目的の差を検出する確率が 90% 以上あり 十分な大きさです 検出力が十分と思われます 検定で 不良率間の差は見つりませんでしたが サンプルサイズは目的の差を確率が 80%~90% で検出するのに十分な大きさです 90% の検出力を達成するために必要なサンプルサイズが報告されています カイ二乗検定 3

ステータス 状態 検出力が不十分と思われます 検定で 不良率間の差が見つかりませんでした このサンプルサイズでは目的の差を検出する確率が 60%~80% です 80% の検出力と 90% の検出力を達成するために必要なサンプルサイズが報告されています 検出力が不十分 (< 60%) です 検定で 不良率間の差が見つかりませんでした 80% の検出力と 90% の検出力を達成するために必要なサンプルサイズが報告されています 検定で不良率間の差が見つかりませんでした 検出する不良率間の具体的な差が指定されていなかったので サンプルサイズと α に基づいて計算された 80% と 90% の確率で検出できる差がレポートに示されます 検定の妥当性 χ 2 検定統計量は カイ二乗分布に近似的にのみ従います サンプルサイズが大きくなると近似は改善されます このセクションでは 正確な結果に必要な最小サンプルサイズを判断するために使用される近似を評価します 検定統計量に対するカイ二乗近似は タイプ I 過誤率 (α) での小さい期待セル度数の影響を調査することで評価されます 検定の妥当性の評価にタイプ I の誤りを使用することで 次の条件を満たす規則を定めます 帰無仮説が正しいのに帰無仮説を棄却する確率は 小さく 目的のタイプ I 過誤率に近い値です 帰無分布の裾を適正に近似できます これは正確な p 値を計算する上で重要です 標準の手法を使用して 期待度数が小さいセルを そのセルの度数が 5 以下と定義しました 帰無仮説での比率を定義する 2 つのモデルを作成しました 比率擾乱モデルと等比率モデルです 詳細は 付録 C を参照してください この両方のモデルは 本書の後半で参照するシミュレーションで使用されます これらのモデルは各カイ二乗検定で使用されますが 1 つの例外があります 比率擾乱モデルは 3 つ以上のサンプルでのカイ二乗不良 % 検定には適用されません 検定の妥当性のデータチェックは アシスタントのすべてのカイ二乗検定に適用されます 各データチェックを次に説明します カイ二乗適合度 目的 タイプ I 過誤率での小さい期待度数の大きさと度数の影響を調査することで 検定統計量に対するカイ二乗近似を評価します 方法 比率擾乱モデルまたは等比率モデル ( 付録 C を参照 ) による比率を使用して サイズ n のサンプルを多項分布から抽出します 各条件で 0.05 の目標有意水準を使用してカイ二乗適 カイ二乗検定 4

合度検定を 10,000 回実行しました 各検定では 実際のタイプ I 過誤率を 不合格になった検定数 反復数 (10000) 計算しました 許容できるタイプ I の過誤率の範囲を [0.03 0.07] と定義し その範囲内のタイプ I 過誤率を使用して最小サンプルサイズを記録しました 結果 シミュレーション結果では 小さい目標セル度数のパーセントが 50% 以下の場合 1.25 未満の目標セル度数で p 値が不正確になる可能性があることが示されました また 小さい目標セル度数のパーセントが 50% より大きい場合 2.5 未満の目標セル度数で p 値が不正確になる可能性があります 詳細は 付録 D を参照してください カイ二乗適合度検定の妥当性をチェックするときに アシスタントレポートカードに次のステータスインジケータが表示されます で ステータス 状態 小さい目標セル度数のパーセントが50% 以下の場合 最小目標セル度数が1.25 以上です または小さい目標セル度数のパーセントが50% 以上の場合 最小目標セル度数が2.5 以上です 十分な目標数を得ることができる大きさのサンプルがあります 検定のp 値は正確です 上記の状態ではない場合 関連性のカイ二乗検定 目的 タイプ I 過誤率での小さい期待度数の大きさと度数の影響を調査することで 検定統計量に対するカイ二乗近似を評価します 方法 比率擾乱モデルまたは等比率モデル ( 付録 C を参照 ) で定義された比率を使用して サイズ n i のサンプルが多項分布から抽出されます 簡単にするため n i = n i を選択しました 各条件で 0.05 の目標有意水準を使用して関連性のカイ二乗適合度検定を 10,000 回実行 しました 各検定では 実際のタイプ I 過誤率を 不合格になった検定数 反復数 (10000) で計算しました 許容でき るタイプ I の過誤率の範囲を [0.03 0.07] と定義し その範囲内のタイプ I の過誤率を使用して最小サンプルサイズを記録しました 結果 最小期待セル度数は X 値の数と小さい期待セル度数の割合によって変わることがわかりました 比率擾乱モデルでは 小さい期待セル度数のパーセントが 50% 以下で X 値の数が 2 または 3 の場合最小期待セル度数は 2 以下で X 値の数が 4 5 または 6 の場合 最小期待セル度数は 1 以下です さらに 小さい期待セル度数のパーセントが 50% より大き カイ二乗検定 5

く X 値の数が 2 または 3 の場合最小期待セル度数は 3 以下で X 値の数が 4 5 または 6 の場合 最小期待セル度数は 1.5 以下です 等比率モデルでは X 値の数が 2 または 3 の場合の最小期待セル度数は 2 以下で X 値の数が 4 5 または 6 の場合の最小期待セル度数は 1.5 以下です 詳細は 付録 E を参照してください 関連性のカイ二乗検定の妥当性をチェックするときに アシスタントレポートカードに次のステータスインジケータが表示されます ステータス X 変数値の数状態 2 または 3 小さい期待セル度数 (5 以下 ) のパーセントが 50% 以下の場合 最小期待セル度数が 2 以上です 小さい期待セル度数 (5 以下 ) のパーセントが 50% より大きい場合 最小期待セル度数が 1 以上です 4 5 または 6 小さい期待セル度数 (5 以下 ) のパーセントが 50% 以下の場合 最小期待セル度数が 1 以上です 小さい期待セル度数 (5 以下 ) のパーセントが 50% より大きい場合 最小期待セル度数が 2( 便宜上 1.5 を 2 に四捨五入 ) 以上です すべての場合 上記の状態ではない場合 3 つ以上のサンプルでのカイ二乗不良率検定 目的 タイプ I 過誤率での小さい期待度数の大きさと度数の影響を調査することで 検定統計量に対するカイ二乗近似を評価します 方法 モデル p = p i = p j i, j を定義しました ここで p = 0.001 0.005 0.01 0.025 および 0.25 です 上記の p i の値を使用して 二項分布からサイズ n i のサンプルが抽出されます 簡単にするため n i = n i を選択しました 各条件で 0.05 の目標有意水準を使用してカイ二乗不良率検定を 10,000 回実行しました 各検定では 実際のタイプ I 過誤率を 不合格になった検定数 反復数 (10000) で計算しました 許容できるタイプ I 過誤率の範囲を [0.03 0.07] と定義 し その範囲内のタイプ I の過誤率を使用して最小サンプルサイズを記録しました 結果 X 値の数が 3~6 の場合 区間 [0.03, 0.07] の検定で 1.5 以上の不良品と良品の最小期待数によりタイプ I 過誤率が得られます X 値の数が 7~12 の場合 区間 [0.03, 0.07] の検定で 1 以上の不良品と良品の最小期待数によりタイプ I 過誤率が得られます 詳細は 付録 F を参照してください カイ二乗検定 6

3 つ以上のサンプルでのカイ二乗不良 % 検定の妥当性をチェックするときに アシスタントレポートカードに次のステータスインジケータが表示されます ステータス X 値の数状態 3~6 不良品と良品の最小期待数が 1.5 以上です 7~12 不良品と良品の最小期待数が 1 以上です すべての場合 上記の状態ではない場合 区間の妥当性 3 つ以上のサンプルでのカイ二乗不良率とカイ二乗適合度検定の比較区間は 正規近似に基づきます さらに カイ二乗適合度検定の個別信頼区間は 正規近似に基づきます このセクションでは 正規近似の妥当性を評価します ほとんどの統計学教科書に記載されている一般的な規則によると 観測度数が 5 以上の場合に近似信頼区間が正確になります 区間の妥当性のデータチェックは 3 つ以上のサンプルでのカイ二乗不良 % とカイ二乗適合度検定に適用されます 3 つ以上のサンプルでのカイ二乗不良率 目的 近似信頼区間が正確になるように 各サンプルで観測された不良品と良品の最小数に対する一般的な規則を評価します 方法 比較管理チャートで使用される区間を最初に定義します 区間のエンドポイントは ほぼ の全体過誤率で 重ならないすべての区間が異なる母集団の不良 % を示すように定義されます 使用する計算式は 付録 G を参照してください 比較区間は 対応のある比較信頼区間に基づきます 詳細は 一元配置分散分析 (ANOVA) アシスタントホワイトペーパーの 比較区間 セクションを参照してください 各ペア (pi pj) に対して正規近似信頼区間を用い 次に Bonferroni の多重比較手順を使用して 実験全体の過誤率を制御します そのため 比較区間での正規近似の効果を理解するには 対応のある比較手順でいずれかの区間のみの妥当性を評価する必要があります 結果 正規近似の妥当性を評価するには 不良率間の差で近似が 1 つの間隔にどのように影響するかのみを調査する必要があります そのため 2 サンプル不良率用に設定された一般的な規則検定を使用できます 詳細は 2 サンプル不良率検定 アシスタントホワイトペーパー カイ二乗検定 7

の 2 サンプル不良率検定方法 を参照してください 2 サンプル不良率検定のシミュレーションの結果 不良率間の差での近似信頼区間の精度は サンプルが十分に大きい ( 各サンプルで観測される不良品数と良品数が 5 以上 ) 場合に一般に信頼できることが示されました 3 つ以上のサンプルでのカイ二乗不良 % 検定の区間をチェックするときに アシスタントレポートカードに次のステータスインジケータが表示されます ステータス 状態 すべてのサンプルに 5 つ以上の不良品および良品があります 比較区間は正確です 上記の状態ではない場合 カイ二乗適合度 目的 近似信頼区間が正確になるように 各サンプルで観測された不良品と良品の最小数に対する一般的な規則を評価します 方法 アシスタントのカイ二乗適合度検定には 比較区間と個別信頼区間が含まれています 比率に標準の正規近似区間を利用し Bonferroni 補正 (Goodman 1965) を使用して多重区間を補正します Bonferroni 同時区間は次のように計算されます p i 下限 = p i Z α/2k p i(1 p i ) N p i 上限 = p i + Z α/2k p i(1 p i ) N 区間のエンドポイントは ほぼ の全体過誤率で 目標比率値を含まないすべての区間が対応する目標比率とは異なる実際の比率を示すように定義されます 個別区間は Bonferroni 区間と同じ形式を利用しますが Z α/2 を使用して多重区間を補正することはありません 結果 上記の両方の手法は アシスタントの 2 サンプル不良 % 検定で定義された方法と似た方法に従います そのため この検定用に設定された正規近似の妥当性規則と同様の規則を使用できます 詳細は 2 サンプル不良 % 検定 アシスタントホワイトペーパーの 2 サンプル不良 % 検定方法 を参照してください そのホワイトペーパーでは サンプル数が 5 未満の場合 比較区間と個別信頼区間は正確でない可能性があるという結論に達しています カイ二乗検定 8

カイ二乗適合度検定の区間の妥当性をチェックするときに アシスタントレポートカードに次のステータスインジケータが表示されます ステータス 状態 すべてのサンプル数が 5 以上です この区間は正確です サンプル数が 5 未満です カイ二乗検定 9

参考文献 Agresti, A. (1996). An introduction to categorical data analysis. New York, NY: Wiley. Read, T. & Cressie, N. (1988). Goodness-of-fit statistics for discrete multivariate data. New York, NY: Springer-Verlag. Fienberg, S. (1980). The analysis of cross-classified categorical data. Cambridge, MA: MIT Press. Goodman, L. (1965). On simultaneous confidence intervals for multinomial proportions. Technometrics, 7, 247-254. カイ二乗検定 10

付録 A: カイ二乗検定統計量 アシスタントでは 次の形式のカイ二乗検定統計量を使用します ここで O ij = 次の表で定義されている観測度数 x 2 = (O ij E ij ) 2 ij E ij 場合 多項分布の適合度検定 O ij i 番目の結果の観測度数は O i1 として定義されます 3 つ以上の不良率の同等性検定 i 番目のサンプルの不良品および良品の観測度数はそれぞれ O i1 および O i2 として定義されます 2 つのカテゴリ変数間の関連性検定 X 変数の i 番目の値および Y 変数の j 番目の値の観測度数は O ij として定義されます E ij = 次の表で定義されている期待度数 場合 多項分布の適合度検定 E ij E i1 = np i i = 1,, k(k = 結果数 ) n = サンプルサイズ p i = 比率の経験値 p i = 1 i 3 つ以上の不良率の同等性検定 E i1 = n i p( 不良品の場合 ) E i2 = n i (1 p)( 良品の場合 ) i = 1,, k(k = サンプル数 ) n i = i 番目のサンプルサイズ p = 全体の不良率 2 つのカテゴリ変数間の関連性検定 E ij = (n i.n.j ) n.. i = 1,, m(m =X 値の数 ) j = 1,, k(k =Y 値の数 ) n i. =X 変数の i 番目の値の合計数 n.j =Y 変数の j 番目の値の合計数 n.. = 全体のサンプルサイズ カイ二乗検定 11

付録 B: 3 つ以上のサンプルでのカイ二乗不良率検定の検出力 非心カイ二乗分布を使用して p i = p j = p i, j の検定の検出力を計算します 非心パラメータは n i と p i i によって異なります ここで n i = i 番目のサンプルのサンプルサイズ 各 p i は 比率の差 = δ で計算された対立比率 ( この付録の次のセクション 対立比率の計算 を参照 ) を表します カイ二乗分布の非心パラメータを次のように計算します ここで χ 2 = (O ij E ij ) 2 ij E ij O i1= ni p i O i2=ni (1 p i ) また 検定の検出力を次のように計算します ここで Prob(X x 1 α χ 2 ) X = 非心パラメータ χ 2 を使用した非心カイ二乗分布の確率変数 x 1 α = 非心カイ二乗分布の 1 α で評価された逆累積分布関数 対立比率の計算 対立比率を次のように定義しました ここで p i = p c + p j = p c n j n i + n j δ n i n i + n j δ p m = p c m i, j 0 < δ < 1 p c = k 1 n N i p i T i=1 p i = i 番目のサンプルのサンプル不良品率 NT = 観測値の総数 カイ二乗検定 12

n i = i 番目のサンプルのサンプルサイズ 一部の差 (δ) では p i > 1 または p j < 0 であるため 次の規則を定めました p j < 0 の場合 p i = δ p j = 0 p m = δ 2 m i, j p i > 1 の場合 p i = 1 p j = 1 δ p m = 1 δ 2 m i, j n i の 2 つの最小値を使用すると検出力は最小になり n i の 2 つの最大値を使用すると検出力は最大になります カイ二乗検定 13

付録 C: 比率擾乱モデルと等比率モデル 比率擾乱モデル Read and Cressie(1988) の方法に従い 帰無仮説での比率のグループを次のように定義しました k - 1(k = 各サンプルの比率数 ) に近い δ を選択し 小さい p i のセットを次のように定義します p i = (1 δ k 1 ) (i = 1,, r) k 残りの p i を次のように定義します p i = ( 1 r i=1 p i) (k r) (i = r + 1,, k) シミュレーションで δ に使用した値を表 1 に示します 表 1 は結果が小さい p i になるシミュレーションで使用された δ k δ p i=1,,r 3 1.95 0.008 4 2.95 0.004 5 3.90 0.005 6 4.90 0.003 各 k で r = 1 k 1 と変動させ 小さい p i s. セットのサイズを変更しました たとえば k = 3 の場合 表 2 に示す 2 つのモデルが取得されました 表 2 比率擾乱モデルを使用した k = 3 の p i の値 r p1 p2 p3 1 0.008 0.496 0.496 2 0.008 0.008 0.984 等比率モデル 期待セル度数の 100% が小さいモデルを取得するため 次のように定義された等比率モデルを使用します カイ二乗検定 14

p i = 1 k i 非常に小さいサンプルサイズでこのモデルを使用することで すべての期待セル度数が小さいと見なされます 等比率モデルで 実際には発生しない可能性が高い小さい期待セル度数を実現するには 非常に小さいサンプルサイズが必要です カイ二乗検定 15

付録 D: カイ二乗適合度検定の妥当性 比率擾乱モデルでは 図 1 に示すように 小さい期待セル度数の % 値に対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な 最小期待セル度数をプロットしました 図 1 小さい期待セル度数のパーセントに対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な最小期待セル度数 図 1 では 小さい期待セル度数のパーセントが 50% 未満の場合 最小期待セル度数は 1.25 以下です すべての最小期待セル度数は 2 以下です これらのシミュレーション結果に基づき アシスタントレポートカードで使用する規則は控え目です 次に 等比率モデルを使用して同じシミュレーションを実行し 帰無分布を定義しました 等比率モデルを使用したシミュレーションの結果を表 4 に要約します 表 4 区間 [0.03, 0.07] のタイプ I 過誤率を得るための最小期待セル度数 k 最小期待セル度数 3 2.5 4 1.25 5 1 カイ二乗検定 16

k 最小期待セル度数 6 1.4 上記のように 等比率モデルは期待セル度数の 100% が小さくなります 表 4 にはすべての最小期待セル度数が 2.5 以下であることが示されており アシスタントレポートカードで使用するルールに適合します カイ二乗検定 17

付録 E: 関連性のカイ二乗検定の妥当性 比率擾乱モデルでは 図 2 に示すように X 値の数ごとに小さい期待セル度数の % に対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な 最小期待セル度数をプロットしました 図 2 小さい期待セル度数のパーセントに対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な最小期待セル度数 最小期待セル度数は X 値の数と小さい期待セル度数のパーセントによって変わることが図 2 に示されています 図 2 には 小さい期待セル度数のパーセントが 50% より小さい範囲では X 値の数が 2 または 3 の場合は最小期待セル度数は 2 以下 X 値の数が 4 5 または 6 の場合は 1 以下であることが示されています さらに 小さい期待セル度数のパーセントが 50% より大きい範囲では X 値の数が 2 または 3 の場合は最小期待セル度数は 3 以下 X 値の数が 4 5 または 6 の場合は最小期待セル度数は 1.5 以下です 等比率モデルでは 図 3 に示すように X 値の数 (m) と Y 値の数 (k) に対する最小期待セル度数をプロットしました カイ二乗検定 18

図 3 X 値の数 (m) と Y 値の数 (k) に対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な最小期待セル度数 図 3 では X 値の数が 2 または 3 の場合の最小期待セル度数は 2 以下で X 値の数が 4 5 または 6 の場合の最小期待セル度数は 1.5 以下であることが示されています これらのシミュレーション結果に基づき アシスタントレポートカードで使用する規則は控え目です カイ二乗検定 19

付録 F: 3 つ以上のサンプルでのカイ二乗不良率検定の妥当性 各 p と各 m = 3 4 5 12 で 最小期待セル度数をプロットしました 結果は図 4 と図 5 に示されています 図 4 X 値の数 (m = 3~6) に対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な最小期待セル度数 カイ二乗検定 20

図 5 X 値の数 (m = 7~12) に対する区間 [0.03, 0.07] のタイプ I 過誤率を得るために必要な最小期待セル度数 X 値の数が 3 4 5 または 6 の場合 区間 [0.03, 0.07] の検定で 1.5 以上の期待セル度数によりタイプ I 過誤率が得られます X 値の数が 7 8 9 12 の場合 区間 [0.03, 0.07] の検定で 1 以上の期待セル度数によりタイプ I 過誤率が得られます カイ二乗検定 21

付録 G: 3 つ以上のサンプルでのカイ二乗不良 % の比較区間 p i の下限と上限は次のように定義されます ここで ここで p i 下限 = p i Z α/c X i p i 上限 = p i + Z α/c X i c = 比較数 = k (k - 1) /2 ここで k はサンプル数です Z α/c = 平均が 0 で標準偏差が 1 の正規分布の (1 α 2c ) 百分位数 X i = ((k 1) j i b ij 1 j<l k b jl ) / ((k 1)(k 2)) b ij = p i(1 p i ) n i + p j(1 p j ) n j 2015, 2017 Minitab Inc. All rights reserved. Minitab, Quality. Analysis. Results. and the Minitab logo are all registered trademarks of Minitab, Inc., in the United States and other countries. See minitab.com/legal/trademarks for more information. カイ二乗検定 22