第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差 ( ばらつき ) を求める場合 STDEVP 関数を使用 母集団 ( まだ説明していない たくさんのデータの集まり ) から データを抜取り 母集団の標準偏差 ( ばらつき ) を推定する場合 STDEV 関数を使用する (1) データの性質 ヒストグラムを思い出そう a) データは 平均値の周りにばらつく b) ばらつきのないデータは存在しない 品質管理でよく使われる c) このことを データは分布する という d) データは どのようにばらつくかは分布の状態に現れる () この分布のあり方 ( 分布の状態 ) には いろいろある 統計学それぞれ分布の形に特徴がある 正規分布 NORMDIST( 値, 平均値, 標準偏差, 関数形式 ) 二項分布 BINOMDIST( 値, サンプル数, 不良率, 関数形式 ) ポアソン分布 POISSON( 値, イベント数, 平均, 関数形式 ) t 分布 T 分布表検定をするときに使用する F 分布 F 分布表 x ( カイ二乗 ) 分布 CHISQ.DST( 値, 自由度, 関数形式 ) 一様分布など (3) 先週作成したヒストグラムは縦棒が6 本であった これはデータの数が50 個くらいだったことにある 1
頻度93 96 99 10 105 108 次の級 18 16 14 1 10 8 6 4 0 ヒストグラム データ区間 (3) データ数が沢山あると データ区間は細かくとることができるので 縦棒の本数 は多くなり 1 本の曲線で表すことができる (4) ヒストグラムがデータの分布を表しているように 1 本の曲線もデータの分布を 表している (5) 先週のテキストP37に示す正規分布がその代表的な分布曲線である ( 正確には 確率分布 という ) 0.14 0.1 0.1 0.08 0.06 0.04 0.0 μ 0 90 9 94 96 98 100 10 104 106 108 110
正規分布 (P3) の性質 a) データは平均を中心にばらつく これを データは分布する という ばらつきは分布の形で表される 分布の形として 統計学では 正規分布 二項分布 ポ アソン分布 t 分布 F 分布 χ ( カイ二乗 ) 分布 一様分布をあげている b) 正規分布のことを X:N(μ,σ ) と書く ここで μ: 平均,σ: 標準偏差のこと 1 x µ 1 ( ) σ c)f(x)= e 変数としてμとσがあり データが変わると形が変わる πσ 正規分布は平均がμで標準偏差がσで左右対称の釣鐘型をした分布形態であるが 正 規分布の公式は μ と σ の値によって形が変わるので 扱いにくい d) そこで 標準化 が行われる x µ U= σ とおくと 1 1 u f(u)= e π となり μ=0 σ=1となる データがどんなに変わろうとも不変 (1) 正規分布の特徴は 平均 (μ) が中央にあって左右対称で すらっとした美しい形 ( 釣鐘型という ) をしているデータのばらつきは標準偏差 (σ) で示される また 平均値と中央値と最頻値が同じという特徴もある () 平均値 (μ) を境にして右側 左側それぞれ50% であるこれは前回の宿題で正規確率紙の50% のところの値を読み取ったことを意味している 正規確率紙の50% のところの値を読みとると平均値 (μ) が求められることを 正規確率紙を使って勉強した (3) 標準偏差 (σ) を求めるために 正規確率紙の15.9% の値と50% の値の差で求めた (4) 学生 100 人について身長を測定したところ 平均値 (μ)=168.1 標準偏差 (σ)=6.95 の正規分布となることがわかったとします このことは N(168.1,6.95 ) と記述する NはNormal Distributionの略このことをグラフに書くと以下のようになる 3
f(x) 0.07 0.06 0.05 68.% 0.04 0.03 0.0 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 15.9% A B 15.9% μ=168.1 σ=6.95 15.9% は 点 Aの外側の割合である 点 Aと平均 μの間は標準偏差 σを示している つまり A=μ σ =168.1-6.95 =161.1 B=μ+σ =168.1+6.95 =175.0 68% の人は 161cm~175cmの間にあることを意味している 4
1.3.4 二項分布 (P.40) ベルヌーイトライアル( ベルヌーイ試行 ) コインの裏と表, 良品と不良品, 製品の合格と不合格, n 回試行して x 回どちらか一方の事象が起きた確率は二項分布となる 二項確率紙を後程取り上げるが 二項分布を前提としている EXCELの関数で BINOMDIST( 不良件数, サンプル数, 不良率, 関数形式 ) 例題 7, 例題 8(P41) 1.3.5 ポアソン分布 (P.4) ポアソン分布は二項確率紙の仲間である きわめてまれにしか発生しない場合をポアソン分布という EXCELの関数では POISSON( イベント数, 平均, 関数形式 ) 例題 9, 例題 10(P43) 1.3.6 母集団, 標本および母平均の推定 (P.44) a) 母集団 ( 有限母集団と無限母集団 ) 実務の世界では 製品のロットのことを母集団という このロットの大きさは 1000 個くらいである b) 標本 ( サンプル ) コット全部を検査できないから この中から 0 個とか 30 個抜き取って 知らべたり 検査する ( 抜取検査という ) 検査したときには良品と不良品しかないから二項分布が当てはまる この抜き取ったものを 標本 とか サンプル という 母集団 サンプル ( 標本 ) 不良率 c) 母平均 ( 区間平均 ) 母集団全体の状況 ( 特性値 ) を 母平均 という 母平均は標本の平均 標本のばらつき ( 標本の標準偏差 ) を基に計算できる (P45 表 1.1) d) 母不良率 5
標本を検査して 良品と不良品に分ける( 抜取検査 ) ことを実務で実施する 二項確率紙を使うと 母集団に含まれる不良の割合が容易に求められる 母集団に含まれている不良の割合のことを 母不良率 という 母不良率 の大きさによって 母集団( ロット ) の合格または不合格を判定する 1.3.7 統計量の性質 (P.46) a) 統計量 ( データ ) は 母集団の平均を中心にばらつくこのことを 分布する という b) したがって 母集団から抜き取った標本 ( サンプル ) の値 ( 観測値 ) は 抜取る度に変化するすなわち 変数 である c) この変数を 確率変数 という b) 母集団から抜き取った標本 ( サンプル ) の平均 = 標本平均という 標本のばらつきを 標本分散とか標本標準偏差という 標本平均 標本分散 標本標準偏差のことを標本統計量 ( 単に 統計量 ) という 1.3.8 統計的有意性 (P.47) a) 有意 非常にわかりにくい言葉である統計学には よく起きる事象 と めったに起きない事象 がある例 : 学生 100 人の身長を測定したとき 161cm~175cmくらいの人はたくさんいるが 147cm 以下の人 189cm 以上の人はめったにいない どれくらいいるかとういうと それぞれ.5%(100 人の中で~3 人 ) めったに起きない事象 のことを 有意 という めったに起きないほど大きい ことを 有意に大きい という めったに起きないほど小さい ことを 有意に小さい という b) 正規分布を例にとると 変数値 ( 観測値 ) が極端に大きい確率は非常に小さい 変数値 ( 観測値 ) が極端に小さい確率は非常に小さい 変数 X が正規分布をして 平均が μ 標準偏差が σ であるとき X:N(μ,σ ) と書く ここで N:Normal distribution( 正規分布 ) のこと 平均身長が 168.1cm 標準偏差が 10cm の場合には X:N(168.1,10 ) と書く 6
f(x) 0.07 0.06 0.05 σ:6.95cm 0.04 0.03 147.1cm 以下の身長は 有意に小さい 0.0 その割合は.5% 信頼係数 :95% 188.95cm 以上の身長は 有意に大きい その割合は.5% 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 147.5 平均 =168.1 188.95 信頼区間 身長が 170cm 160cmの人はたくさんいる このことを 普通によく起きる確率 という または 有意でないことが起きる確率 ともいう これを 信頼係数 という 147cm~189cmの間のことを 信頼区間 という めったに起きないことが起きる確率 のことを 有意水準 という めったに起きないこと とは 身長が188.95cm 以上の人 または147.5cm 以下の人のことをいう 通常 有意水準は5% を使用する つまり信頼係数は95% となる また 有意水準には 片側と両側がある 通常は有意に小さい場合 有意に大きい場合の両方があるので 両側有意水準 を使う 7
1.3.9 数値の丸め (P.47) 省略 小数点以下だらだら記述しないこと テキストP48にいろいろ書いてあるが 通常は 小数点以下 1 桁くらいでよい ( 小数点以下第 位を四捨五入する ) これを 丸め という 8