第 3 回講義の項目と概要統計的手法入門 : 品質のばらつきを解析する平均と標準偏差 (P30) a) データは平均を見ただけではわからない平均が同じだからといって同一視してはいけない b) データのばらつきを示す標準偏差にも注目しよう c) 平均

第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない平均が同じだからといって同一視してはいけない b) データのばらつきを示す標準偏差にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差 ( ばらつき ) を求める場合 STDEVP 関数を使用母集団 ( まだ説明していないたくさんのデータの集まり ) からデータを抜取り母集団の標準偏差 ( ばらつき ) を推定する場合 STDEV 関数を使用する (1) データの性質ヒストグラムを思い出そう a) データは平均値の周りにばらつく b) ばらつきのないデータは存在しない品質管理でよく使われる c) このことをデータは分布するという d) データはどのようにばらつくかは分布の状態に現れる () この分布のあり方 ( 分布の状態 ) にはいろいろある統計学それぞれ分布の形に特徴がある正規分布 NORMDIST( 値, 平均値, 標準偏差, 関数形式 ) 二項分布 BINOMDIST( 値, サンプル数, 不良率, 関数形式 ) ポアソン分布 POISSON( 値, イベント数, 平均, 関数形式 ) t 分布 T 分布表検定をするときに使用する F 分布 F 分布表 x ( カイ二乗 ) 分布 CHISQ.DST( 値, 自由度, 関数形式 ) 一様分布など (3) 先週作成したヒストグラムは縦棒が6 本であったこれはデータの数が50 個くらいだったことにある 1

頻度93 96 99 10 105 108 次の級 18 16 14 1 10 8 6 4 0 ヒストグラムデータ区間 (3) データ数が沢山あるとデータ区間は細かくとることができるので縦棒の本数は多くなり 1 本の曲線で表すことができる (4) ヒストグラムがデータの分布を表しているように 1 本の曲線もデータの分布を表している (5) 先週のテキストP37に示す正規分布がその代表的な分布曲線である ( 正確には確率分布という ) 0.14 0.1 0.1 0.08 0.06 0.04 0.0 μ 0 90 9 94 96 98 100 10 104 106 108 110

正規分布 (P3) の性質 a) データは平均を中心にばらつくこれをデータは分布するというばらつきは分布の形で表される分布の形として統計学では正規分布二項分布ポアソン分布 t 分布 F 分布 χ ( カイ二乗 ) 分布一様分布をあげている b) 正規分布のことを X:N(μ,σ ) と書くここで μ: 平均,σ: 標準偏差のこと 1 x µ 1 ( ) σ c)f(x)= e 変数としてμとσがありデータが変わると形が変わる πσ 正規分布は平均がμで標準偏差がσで左右対称の釣鐘型をした分布形態であるが正規分布の公式は μ と σ の値によって形が変わるので扱いにくい d) そこで標準化が行われる x µ U= σ とおくと 1 1 u f(u)= e π となり μ=0 σ=1となるデータがどんなに変わろうとも不変 (1) 正規分布の特徴は平均 (μ) が中央にあって左右対称ですらっとした美しい形 ( 釣鐘型という ) をしているデータのばらつきは標準偏差 (σ) で示されるまた平均値と中央値と最頻値が同じという特徴もある () 平均値 (μ) を境にして右側左側それぞれ50% であるこれは前回の宿題で正規確率紙の50% のところの値を読み取ったことを意味している正規確率紙の50% のところの値を読みとると平均値 (μ) が求められることを正規確率紙を使って勉強した (3) 標準偏差 (σ) を求めるために正規確率紙の15.9% の値と50% の値の差で求めた (4) 学生 100 人について身長を測定したところ平均値 (μ)=168.1 標準偏差 (σ)=6.95 の正規分布となることがわかったとしますこのことは N(168.1,6.95 ) と記述する NはNormal Distributionの略このことをグラフに書くと以下のようになる 3

f(x) 0.07 0.06 0.05 68.% 0.04 0.03 0.0 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 15.9% A B 15.9% μ=168.1 σ=6.95 15.9% は点 Aの外側の割合である点 Aと平均 μの間は標準偏差 σを示しているつまり A=μ σ =168.1-6.95 =161.1 B=μ+σ =168.1+6.95 =175.0 68% の人は 161cm~175cmの間にあることを意味している 4

1.3.4 二項分布 (P.40) ベルヌーイトライアル( ベルヌーイ試行 ) コインの裏と表, 良品と不良品, 製品の合格と不合格, n 回試行して x 回どちらか一方の事象が起きた確率は二項分布となる二項確率紙を後程取り上げるが二項分布を前提としている EXCELの関数で BINOMDIST( 不良件数, サンプル数, 不良率, 関数形式 ) 例題 7, 例題 8(P41) 1.3.5 ポアソン分布 (P.4) ポアソン分布は二項確率紙の仲間であるきわめてまれにしか発生しない場合をポアソン分布という EXCELの関数では POISSON( イベント数, 平均, 関数形式 ) 例題 9, 例題 10(P43) 1.3.6 母集団, 標本および母平均の推定 (P.44) a) 母集団 ( 有限母集団と無限母集団 ) 実務の世界では製品のロットのことを母集団というこのロットの大きさは 1000 個くらいである b) 標本 ( サンプル ) コット全部を検査できないからこの中から 0 個とか 30 個抜き取って知らべたり検査する ( 抜取検査という ) 検査したときには良品と不良品しかないから二項分布が当てはまるこの抜き取ったものを標本とかサンプルという母集団サンプル ( 標本 ) 不良率 c) 母平均 ( 区間平均 ) 母集団全体の状況 ( 特性値 ) を母平均という母平均は標本の平均標本のばらつき ( 標本の標準偏差 ) を基に計算できる (P45 表 1.1) d) 母不良率 5

標本を検査して良品と不良品に分ける( 抜取検査 ) ことを実務で実施する二項確率紙を使うと母集団に含まれる不良の割合が容易に求められる母集団に含まれている不良の割合のことを母不良率という母不良率の大きさによって母集団( ロット ) の合格または不合格を判定する 1.3.7 統計量の性質 (P.46) a) 統計量 ( データ ) は母集団の平均を中心にばらつくこのことを分布するという b) したがって母集団から抜き取った標本 ( サンプル ) の値 ( 観測値 ) は抜取る度に変化するすなわち変数である c) この変数を確率変数という b) 母集団から抜き取った標本 ( サンプル ) の平均 = 標本平均という標本のばらつきを標本分散とか標本標準偏差という標本平均標本分散標本標準偏差のことを標本統計量 ( 単に統計量 ) という 1.3.8 統計的有意性 (P.47) a) 有意非常にわかりにくい言葉である統計学にはよく起きる事象とめったに起きない事象がある例 : 学生 100 人の身長を測定したとき 161cm~175cmくらいの人はたくさんいるが 147cm 以下の人 189cm 以上の人はめったにいないどれくらいいるかとういうとそれぞれ.5%(100 人の中で~3 人 ) めったに起きない事象のことを有意というめったに起きないほど大きいことを有意に大きいというめったに起きないほど小さいことを有意に小さいという b) 正規分布を例にとると変数値 ( 観測値 ) が極端に大きい確率は非常に小さい変数値 ( 観測値 ) が極端に小さい確率は非常に小さい変数 X が正規分布をして平均が μ 標準偏差が σ であるとき X:N(μ,σ ) と書くここで N:Normal distribution( 正規分布 ) のこと平均身長が 168.1cm 標準偏差が 10cm の場合には X:N(168.1,10 ) と書く 6

f(x) 0.07 0.06 0.05 σ:6.95cm 0.04 0.03 147.1cm 以下の身長は有意に小さい 0.0 その割合は.5% 信頼係数 :95% 188.95cm 以上の身長は有意に大きいその割合は.5% 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 147.5 平均 =168.1 188.95 信頼区間身長が 170cm 160cmの人はたくさんいるこのことを普通によく起きる確率というまたは有意でないことが起きる確率ともいうこれを信頼係数という 147cm~189cmの間のことを信頼区間というめったに起きないことが起きる確率のことを有意水準というめったに起きないこととは身長が188.95cm 以上の人または147.5cm 以下の人のことをいう通常有意水準は5% を使用するつまり信頼係数は95% となるまた有意水準には片側と両側がある通常は有意に小さい場合有意に大きい場合の両方があるので両側有意水準を使う 7

1.3.9 数値の丸め (P.47) 省略小数点以下だらだら記述しないことテキストP48にいろいろ書いてあるが通常は小数点以下 1 桁くらいでよい ( 小数点以下第位を四捨五入する ) これを丸めという 8