第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Similar documents
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

講義「○○○○」

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft PowerPoint - Statistics[B]

情報工学概論

スライド 1

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

不偏推定量

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

EBNと疫学

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

基礎統計

モジュール1のまとめ

Microsoft PowerPoint ppt

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

ビジネス統計 統計基礎とエクセル分析 正誤表

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - statistics pptx

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - Stattext07.doc

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

untitled

統計的データ解析

_KyoukaNaiyou_No.4

Microsoft PowerPoint - sc7.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

スライド 1

Microsoft PowerPoint - statistics pptx

スライド 1

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

統計学の基礎から学ぶ実験計画法ー1

データ解析

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

第4回

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

0415

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

日心TWS

Microsoft Word - Stattext12.doc

統計的手法を用いた抜き取り検査 小長井和裕 KAZUHIRO Konagai 1. はじめに 1ロット10 万本で生産したねじからサンプル 10 本を抜き取って検査を行った結果 サンプルは10 本とも全て合格だった 残りの 99,990 本のねじは全て合格か? 私はパソコンでの品質管理システム QC

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Microsoft Word - lec_student-chp3_1-representative

様々なミクロ計量モデル†

Microsoft Word - Stattext13.doc

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

経営統計学

PowerPoint プレゼンテーション

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

カイ二乗フィット検定、パラメータの誤差

青焼 1章[15-52].indd

Microsoft PowerPoint - statistics pptx

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Medical3

Microsoft Word - appendix_b

数値計算法

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Medical3

Probit , Mixed logit


切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

システムデザイン System Design

第7章

(Microsoft Word - 10ta320a_\220U\223\256\212w\223\301\230__6\217\315\221O\224\274\203\214\203W\203\201.docx)

Microsoft Word - Stattext11.doc

MT2-Slides-13.pptx

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

数値計算法

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Microsoft Word - 保健医療統計学112817完成版.docx

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft Word - Matlab_R_MLE.docx

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

Excelにおける回帰分析(最小二乗法)の手順と出力

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

PowerPoint プレゼンテーション

Microsoft Word - mstattext02.docx

3章 度数分布とヒストグラム

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

経済統計分析1 イントロダクション

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

3章 度数分布とヒストグラム

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

2 ( 生物統計学 ) データを大きさの順に並べてデータが奇数個なら中央に位置するデータの値, データが偶数個なら中央に位置する2つのデータの平均である 例 1 11,14,15,17,20 例 2 2,4,8,10,12,16 3 集めたデータの中で, 最も多く現れた値あるいは階級のこと. 名目デ

改訂履歴

代表値

横浜市環境科学研究所

Microsoft PowerPoint - データ解析基礎2.ppt

DVIOUT-SS_Ma

Microsoft PowerPoint - e-stat(OLS).pptx

Transcription:

第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差 ( ばらつき ) を求める場合 STDEVP 関数を使用 母集団 ( まだ説明していない たくさんのデータの集まり ) から データを抜取り 母集団の標準偏差 ( ばらつき ) を推定する場合 STDEV 関数を使用する (1) データの性質 ヒストグラムを思い出そう a) データは 平均値の周りにばらつく b) ばらつきのないデータは存在しない 品質管理でよく使われる c) このことを データは分布する という d) データは どのようにばらつくかは分布の状態に現れる () この分布のあり方 ( 分布の状態 ) には いろいろある 統計学それぞれ分布の形に特徴がある 正規分布 NORMDIST( 値, 平均値, 標準偏差, 関数形式 ) 二項分布 BINOMDIST( 値, サンプル数, 不良率, 関数形式 ) ポアソン分布 POISSON( 値, イベント数, 平均, 関数形式 ) t 分布 T 分布表検定をするときに使用する F 分布 F 分布表 x ( カイ二乗 ) 分布 CHISQ.DST( 値, 自由度, 関数形式 ) 一様分布など (3) 先週作成したヒストグラムは縦棒が6 本であった これはデータの数が50 個くらいだったことにある 1

頻度93 96 99 10 105 108 次の級 18 16 14 1 10 8 6 4 0 ヒストグラム データ区間 (3) データ数が沢山あると データ区間は細かくとることができるので 縦棒の本数 は多くなり 1 本の曲線で表すことができる (4) ヒストグラムがデータの分布を表しているように 1 本の曲線もデータの分布を 表している (5) 先週のテキストP37に示す正規分布がその代表的な分布曲線である ( 正確には 確率分布 という ) 0.14 0.1 0.1 0.08 0.06 0.04 0.0 μ 0 90 9 94 96 98 100 10 104 106 108 110

正規分布 (P3) の性質 a) データは平均を中心にばらつく これを データは分布する という ばらつきは分布の形で表される 分布の形として 統計学では 正規分布 二項分布 ポ アソン分布 t 分布 F 分布 χ ( カイ二乗 ) 分布 一様分布をあげている b) 正規分布のことを X:N(μ,σ ) と書く ここで μ: 平均,σ: 標準偏差のこと 1 x µ 1 ( ) σ c)f(x)= e 変数としてμとσがあり データが変わると形が変わる πσ 正規分布は平均がμで標準偏差がσで左右対称の釣鐘型をした分布形態であるが 正 規分布の公式は μ と σ の値によって形が変わるので 扱いにくい d) そこで 標準化 が行われる x µ U= σ とおくと 1 1 u f(u)= e π となり μ=0 σ=1となる データがどんなに変わろうとも不変 (1) 正規分布の特徴は 平均 (μ) が中央にあって左右対称で すらっとした美しい形 ( 釣鐘型という ) をしているデータのばらつきは標準偏差 (σ) で示される また 平均値と中央値と最頻値が同じという特徴もある () 平均値 (μ) を境にして右側 左側それぞれ50% であるこれは前回の宿題で正規確率紙の50% のところの値を読み取ったことを意味している 正規確率紙の50% のところの値を読みとると平均値 (μ) が求められることを 正規確率紙を使って勉強した (3) 標準偏差 (σ) を求めるために 正規確率紙の15.9% の値と50% の値の差で求めた (4) 学生 100 人について身長を測定したところ 平均値 (μ)=168.1 標準偏差 (σ)=6.95 の正規分布となることがわかったとします このことは N(168.1,6.95 ) と記述する NはNormal Distributionの略このことをグラフに書くと以下のようになる 3

f(x) 0.07 0.06 0.05 68.% 0.04 0.03 0.0 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 15.9% A B 15.9% μ=168.1 σ=6.95 15.9% は 点 Aの外側の割合である 点 Aと平均 μの間は標準偏差 σを示している つまり A=μ σ =168.1-6.95 =161.1 B=μ+σ =168.1+6.95 =175.0 68% の人は 161cm~175cmの間にあることを意味している 4

1.3.4 二項分布 (P.40) ベルヌーイトライアル( ベルヌーイ試行 ) コインの裏と表, 良品と不良品, 製品の合格と不合格, n 回試行して x 回どちらか一方の事象が起きた確率は二項分布となる 二項確率紙を後程取り上げるが 二項分布を前提としている EXCELの関数で BINOMDIST( 不良件数, サンプル数, 不良率, 関数形式 ) 例題 7, 例題 8(P41) 1.3.5 ポアソン分布 (P.4) ポアソン分布は二項確率紙の仲間である きわめてまれにしか発生しない場合をポアソン分布という EXCELの関数では POISSON( イベント数, 平均, 関数形式 ) 例題 9, 例題 10(P43) 1.3.6 母集団, 標本および母平均の推定 (P.44) a) 母集団 ( 有限母集団と無限母集団 ) 実務の世界では 製品のロットのことを母集団という このロットの大きさは 1000 個くらいである b) 標本 ( サンプル ) コット全部を検査できないから この中から 0 個とか 30 個抜き取って 知らべたり 検査する ( 抜取検査という ) 検査したときには良品と不良品しかないから二項分布が当てはまる この抜き取ったものを 標本 とか サンプル という 母集団 サンプル ( 標本 ) 不良率 c) 母平均 ( 区間平均 ) 母集団全体の状況 ( 特性値 ) を 母平均 という 母平均は標本の平均 標本のばらつき ( 標本の標準偏差 ) を基に計算できる (P45 表 1.1) d) 母不良率 5

標本を検査して 良品と不良品に分ける( 抜取検査 ) ことを実務で実施する 二項確率紙を使うと 母集団に含まれる不良の割合が容易に求められる 母集団に含まれている不良の割合のことを 母不良率 という 母不良率 の大きさによって 母集団( ロット ) の合格または不合格を判定する 1.3.7 統計量の性質 (P.46) a) 統計量 ( データ ) は 母集団の平均を中心にばらつくこのことを 分布する という b) したがって 母集団から抜き取った標本 ( サンプル ) の値 ( 観測値 ) は 抜取る度に変化するすなわち 変数 である c) この変数を 確率変数 という b) 母集団から抜き取った標本 ( サンプル ) の平均 = 標本平均という 標本のばらつきを 標本分散とか標本標準偏差という 標本平均 標本分散 標本標準偏差のことを標本統計量 ( 単に 統計量 ) という 1.3.8 統計的有意性 (P.47) a) 有意 非常にわかりにくい言葉である統計学には よく起きる事象 と めったに起きない事象 がある例 : 学生 100 人の身長を測定したとき 161cm~175cmくらいの人はたくさんいるが 147cm 以下の人 189cm 以上の人はめったにいない どれくらいいるかとういうと それぞれ.5%(100 人の中で~3 人 ) めったに起きない事象 のことを 有意 という めったに起きないほど大きい ことを 有意に大きい という めったに起きないほど小さい ことを 有意に小さい という b) 正規分布を例にとると 変数値 ( 観測値 ) が極端に大きい確率は非常に小さい 変数値 ( 観測値 ) が極端に小さい確率は非常に小さい 変数 X が正規分布をして 平均が μ 標準偏差が σ であるとき X:N(μ,σ ) と書く ここで N:Normal distribution( 正規分布 ) のこと 平均身長が 168.1cm 標準偏差が 10cm の場合には X:N(168.1,10 ) と書く 6

f(x) 0.07 0.06 0.05 σ:6.95cm 0.04 0.03 147.1cm 以下の身長は 有意に小さい 0.0 その割合は.5% 信頼係数 :95% 188.95cm 以上の身長は 有意に大きい その割合は.5% 0.01 0 140 145 150 155 160 165 170 175 180 185 190 195 00 147.5 平均 =168.1 188.95 信頼区間 身長が 170cm 160cmの人はたくさんいる このことを 普通によく起きる確率 という または 有意でないことが起きる確率 ともいう これを 信頼係数 という 147cm~189cmの間のことを 信頼区間 という めったに起きないことが起きる確率 のことを 有意水準 という めったに起きないこと とは 身長が188.95cm 以上の人 または147.5cm 以下の人のことをいう 通常 有意水準は5% を使用する つまり信頼係数は95% となる また 有意水準には 片側と両側がある 通常は有意に小さい場合 有意に大きい場合の両方があるので 両側有意水準 を使う 7

1.3.9 数値の丸め (P.47) 省略 小数点以下だらだら記述しないこと テキストP48にいろいろ書いてあるが 通常は 小数点以下 1 桁くらいでよい ( 小数点以下第 位を四捨五入する ) これを 丸め という 8