<4D F736F F F696E74202D A6D82A982B3955D89BF82CC979D89F082C9954B977682C8939D8C768A7782CC8AEE91622E B8CDD8AB B83685D>

Similar documents
untitled

EBNと疫学

untitled

<4D F736F F F696E74202D2091AA92E882C982A882AF82E995738A6D82A982B382CC88D396A182C68D6C82A695FB2E B8CDD8AB B83685D>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

講義「○○○○」

スライド 1

モジュール1のまとめ

Microsoft PowerPoint saitama2.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード]

数値計算法

Microsoft PowerPoint - stat-2014-[9] pptx

不偏推定量

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

不確かさ評価について ( 独 ) 産業技術総合研究所計測標準研究部門 物性統計科応用統計研究室 田中秀幸

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

<4D F736F F F696E74202D208F ED28CFC82AF95738A6D82A982B3835A837E B2E B8CDD8AB B83685D>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

情報工学概論

スライド 1

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

統計学の基礎から学ぶ実験計画法ー1

スライド 1

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

統計的データ解析

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft PowerPoint - e-stat(OLS).pptx

基礎統計

Microsoft PowerPoint - Statistics[B]

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

Microsoft PowerPoint - 三次元座標測定 ppt

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft Word - IntroductionToUncertainty_ doc

不確かさ 資料 1/8

質量計の管理におけるはかり・分銅の不確かさの求め方について

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

経営統計学

データ解析

測量試補 重要事項

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

経済統計分析1 イントロダクション

Probit , Mixed logit

JCG201S101-03(HP)

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

測量士補 重要事項「標準偏差」

ビジネス統計 統計基礎とエクセル分析 正誤表

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

Microsoft Word - Stattext12.doc

1.民営化

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - sc7.ppt [互換モード]

第7章

Microsoft PowerPoint - Inoue-statistics [互換モード]

Microsoft PowerPoint - statistics pptx

Microsoft Word - Stattext07.doc

13章 回帰分析

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

カイ二乗フィット検定、パラメータの誤差

Microsoft PowerPoint DegreesOfFreedom.ppt [互換モード]

Microsoft Word - lec_student-chp3_1-representative

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

_KyoukaNaiyou_No.4

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft Word - å“Ÿåłžå¸°173.docx

0415

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

Microsoft PowerPoint ppt

数値計算で学ぶ物理学 4 放物運動と惑星運動 地上のように下向きに重力がはたらいているような場においては 物体を投げると放物運動をする 一方 中心星のまわりの重力場中では 惑星は 円 だ円 放物線または双曲線を描きながら運動する ここでは 放物運動と惑星運動を 運動方程式を導出したうえで 数値シミュ

Microsoft PowerPoint - 熱力学Ⅱ2FreeEnergy2012HP.ppt [互換モード]

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

Microsoft PowerPoint - 資料04 重回帰分析.ppt

青焼 1章[15-52].indd

Hara-statistics

横浜市環境科学研究所

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext05.docx

PowerPoint プレゼンテーション

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

画像類似度測定の初歩的な手法の検証

基礎化学 Ⅰ 第 5 講原子量とモル数 第 5 講原子量とモル数 1 原子量 (1) 相対質量 まず, 大きさの復習から 原子 ピンポン玉 原子の直径は, 約 1 億分の 1cm ( 第 1 講 ) 原子とピンポン玉の関係は, ピンポン玉と地球の関係と同じくらいの大きさです 地球 では, 原子 1

PowerPoint プレゼンテーション

2 ( 生物統計学 ) データを大きさの順に並べてデータが奇数個なら中央に位置するデータの値, データが偶数個なら中央に位置する2つのデータの平均である 例 1 11,14,15,17,20 例 2 2,4,8,10,12,16 3 集めたデータの中で, 最も多く現れた値あるいは階級のこと. 名目デ

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

() 実験 Ⅱ. 太陽の寿命を計算する 秒あたりに太陽が放出している全エネルギー量を計測データをもとに求める 太陽の放出エネルギーの起源は, 水素の原子核 4 個が核融合しヘリウムになるときのエネルギーと仮定し, 質量とエネルギーの等価性から 回の核融合で放出される全放射エネルギーを求める 3.から

様々なミクロ計量モデル†

Transcription:

不確かさ評価の理解に必要な統計学の基礎 産業技術総合研究所計測標準研究部門田中秀幸 1 1: 測定, 不確かさ評価を行う際の心構えについて 計量管理の重要性についてを中心に

1-1: 測定量の定義について 3 何を測定するのか? 金属棒の長さをレーザー測長器によって測りたい このときの測定の定義は? 定義 : レーザー測長器によって金属棒の長さを測り, その測定結果を測定対象である金属棒の長さとする これでよいのか? 4

何を測定するのか? 問題点 測定は何回行うのか? 複数回測定を行った結果, その測定値の平均値を測定結果とするのか? それとも異なる代表値 ( 中央値やモードや最大値や最小値など ) を測定結果とするのか? mm 以下のオーダーで長さが知りたいのであれば, 測定時の温度も決めておく必要があるのでは? マイクロメートル以下のオーダーで長さが知りたいのであれば, 値を補正するために, 気圧, 湿度, 二酸化炭素濃度も測定しておく必要があるのでは? 測定対象の金属棒は, ある一つの金属棒の長さを知りたいのか? それともある製造ラインで作成される金属棒の平均の長さを知りたいのか? 5 何を測定するのか? 問題点 レーザを照射する端面は完全に平面ではないので, 端面内で 5 点ほど測定を行い, その平均値を測定結果とする必要があるのでは? このように, 測定を行うためにはその測定の定義, 測定方法, 測定手順が明確になっている必要がある! これが十分に分かっていないと測定をすることができない! とりあえず測ってみる ということをしてはいけない! 6

GUM の説明 3.1.1 測定の目的は測定量の値, すなわち測定される特定の量の値を決定することである したがって, 測定は測定量, 測定の方法及び測定手順を適切に明示することから始まる これがきっちりと決まっていないと, 測定も不確かさ評価も行うことができない 7 何を測定するのか? 金属棒の長さをレーザー測長器によって測りたい このときの測定の定義は? 定義 : 顧客から持ち込まれた測定対象金属棒をレーザー測長器によってサブマイクロメートルオーダーで測定する 測定結果は 0 のときの長さに補正する また, レーザーは温度, 気圧, 湿度, 二酸化炭素濃度によって影響を受けるので, それを補正するために, 温度計, 気圧計, 湿度計によって, リアルタイムにそれぞれの量を測定し, 補正する 二酸化炭素濃度については, 一般的な二酸化炭素濃度を用い補正する 測定は, 金属棒の端面を 5 カ所に区切り, それぞれの場所で, 3 回ずつ測定を行い, その平均値を金属棒の長さとする 8

GUM の説明 3.1.3 実際には, 測定量の要求仕様すなわち定義は, 要求される測定の正確さによって規定される ( 注 ) 測定量の定義が完全でないと, 測定結果の不確かさの評価に含まねばならないような, 十分大きな不確かさの成分を生ずることになる 測定量の定義が非常に重要である 9 何を測定するのか? 金属棒の長さを目幅 1mm のものさしによって測りたい このときの測定の定義は? 定義 : 顧客から持ち込まれた測定対象金属棒にものさしを当て, その長さを読み取る その際の測定回数は 1 回である その読み取った長さを金属棒の長さとする 10

1-: 計量管理について 11 計量管理の意味 計測 (Z8103) 特定の目的を持って, 事物を量的にとらえる方法 手段を考究し, 実施し, その結果を用い所期の目的を達成させること. かなり広い意味としてとらえている! 計量管理とは, 計測の活動を取り仕切ること! 1

計量管理の活動 計測の情報計測目的の明確化計測計画の策定測定 何のために測定するのか? 何を測定したいのか? その測定方法は? その定義は? どのような測定計画 データ処理 解析法を用いれば, 知りたい情報が得られるのか? 時間 コスト データの処理 解析 計測結果の評価 活用 13 測定計画について 製品の製造装置の比較 ある製品の製造装置を購入したい. その製造装置は A 社製のものと B 社製のものがある. どちらの装置を購入するかを決定するために, つの装置で製品を製造して, そのできあがった製品を比較する. また, どちらの装置でも 1 つの製品を製作するのに半日かかるとする. このときどのような実験計画を立てればよいのかを考える. 14

測定計画について 普通に実験計画を立てると 1 3 4 5( 回 ) 装置 A (1) (3) (5) (7) (9) 装置 B () (4) (6) (8) (10) このような順番で実験を行うだろう. しかし, これでは不具合が起こることがある. 15 測定計画について どちらの装置でも 1 つの製品を製作するのに半日かかるのだから 月曜日の午前から実験を始めると実験が行われるのが, 装置 A 装置 B 1 3 4 5( 回 ) 月曜午前火曜午前水曜午前木曜午前金曜午前 月曜午後火曜午後水曜午後木曜午後金曜午後 このように装置 A は午前にのみ用いられ, 装置 B は午後にのみ用いられる. 16

測定計画について よって, 午前に製造された製品と午後に製造された製品では, 午前, 午後に製作することによって, 何らかのかたよりが生まれる可能性がある. そうであれば, 二つの製品に差があったとしても, その差は装置が異なることが原因で引き起こされた差か, 午前 午後に製造されたことによって引き起こされた差かが区別できない. 17 測定計画について ではどのようにすればよいのだろうか 実験のランダム化 実験のランダム化, とは実験を行う順番をランダムにするということである. ランダム化の方法 乱数表を用いる. サイコロを用いる. 18

測定計画について 今回の実験に適用すると 1 3 4 5 回 装置 A (1) ( 午前 ) () ( 午後 ) (4) ( 午後 ) (6) ( 午後 ) (9) ( 午前 ) 装置 B (3) ( 午前 ) (5) ( 午前 ) (7) ( 午前 ) (8) ( 午後 ) (10) ( 午後 ) これだと, 午前 午後の実験回数が装置 A, 装置 B でほぼ同数であるため, 装置の違いを純粋に求めることができる. 19 計量管理の活動 計測器や計測作業の管理計測器 計測法の開発 改善計測器の整備 計測作業法の設定測定 計測対象の管理計測対象の選定計測対象の前処理測定 計測環境の管理計測環境の整備計測環境の設定測定 0

製品 測定対象の選定 測定対象の管理法策定 製品 測定器 計画 Pla 測定目的 測定器 改善 Act 測定目的 測定法の選定 測定器の管理 測定目的の明確化 測定計画の設定 測定環境の設定 評価であがった問題点を改善する. 製品 製品 測定対象の選定は? 測定対象の管理は? 測定 Do 計測結果の評価 Check 測定器 実際に測定を計画通りに行う. 測定目的 測定器 測定法の選定は? 測定器の管理は? 測定目的 測定目的は達成されたか? 測定計画は正しかったか? 測定環境はこれで良かったか? この一連の活動を絶えず回し続け, よりよい測定を行い続けることが計量管理である. 1 製品 測定対象の選定 サンプリング法は適切であるか? サンプリング誤差を把握しているか? 測定対象の管理 測定を行うのに適した状態であるか? 前処理は必要であるか? 測定器 測定法の選定 測定したい特性が測れるか? 測定精度は必要十分であるか? 測定レンジは必要十分であるか? 測定速度は必要十分であるか? 測定コストは許容範囲内か? 測定器の管理 測定器は校正されているか? 校正体系の管理は十分行われているか? 測定目的 測定目的の明確化 どのような特性を測定したいのかがはっきりしているか? 測定計画の設定 どのようにして測定値を得るのかが明確であるか? 取得したデータの処理方法が目的にあったものであるか? 測定環境の設定 測定環境は製品にとっても, 測定器にとっても適切なものであるのか? これらを決定するには, 製品, 測定器, 測定目的について個々に考えても駄目である. すべてのバランスを取り, 決定することが必要不可欠である.

このバランスによって, このようなことが起こる. 製品を測定する上で必要な精度を持たない計測器を使うと, 特性が測れない. 製品を測定する上で必要以上の精度を持つ測定器を用いると, 測定器の管理コスト, 測定器を用いるための環境整備コストが跳ね上がる. 製品のサンプリング誤差が大きくないものに全数検査を行うと, コストの無駄である. 環境計量等のサンプリング誤差が大きいものを, サンプリング個数を少なくすると間違った結果を出す可能性が高い. 液体の体積を知りたい. 入れ物の質量は一つずつバラバラだが, 液面の高さはほぼ一定している. よって液面の高さによって体積を算出する. 液体の体積を知りたい. 入れ物の質量はほぼ一定だが, 液面の高さは一つずつバラバラである. よって質量によって体積を算出する. 計測管理を行うには, このバランス感覚が重要である. 3 : 統計の基本的事項について 統計学の初歩と不確かさへの応用 4

-1: 測定と統計 統計の初歩 統計から見た測定とは? 統計の基本的手法について 5 測定と統計について 頻度 無限回行うと 平均値 測定値 測定を行えばこのようなヒストグラムが得られる 逆にいうと 平均値 測定値 無限回測定するとこのような測定の母集団が得られる 測定をしようと決めたときに, すでに母集団の形は決まっている 測定を行えばその母集団から値をひとつ取り出すということになる 測定とは, その測定を無限回繰り返したとき得られる母集団からのサンプリングである 6

母集団と標本について (1) 私たちは測定することによってなにを知りたいのだろう? 頻度 平均値 測定値 本当ならこの母集団の性質を知りたい しかし, 母集団の性質も理想的な量であるので知ることはできない 平均値 測定値 そこで, 無限回測定する事は無理なので有限回の測定によって母集団の性質を推定する 一番知りたいもの 7 母集団と標本について () 一般的に代表値としてよく用いられている平均値を考えてみる 標本誤差 母集団の平均値 (: 母平均 ) x 実際の測定の平均値 ( : 標本平均 ) このように 本当に知りたい値である母平均は, サンプルから求められた標本平均とずれがある 測定は, このずれを標準偏差で推定するために行う! 8

正規分布について 正規分布よく見られる山形の分布はほとんどの場合正規分布である 正規分布の性質よく管理されている測定の測定値はほとんどの場合正規分布する 68.3% 95.4% 99.7% μ±1σ:68.3% μ±σ:95.4% μ±3σ:99.7% の値が含まれる 9 標準偏差とは 平均値からデータがどのくらいばらついているかの指標 簡単に言うと, ばらつきの平均値 である 不確かさなどばらつきを扱うものは, ほとんどの場合この標準偏差を用いる 標準偏差にも 母標準偏差 標本標準偏差 があり, 標本標準偏差によって, 母標準偏差を推定する 30

分散 標準偏差について 例 : ある製品の質量測定 (g) 平均値からの距離 ( 偏差 ) 単位 :g 87.5-87.84=-0.34 86.-87.84=-1.64 90.1-87.84=.6 88.4-87.84=0.56 87.0-87.84=-0.84 x 1 x x 3 x 4 x 5 87.5 86. 90.1 88.4 87.0 平均 : 87.5+ 86. + 90.1+ 88.4 + 87.0 x = = 87.84 5 ( 平均値からの距離 ) 単位 :g 0.1156.6896 5.1076 0.3136 0.7056 偏差の二乗和単位 :g 8.930 g 平方根単位 :g 1.494 データの個数 -1 ( 自由度 ) で割る単位 :g.33 31 平均値の標準偏差 標準偏差 = 測定値のばらつき 報告する値 = 平均値 平均値 ばらつき 測定値 必要なのは測定値のばらつきではなく, 平均値のばらつき! 平均値の標準偏差を求める必要がある. 3

平均値の実験標準偏差 サイコロを振って, 出た目の平均値を求める 1 回目 回目 1 回目 3 回目 回目 4 回目 3 回目 5 回目平均 6 回目 3 回振った平均値 7 回目 8 回目 9 回目 10 回目 10 回振った平均値平均 33 平均値の実験標準偏差の求め方 平均値の実験標準偏差と, 最初に算出した実験標準偏差の間には以下の関係がある ( x) sx ( ) ( x) sx ( ) 標本平均の母標準偏差 標本平均の標本標準偏差 ここで, () x は標本平均の母標準偏差,(x) はデータの母標準偏差, s() x は標本平均の標本標準偏差, s(x) はデータの標本標準偏差,は測定回数である 34

母集団と標本について (3) いったい平均値のばらつきとはなにを表しているのだろうか? 平均値平均値平均値このように母集団からサンプルを取りだし平均値を算出すると値がばらつく その平均値のばらつきを示す指標が, 平均値の標準偏差である よって, 測定値の平均値が, 母集団の平均値の推定値 その推定値のばらつきの程度がこの標本平均の標準偏差である 35 文字の使い方 ギリシャ文字で表されるのが母数( 母集団の性質 ) アルファベットで表されるのが標本の性質 ギリシャ文字に ^ ( ハット ) をつけると推定値をそれぞれ表す x ˆ 母平均標本平均を母平均の推定値とする x 標本平均 母分散 s x 標本分散 母標準偏差 s x 標本標準偏差 x ˆ s x s x 標本平均の母標準偏差の推定値を標本平均の標本標準偏差とし, それはデータの標本標準偏差を で割って算出される 36

-: 期待値と分散について 37 期待値とは 期待値 理想的にはこの値になるという値 サイコロは1-6の面を一つずつ持っている. また, その6つの面がでる確率はそれぞれ1/6. よって期待値は, 1 1 1 1 1 1 1 3 4 5 6 6 6 6 6 6 6 1 3 4 5 6 1 3.5 6 6 6 6 6 6 6 38

一般的に書くと 期待値とは E( x) xpx ( ) xpx ( ) xpx ( ) 1 1 Ex ( ) xpx ( ) 1 期待値は,E(x) と書く. 39 例 : ルーレット ルーレットは1-36までの数字と,0と00の穴がある. また, 賭けた番号に玉が入ると36 倍の配当が貰える. この時, 私は $100をある番号に賭けました. 貰える配当の期待値はいくらか? 40

解答 : ルーレット 穴の個数は1-36の穴と0と00の穴なので,38 個 また, どの穴も入る確率は同じ. よって, 当たる確率は,1/38となる. 賭けた穴に玉が入った場合には,36 倍の配当で $3600 貰える. その他の場合は,$0 となる. 41 解答 : ルーレット 期待値は, 1 1 1 Ex ( ) 3600 0 0 38 38 38 Ex ( ) 94.74 よって,$100 賭けたときの期待値は $94.74 となる. つまり, この差額が親の取り分. 4

主な賭け事の期待値 競馬の期待値 100 円賭けると75~80 円前後 宝くじ 300 円の宝くじで,150 円弱 統計的にいうと賭け事とは, この期待値との勝負! 43 期待値の性質 測定値 xの母平均をとすると, Ex ( ) cが定数のとき, E() c c Ecx ( ) cex ( ) x,yが確率変数のとき, Ex ( y) Ex ( ) Ey ( ) x,y が確率変数で互いに独立のとき, E( xy) E( x) E( y) 44

分散について 分散を期待値を用いて表すことを考える. 分散は平均値とデータとの差の二乗の平均値. よって, var( x) E{( x) } 45 分散の性質 c が定数のとき, var( x c) var( x) var( cx) c var( x) x,y が確率変数で互いに独立のとき, var( x y) var( x) var( y) 46

平均値の分散 平均値の標準偏差は, データの標準偏差を で割ったものになった. つまり, データの分散をで割ったものが, 平均値の分散となる. では, なぜそうなるのかを考える. 47 平均値の分散 x 1 ( ) 1 x x1 x x3 x 平均値 : 1 上式の分散 : var( x) var{ ( x1 x x3 x )} 1 は定数なので, var( x) var( x 1 x x3 x ) 1 var( x) {var( x ) var( x ) var( x )} 各 x が独立ならば, 1 48

平均値の分散 var( x1) var( x) var( x ) より, 1 var( x) {var( x 1) var( x) var( x )} 1 ( ) 1 ( ) var( x) 49 分散と自由度 分散を算出するときに, データの個数で二乗和を割るのではなく,( データの個数 -1) の自由度と呼ばれるもので割った. これはなぜか? 50

分散と自由度 ではここで, 二乗和を で割った分散を s 1 と置き, この期待値が何を表しているのか調べる. s 1 ( x x) 51 分散と自由度 先程の式を変形 s 1 ( x x) ( x xx x ) x x x x 1 x x x x x x x x x この式の期待値を考える. 5

分散と自由度 x 1 E( x ) { E( x )} E( x ) ここで, var( x) E{( x ) } E( x x ) よって, Ex ( ) Ex ( ) Ex ( ) Ex ( ) Ex ( ) E x は, ( ) Ex ( ) 53 また同様に, 分散と自由度 var( x) E{( x ) } E( x x ) Ex ( ) Ex ( ) Ex ( ) Ex ( ) ここで, 平均値の分散は, var( x) であるので, Ex ( ) となる. 54

分散と自由度 1 Es ( 1 ) { Ex ( )} Ex ( ) に, Ex ( ) を代入. Ex ( ) と 1 Es ( 1 ) ( ) ( ) 1 ( ) ( ) 1 Es ( 1 ) となる. よって,s 1 は母分散の不偏推定量ではない!! ( 不偏推定量 母数をかたよりなく推定している量 ) 55 分散と自由度 1 よって, Es ( 1 ) であるなら, となることは自明. ( x x) E{ } 1 よって, 分散を算出するときには, で割るのではなく, -1 で割る. 56

分散と自由度 では母平均 が分かっていて標本平均を用いずに分散を算出したときのことを考える. 二乗和をで割った分散をs と置き, この期待値が何を表しているのか調べる. s ( x ) 57 先程の式を変形 分散と自由度 s ( x ) この式の期待値を考える. x 1 E( ) { E( x )} Ex ( ) を代入 x 1 1 E( ) よって,s は母分散の不偏推定量である!! x 58

-3: 平均値の標準偏差と不確かさ 59 平均値の標準偏差と不確かさ 例 : 測定器 A1,A,A3 という 3 台の機械がある. この測定器が異なることによって現れるばらつきを評価した. 実験法は,A1,A,A3 の 3 水準で繰返しを各 10 回行った. その結果, ˆ A 0.014 mm ˆ 0.014 mm e を得た. 60

平均値の標準偏差と不確かさ 平均値の不確かさを求める. 測定器は3 水準 繰返しを各 10 回 ua ue 0.014 3 0.014 10 0.00716 mm 0.00449 mm これで本当によいだろうか? 61 平均値の標準偏差と不確かさ この実験は不確かさを求めるために行ったものである. よって, 普段の測定とは測定方法が異なっている. 普段は, 装置は 3 台のうちどれか 1 台だけを用いて, 繰返しは 5 回で行っている. とすると, 6

平均値の標準偏差と不確かさ 装置は,3 台のうちの 1 台しか用いないので, u A ˆ A 0.014 mm 繰返しは普段は 5 回しか行わないので, ue 0.014 5 0.00635 mm となる. 不確かさ評価を行ったときの実験回数が問題なのではなく, 普段の測定で行っている実験回数が重要!! 普段の測定で値付けしたものに対して不確かさをつけるので, このようにしなければならない. 63 平均値の標準偏差と不確かさ 週が異なることによるばらつき 日が異なることによるばらつき 繰返しによるばらつき ˆ 0.1909 A ˆ 0.1077 B A ˆ 0.114 C AB これらの推定された標準偏差から不確かさを算出することを考える. 実際の測定はある日に 5 回繰返してその平均値を測定結果として報告する, という前提をおくと, 週が異なることによるばらつきと日が異なることによるばらつきは平均化されないので, そのまま 1 つずつ不確かさに含まれる. また, 繰返しは 5 回なので, 繰返しによるばらつきは 1/ 5 の大きさだけ含まれる. よって, ˆ CAB となる. 5 ˆ ˆ A BA u x 64

4-3: プールされた標準不確かさ 65 プールされた標準偏差 ある製造ラインで測定器を制作している 制作された測定器は,3 回繰り返し測定が行われ, 校正されている このとき, どの測定器も繰り返しのばらつきはだいたい同じであるが, 平均値が少し異なる よって, その平均値が社内規格より外れた場合には調整し直して, 出荷している このような場合の繰り返しの不確かさはどのようにして求めればよいか? 66

プールされた標準偏差 通常の考え方では, 3 回の繰り返し測定の値を, x 1, x, x 3 とすると, x 3 1 3 x u x として求める しかし,s(x) は 3 回の測定でのみ求められているので非常に推定精度の低い標準偏差となってしまう ここで前提として, どの測定器も繰り返しのばらつきはだいたい同じであるが, 平均値が少し異なる をうまく用いることを考える s x 3 3 x x 1 3 31 67 プールされた標準偏差 上図のように, これまでに取得したデータは, 平均値は異なるが, ばらつきの大きさは変わらないということを前提とする このとき, ばらつきは変わらないのでこれら全データを利用して分散を算出する方法を考える 68

プールされた標準偏差 各日による二乗和を算出する S x x j j1 更に全部足し合わす Pool 日目の二乗和 m j S x x 1 j1 二乗和が計算できたので自由度で割り, 分散を算出する自由度は, 全データ数が,m 個あるが, 二乗和を計算するために平均値をm 個用いているので,m -m =m( -1) となる よって分散は s Pool m 1 j1 x j x m 1 となる ちなみにこの分散は分散分析を行った際の誤差項の分散と等しい 69 プールされた標準偏差 今までに500 台の測定器を作成し, その校正を行っているため, それらの測定値は非常に数多くある しかも, 平均値は異なってもばらつきはほぼ変わらないのであれば, 二乗和 ( 分散の分子部分 ) を, 3 3 3 j j j S x x x x x x x Pool 1 1 500 500 j1 j1 j1 500 3 1 j1 x j x として求める このときの自由度は, 全データ数が500 3=1500 個, 二乗を算出するために用いた平均値の個数は, 作成された測定器の個数と同じであるから,500 個とすると, f 1500 500 1000 となる 70

プールされた標準偏差 よって, 二乗和を自由度で割れば分散が算出できるので, s x 500 3 1 j1 1000 となる これは, 作成された測定器の測定データのばらつきであるので,3 点の平均値の不確かさは, x j x で算出できる u x 500 3 1 j1 x j 1000 x 3 71 GUM での言及 4..4 統計的管理状態に保たれている, はっきりと素性の知られた測定に対しては測定を特徴づける合成またはプールされ た分散の推定値 s ( またはプールされた実験標準偏差 s p p ) が利用できることがある. このような場合, 測定量 qの値が独立な 個の観測値から決められるときには, 観測値の相加平均 q の実験分散は s qk よりも, sp によってより良く推定され, 標準不確かさは u s となる. p 統計的管理状態に保たれている 不特定多数の顧客から試験依頼を受け付けるのではなく, 自社で生産した計測器を試験するような場合! 7

事前の分析による不確かさ評価 事前測定 製造ラインで制作された製品 この製品は, 制作日, 制作機械制作時間 等が異なる製品からサンプリングされたもの 測定 測定結果平均値 : x 分散 : s 実際の測定測定回数 1 回 / 回測定結果 :x / x 推定された母集団 ˆ 母平均の推定値 : 母分散の推定値 : ˆ 推定 測定の母集団母平均 : 母分散 : 測定結果 :x / x 標準不確かさ : u x ˆ s / ˆ s u x どのについても不確かさは同じ 73 終わりに 統計的手法は, データに含まれる情報を効率よく取り出すためのツールである よって, 元のデータに情報が含まれていないのであれば, どんなすばらしい統計的手法を用いても知りたいことを知ることはできない つまり, 統計的手法だけを理解していても本当に知りたい情報は取り出すことはできない 対象としている測定について十分な知識を身に付けていることが重要である 統計は万能ではない よって統計の知識を身に付けるとともに, その統計を通して対象としている測定を見直し, その測定についての新たな, そして今まで見過ごしがちであった知識を再確認していただきたい 74