0415

Similar documents
経営統計学

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

ビジネス統計 統計基礎とエクセル分析 正誤表

EBNと疫学

データ解析

情報工学概論

講義「○○○○」

Microsoft PowerPoint - Statistics[B]

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

スライド 1

Microsoft PowerPoint - e-stat(OLS).pptx

統計学の基礎から学ぶ実験計画法ー1

スライド 1

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード]

Probit , Mixed logit

基礎統計

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft Word - Stattext12.doc

統計的データ解析

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

禁無断転載 第 3 章統計的手法に用いられる分布 All rights reserved (C) 芳賀 第 1 節我々の身の回りにある代表的分布と性質 1. 分布の表わし方我々の身の回りにある全てのものは ばらつきを持っています 収集したデータを分析していくためには このばらつきがどのような分布にな

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft Word - Stattext07.doc

モジュール1のまとめ

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft PowerPoint - sc7.ppt [互換モード]

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

Microsoft PowerPoint ppt

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft Word - Stattext13.doc

したがって ばらつきを表すには 偏差の符号をなくしてから平均化する必要がある そのひとつの方法は 1 偏差の絶対値を用いることである 偏差の絶対値の算術平均を 平均偏差 という ( )/5=10.8 偏差の符号を取るもうひとつの方法は 2それを2 乗することです 偏差の2 乗の算

13章 回帰分析

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

様々なミクロ計量モデル†

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

学習指導要領

Microsoft Word - スーパーナビ 第6回 数学.docx

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

PowerPoint プレゼンテーション

画像処理工学

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

学力スタンダード(様式1)

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

スライド 1

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

不偏推定量

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

散布度

_KyoukaNaiyou_No.4

青焼 1章[15-52].indd

第4回

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

第7章

Microsoft Word - Time Series Basic - Modeling.doc

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - lec_student-chp3_1-representative

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

PowerPoint プレゼンテーション

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft Word - Stattext11.doc

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

PowerPoint プレゼンテーション

基礎統計

数学 t t t t t 加法定理 t t t 倍角公式加法定理で α=β と置く. 三角関数

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Math-Aquarium 例題 図形と計量 図形と計量 1 直角三角形と三角比 P 木の先端を P, 根元を Q とする A 地点の目の位置 A' から 木の先端への仰角が 30,A から 7m 離れた AQB=90 と なる B 地点の目の位置 B' から木の先端への仰角が 45 であ るとき,

Microsoft PowerPoint - Quality11.ppt

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

Microsoft PowerPoint - ch04j

学習指導要領

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

システムデザイン System Design

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - Econometrics pptx

(.3) 式 z / の計算, alpha( ), sigma( ) から, 値 ( 区間幅 ) を計算 siki.3<-fuctio(, alpha, sigma) elta <- qorm(-alpha/) sigma /sqrt() elta [ 例 ]., 信頼率 として, サイ

Microsoft Word - appendix_b

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

Transcription:

今回の授業の狙い 基本的な統計量を求め 活用できること 章統計量と確率分布のと確率分布の活用 part 統計解析で用いる代表的な確率分布の特徴を 把握すること 統計解析の全体像 統計解析での注意点 ()( サンプリング サンプル 測定 母集団 何らかの意味で同質性が期待できるものの集団 e 日本人男性同じ条件で作った製品 母集団 推定 アクション 事実に基づく判断 データからモノをいう データ解析 s サンプリング 何を持ってくるかに注意 ロット 時間 作業者 箱の中の位置 3 統計解析での注意点 ()( 代表的な基礎統計量 求めたい集団は有限か? ~ 日本人の人口 代表値 { 平均値メジアンモード 次の条件を満たす場合 無限母集団として扱う 将来も同様の要素が作り出される場合 サンプルとして得られるデータ数より母集団の要素が十分多い場合 基礎統計量 散布度 関連度 { 分散標準偏差レンジ 相関係数

代表値と散布度 例題 () 平均値 データの和をデータ数で割ったもの () 中央値 ( メジアン 中位数 ) データを大きさ順に並べた時 中央に位置するデータの値 (3) 最頻値 ( モード ) 集められたデータの中で最も多く現われた値 次の 個のデータより 平均 中央値 最頻値 分散 標準偏差 範囲を求めよ. () 分散 各測定値の平均値からの差の 乗和 S を (-) で割ったもの 8 () 標準偏差 分散の平方根をとり データの単位としたもの () 範囲 データの最大値 - データの最小値 7 8 データの可視化 相関係数 ~ 要因間の関連度合いの指標 抵抗 R 散布図 & 層別 規格値 c.f. QC7 つ道具 つ以上の特性の関係を視覚的に表現する方法 ロットA ロットB 関係の有無は目視でわかる 関係を数値で示したい 定量化 抵抗 R 散布図 膜厚 t 原因と結果の関係 e. 照明の明るさと仕事の能率 要因と特性の関係 e. 経験年数と設計ミス数の関係 特性間の関係 e. 引張り強さと硬度 相関係数 (Correlatio Coefficiet) つの変数間の直線的な関係性を示す指標 膜厚 t 相関係数 r: : 散布図による表現 Y r Y r Y 相関係数の範囲 :- r 符号の意味 r> 正の相関 r< 負の相関 r - 相関係数 r: 求め方 () 表 - 身長と体重の例身長 c 体重 c 平均からの偏差偏差平方和積和 i i i- i- (i-) (i-) (i-) (i-) A B 8 C 7 D 7 E 7 8 F 7 7 G 77 7 H 8 7 I 8 73 J 8 7 計 7 8 平均 7 8 - -7-3 - - 7 3-8 - - - 3 3 8 3 S 3 3 S 8 - -8 8 3 3 S

相関係数 r: 求め方 () r S () S S S, S : 偏差平方和 S : 偏差積和 相関係数 r 3 3 S ( i - ) i i S ( Yi - Y ) S ( i - )( Yi - Y ) i 式 (-) 3 7.87 3 相関係数 r: : 評価 統計的な検討法もあるが一般的な目安は, r..< r..< r.8.8< r 無相関弱い相関相関有り強い相関 これはあくまでも目安検討目的に合せ固有技術で判断すべき! 参考 ) 相関係数 r: : ベクトルによる表現 実践 )ECEL) による相関分析 r s s s (,) cosθ ベクトルの内積 ( 内積の正の平方根 ) 相関係数 correl( セル範囲, セル範囲 ) correl(b3:b3, C3:C3) r r. r.7 r r-. 3 r-.7 r- 相関係数 r: : 注意点 () 相関係数が等しい 関係性が等しい a) データ b) データ c) データ3 d) データ 7 相関係数 r: 注意点 () データから求めた相関係数が高いことと と に因果関係があることとは別次元の話し 例 )~ 才の会社員の 走る速さ と 給料 の関係 給料 走る速さ ゆっくり走れば給料は多くなる?? 給料 走る速さ 勤続年数 (or 年令 ) 勤続年数 (or 年令 ) 偽相関 第 3 の変数が存在して これが と の両方に関連がある場合に起こる 固有技術的な観点で CHECK 8

分布の必要性 確率分布の考え方 世帯数 最頻値 万円 7 年貯蓄動向調査中央値 83 万円 平均値 万円 まず 選られたデータをグラフ化してみる f a b ヒストグラム クラス数の考え方 α+3.3 log スタージェスの公式 e データ数 では? 参考 :87 年 最頻値 3 万円 平均値 万円 貯蓄額 ここで データ数 大区間幅 h 小 :f() 確率分布 : 正規分布 f N h 全体を積分すると ( ) ( ) f π ep μ a b ( ) ( ) すべてのに対して f >, fd 確率変数がa,b 間の値をとる確率 b Pr{ a< < b} f( ) d a 変曲点 μ で最大 3.% 3.%.%.3% μ- μ μ+ μ+3 μ+ 図正規分布 正規分布の確率密度分布のの特徴 分布の形状 : 歪度 歪度 (Skewess): 分布の対称性からのズレをあらわす. s (-μ) 3 / 3 μ μ μ 負 (s<): 右に歪んだ ( 左に裾を引く ) 分布 s: 対称分布正 (s>): 左に歪んだ ( 右に裾を引く ) 分布 平均値 μ が等しく 標準偏差 が異なる つの正規分布 図形の面積は常に だから ( が小さい方が高さが高い ) 標準偏差 が等しく 平均値 μ が異なる つの正規分布 3

分布の形状 尖度 (Kurtosis): 正規分布と較べて, 尖りの程度やスソの広がりをあらわす. k (-μ) / -3 k<: 扁平な分布 k: 正規分布 k>: 中心が尖り スソを長く引く分布 統計量と記号の区別 母集団とサンプルデータでの統計量の関係母集団サンプルデータ 平均値 μ 分散 ( 標準偏差の 乗 ) V(s ) 真値 推定値 正規母集団での母数 母平均 ;μ 母分散 ; ギリシャ語の :ea ギリシャ語の s :stadard deviatio 参考 ;[ 加法定理 ] 正規分布に従う 組の母集団 N(μ, ) N(μ, ) をサンプルデータから求める N(μ, ) μ i ( ) i i i V 7 それぞれから取り出したサンプルの和の+ N(μ +μ, + ) + μ +μ つのサンプルの差 -は N(μ -μ, + ) μ μ 8 参考 : 工程能力指数 Cp と不良率 標準正規分布 Cp 公差 正規分布において μ, のもの すなわち N(, ) N(, ) 表 工程能力と不良率 確保した 工程能力 Cp 不良率 (%) ±.33 3.73 ±.7. ± 3..7 ±.33.3 標準正規分布基準化 ( 標準化 正規化 ) 確率変数 がN(μ, ) に従うとき はN(, ) に従う P u - μ u 3

正規分布表の見方 正規分布についてさまざまな確率を求める場合には付表の正規分布表 ( 片側 ) を用いる uを小数点 桁目まで考える 小数点 桁目 uの縦の欄 3 小数点 桁目 uの横の欄 例 u. u....3....7.8......88.8.8.7.7.8......83.3..3.3.8.7..87.8.7.8.....3.33 3 [ 演習問題 ] ある母集団が N(, ) に従う時 Pr ( ) を求めよ 3 [ 演習問題 ] ある押し出し成形のゴム部品は重量規格が ±g である 製造工程では μg.g の正規分布に従うが 不良率は何 % 見込まれるか? N(,. ) 規格値 :±g 重量 (g) 33 確率分布 :χ: 分布 標準正規母集団からサンプリングしたデータZ,Z,Z 3,,Z のそれぞれの 乗和の分布は自由度 fのχ 分布にしたがう. χ Z +Z +Z 3 + +Z では, 一般の正規分布 N(μ, ) から求めたサンプルの 乗和は, データZ i を基準化することで χ (Zi μ) / (-) i とすると, このχ も自由度 fのχ 分布にしたがう. 母集団の平均値 μがわからない場合はサンプルから平均値を求める. その場合, 式 (-3) のとおりであり, χ (Zi Z) / (-3) i 3 確率分布 :χ: 分布 f() χ 分布の表現 f() {....3.. e (>) Γ ( ) f f3 f ( ) 3 確率分布 :F: F 分布 個別に求められた 組のデータからそれぞれのばらつきに差があるか比較を行う際には, それぞれの分散を求めて比較してみればよい. 正規分布にしたがう 組の母集団それぞれからサンプル数, を抽出し, 分散 V,V を求める. 分散比 Fを求める. V F (-) V このFは自由度 f ( -),f ( -) のF 分布にしたがう. 3

確率分布 :F: F 分布 F 分布の表現 f,() { ( { f().8.7....3... B, (>) + ( + ) f,f f3,f f,f (<) 3 37 確率分布 :t: t 分布 通常, 母集団の分散は未知であることが多い. その場合データから分散 V を求めて基準化の式に代入すると式 (-8) は正規分布ではなく自由度 f- の t 分布にしたがう. μ V t (-8) t 分布は, を中心とした左右対称の分布で, 形はほとんど正規分布と変わらない. t 分布の形は自由度 (f-) によって多少異なり, 自由度が大きくなるほど尖り方が激しくなり, 次第に正規分布に近くなる. t 表 : 上記の t 値が % の確率で納まる範囲を示したもの ±t(-,.) がその限界値となる 38 確率分布 :t: t 分布 f () + + + Γ + + B, πγ t 分布の表現 f()..3.. 標準正規分布 t 分布 f t 分布 f3 t 分布 f - - -3 - - 3 図 - t 分布 3 参考 ) 相関係数 r: : 検定 ちなみに相関係数の検定は appedi r - t - r t を自由度 φ-, 有意水準 αのt 分布表の値と比べ r: 相関係数 : データ数 t t(-,α) なら相関あり t <t(-,α) なら相関なし ただし この検定は r かどうかの検定である