経営統計学

Similar documents
Microsoft Word - Stattext05.doc

Microsoft Word - Stattext07.doc

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft Word - lec_student-chp3_1-representative

第4回

Microsoft Word - Stattext13.doc

Microsoft Word - apstattext01b.docx

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

PowerPoint プレゼンテーション

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft PowerPoint ppt

Microsoft Word - apstattext04.docx

散布度

Microsoft Word - mstattext02.docx

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

Microsoft Word - apstattext05.docx

Microsoft Word - Stattext11.doc

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - 基礎・経済統計6.ppt

代表値

ビジネス統計 統計基礎とエクセル分析 正誤表

統計的データ解析

0415

学習指導要領

stat-base_ppt [互換モード]

PowerPoint プレゼンテーション

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

モジュール1のまとめ

stat-base [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

不偏推定量

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

Microsoft PowerPoint - 測量学.ppt [互換モード]

スライド 1

学習指導要領

EBNと疫学

初めてのプログラミング

情報工学概論

数値計算法

Microsoft PowerPoint - データ解析基礎2.ppt

相関係数と偏差ベクトル

基礎統計

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

学力スタンダード(様式1)

学習指導要領

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

画像類似度測定の初歩的な手法の検証

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 資料04 重回帰分析.ppt

データ解析

講義「○○○○」

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

DVIOUT-mem

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

Microsoft PowerPoint - e-stat(OLS).pptx

学習指導要領

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Microsoft Word - スーパーナビ 第6回 数学.docx

学習指導要領

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

Microsoft Word - 補論3.2

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

テレビ講座追加資料1105

Microsoft Word - å“Ÿåłžå¸°173.docx


中学 1 年生 e ライブラリ数学教材一覧 学校図書 ( 株 ) 中学 1 年 数学 文字式式の計算 項と係数 中学 1 年 数学 次式 中学 1 年 数学 項のまとめ方 中学 1 年 数学 次式の加法 中学 1 年 数学 77

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A

経済データ分析A

untitled

基礎統計

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

13章 回帰分析

【指導のポイント】

Microsoft Word - appendix_b

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - Statistics[B]

スライド 1

Microsoft PowerPoint saitama2.ppt [互換モード]

スライド 1

ベイズ統計入門

Microsoft PowerPoint - sc7.ppt [互換モード]

基礎統計

Microsoft Word - SPSS2007s5.doc

1/30 平成 29 年 3 月 24 日 ( 金 ) 午前 11 時 25 分第三章フェルミ量子場 : スピノール場 ( 次元あり ) 第三章フェルミ量子場 : スピノール場 フェルミ型 ボーズ量子場のエネルギーは 第二章ボーズ量子場 : スカラー場 の (2.18) より ˆ dp 1 1 =

Microsoft PowerPoint - 三次元座標測定 ppt

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

学習指導要領

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

【補足資料】確率・統計の基礎知識

学習指導要領

Transcription:

5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており 基本統計量とも呼ばれています 5. 分布の中心を表わす基本統計量 分布の特徴を表わすには まず分布の中心がどこにあるのかを示さなければなりません この分布の中心を表わす統計量には重要なものが 3 つあります. 平均値 me, verge) これは最もよく使われている中心を表わす統計量で 特に統計を学んでいなくても 知っていると思います 平均値はデータから以下のような式で与えられます ) 度数 重心 図 5. 平均値 この定義は図 5. のように ヒストグラムの重心を通り 軸に下ろされた垂線の 座標を表わしています Ecel にもこの統計量を求める以下の関数があります 平均値 = verge 範囲 ). 中央値 med) これは中間値またはメジアンとも呼ばれ データを小さい方から大きい方に並べた 真中の値です 度数分布を用いると 面積が度数を表わしますので 図 5.b のように左右の面積の等しい位置が中央値となります 例として 以下のデータの中央値を求めてみましょう,, 3, 5, 7, 8, 9,, 3, 4, 5, 7, 8, 9 度数 S S 図 5.b 中央値 5-

最初のデータは奇数個ですから 中央値は 5 です 番目のデータは偶数個で中央値は / 番目と / 番目の値の平均を取ります この場合 4 5) 4. 5 となります Ecel にも中央値を求める以下の関数があります 中央値 = med 範囲 ) ひん 3. 最頻値 mode) 度数分布で最も頻度の高い値を最頻値 またはモードといいます Ecel にも最頻 値を求める関数があります 最頻値 = mode 範囲 ) しかし この関数を利用するときには注意 が必要です 例えば,, 4, 5, 6, 6 というデ ータで最頻値を求めてみます このデータだと 6 が つ 他は つですから 最頻値は 6 ということになってしまいます データ数が少ない場合や データが多くても殆ど同じ値を 持たないとき 利用には注意が必要です 度数分布表を作って 最も頻度の高い値を最頻値 とするのが無難なようです 度数 図 5.c 最頻値 5. 分布の拡がりを表わす基本統計量 分布の中心と同様 拡がりも分布の特徴を表わす大切な指標です ここでは 分布の拡が りを与える統計量を見てみましょう. レンジ rge) 最も単純な分布の拡がりを表わす統計量は データの最大値と最小値の差です これをレ ンジまたは範囲といいます R m X ) m X ) ここに X,,, } { これは単純な定義で分かり易いのですが 飛び離れたデータがある場合には レンジがそのデータによって拡がりすぎて 必ずしも現実の拡がりを表わしていると言えなくなります Ecel では最大値として =m 範囲 ) 最小値として =m 範囲 ) という関数があり その差がレンジを表わしています レンジ = m 範囲 ) m 範囲 ). 分散 vrce) レンジは飛び離れた つのデータに大きく左右されるのが欠点でした この欠点を除いて 現在最もよく利用されている統計量は ここで述べる分散 または不偏分散 ) と分散から得られる標準偏差です 分散は各データの平均からのずれの 乗を合計して データ数で割ったもので 以下の式 5-

によって与えられます ) ) ) ) 我々は分散を という表式で表わします 分散はデータのばらつきが平均からずれている ほど大きな値となります また つのデータの寄与は ) ですので 全体に対してレンジのように大きな影響はありません また 分散は以下のようにも変形できます ) これはコンピュータでプログラムする際にデータを読みながら 平均と分散が同時に計算できる便利な公式です Ecel では分散を求める以下のような関数が用意されています 分散 = vrp 範囲 ) 名前は vrce から取られています 3. 不偏分散 ubed etmtor of vrce) 分散にはもう つの定義があり 不偏分散と呼ばれています 場合によってはこちらの定 義の方がよく利用されているかも知れません Ecel で分散というとこの不偏分散を示して います 我々は不偏分散を分散と区別して表わすためにu という記号を用います 不偏分 散の定義と通常の分散との関係は以下のように与えられます u ) 分散と不偏分散はどのように使い分けるのでしょうか 通常母集団の分散は通常の分散を 標本から母集団の分散を推測する場合は不偏分散を使います Ecel には不偏分散を表わす 以下のような関数があります 不偏分散 = vr 範囲 ) 4. 標準偏差 tdrd devto) 分散はデータと平均との差の 乗を取ったせいで データの単位の 乗の単位を持っていますので 例えばデータが cm なら分散は cm ) これから直接データの広がりを見ることはできません そこで データの単位に合わせるために 分散の平方根を取って標準偏差と呼びます これにより分布の拡がりという意味がはっきりとします また標準偏差には分散から求められるものと不偏分散から求められるものがあります 我々はそれらを区別するために それぞれ とu の記号を用いて表わします 分散または u 不偏分散 Ecel にもこれらを表わす関数が以下のように与えられています 名前は tdrd devto 5-3

5-4 から取られています 標準偏差 = tdevp 範囲 ) または =tdev 範囲 ) Ecel では通常 標準偏差というと不偏分散から得られるものを指しており 後者がそれに当ります 5.3 分布の形を表わす基本統計量分布の中心と広がりは分かりましたが 分布の形についてはこれらの統計量からは推測できません そこである程度分布の形が分かるような統計量も考案されていますが 頻繁に利用されているかというとそうでもないようです. わいど歪度 kewe) 分布のゆが歪みを表わす統計量には 歪度と呼ばれるものがあります これは以下のような定義で与えられます 3 3 この値は 裾が右に伸びている場合に正 左に伸びている場合に負になります Ecel の関数は以下の尖度ともに定義が少し異なっていますので ここでは省略します. せんど尖度 kurto) 次に分布のとが尖り方を示す統計量を紹介します 尖度と呼ばれる値で 以下の式によって表わされます 3 4 4 これは これから学ぶ標準的な分布 正規分布 ) より裾が伸びている場合に 0 以上の値になることが分かっています 問題分散の以下の つの表式が同等であることを示せ ) ) )

問題 ) 以下のデータで 分散 を定義に従って求めよ ) Ecel の関数を使って 以下のデータの平均値 中央値 レンジ 分散 不偏分散 それ ぞれの標準偏差を求めよ 身長 cm) 7, 8, 7, 66, 7, 75, 68, 74, 7, 70 ) No. - -) 7-8 9 8 3 7 0 0 4 66-6 36 5 7 0 0 6 75 3 9 7 68-4 6 8 74 4 9 7-0 70-4 平均 7 分散 5. まず データ を入力し 平均を求める それを として を計算する さらに ) を求め それを平均して 分散の値を求める ) 平均値 7 分散 5. 中央値 7.5 標準偏差 3.89878 レンジ 5 不偏分散 6.88889 標準偏差 4.09609 5.4 変量の関係を表わす統計量 3.4 節で つの量的データの関係を表わす量として相関係数を紹介しましたが ここでは この相関係数について少し詳しく説明したいと思います 今 以下のような対になった つ の変数を考えます, ),, ),,, ) この 変数の間の相関係数は以下のように与えられます r ), ) ここに と は変数 と の標準偏差で, ) ) は と の共分散と呼ばれる量です さて 相関係数はどのような値を取るのでしょうか 図 5. を見て下さい 5-5

r=- -<r<0 r 0 0<r< r= 図 5. 相関係数と散布図これは 変数 を横軸に を縦軸にして 各データを点で表示した散布図です 相関係数は つの変数間に完全な b の線形関係があるとき の正負に応じて r となるように作られています そしてそれから外れるごとに 0 に近づいて行き 軸のスケールを適当にとることによりデータが球状に分布するときほとんど 0 になります 相関係数は上の定義から 単位が分子と分母で打ち消されており どんな単位を使っても 例えば m か cm, kg か g 等 ) その値は変化しません 問題 ) 以下の対になった身長と体重のデータで 相関係数の定義に従ってその値を Ecel で計算せよ ) Ecel の関数を利用して これらのデータの基本統計量及び相関係数を求めよ 身長 cm) 7 8 7 66 7 75 68 74 7 70 体重 kg) 7 74 65 58 66 70 60 63 7 6 ) No. - -)^ -b -b)^ -)-b) 7-7 5 5-5 8 9 8 74 8 64 7 3 7 0 0 65-0 4 66-6 36 58-8 64 48 5 7 0 0 66 0 0 0 6 75 3 9 70 4 6 7 68-4 6 60-6 36 4 8 74 4 63-3 9-6 9 7-7 6 36-6 0 70-4 6-5 5 0 平均 7 5. 66 7.6 4.9 まず と のデータを入力し それぞれの平均を求める それらの平均を, b として と b を求める それらの 乗 ), b) とそれらの積 ) b) を求め て それぞれ平均を計算する その値を使って相関係数を求める r 4.9/ 5. 7.6 0.7746 5-6

) 特によく利用されるものだけ結果を示す 最頻値はこのようなデータでは意味を持たない 平均値 7, 66 分散 5.0, 7.6 相関係数 0.77 中央値 7.5, 65.5 標準偏差 3.90, 5.5 レンジ 5, 6 不偏分散 6.89, 30.67 標準偏差 4., 5.54 興味ある人に [Skp OK] 相関係数は r の値を取ると言いましたが これを証明してみましょう まず c を何らかの数として 以下の式を考えます c ) ) c c 0 ここで c とすると この式は以下のように変形できます 0 これから r となり r が示されます 問題分布図のデータが完全に直線 b の上に並ぶとき 相関係数 r の値は の正負によ り r となることを示せ b,, ) とする [ b) b)] ) より )[ b) b)] ) r となり の正負により r となる 5-7