Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Similar documents
Microsoft PowerPoint - データ解析基礎2.ppt

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

Microsoft PowerPoint ppt

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

3章 度数分布とヒストグラム

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

【指導のポイント】

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - 基礎・経済統計6.ppt

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

3章 度数分布とヒストグラム

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

PowerPoint プレゼンテーション

散布度

stat-base_ppt [互換モード]

Microsoft PowerPoint - CVM.ppt [互換モード]

stat-base [互換モード]

年生 章資料の活用 ( 基本問題練習 ) 入試問題を解くための準備問題です 1 に適当なことばを入れなさい 資料のとる値のうち, 最大のものから最小のものをひいた差を ア という 度数分布表において, 資料を整理するための区間を階級といい, その幅を 3 右の表は, 生徒 人のある日の睡眠時間を,

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

データの種類とデータの分布

経営統計学

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

EBNと疫学

学習指導要領

基礎統計

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

Microsoft Word - apstattext01b.docx

データ解析

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

第4回

Microsoft Word - 保健医療統計学112817完成版.docx

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

情報工学概論

Microsoft PowerPoint - statistics pptx

Microsoft Word - nakamoto2.docx

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft PowerPoint - 測量学.ppt [互換モード]

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

MedicalStatisticsForAll.indd

Microsoft Word - lec_student-chp3_1-representative

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

<88DA8D73915B927595E28F5B8DFB8E712D >

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - statistics pptx

青焼 1章[15-52].indd

学習指導要領

Microsoft Word - apstattext04.docx

新学習指導要領における数学科 「資料の活用」および「データの分析」 で育む統計的問題解決授業

Microsoft PowerPoint - stat-2014-[9] pptx

Blue circle & gradation

講義「○○○○」

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A

学習指導要領

テレビ講座追加資料1105

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

学力スタンダード(様式1)

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

代表値

DataAnalysisI02.pptx

[12]SPSS_01.indd

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

Microsoft PowerPoint - 12統計の分析と利用_1-1.pptx

経済統計分析1 イントロダクション

Microsoft Word - histgram.doc

<4D F736F F D A778F4B8E7793B188C A77816A899C967B2E646F63>

DVIOUT-mem

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5

Microsoft PowerPoint - e-stat(OLS).pptx

数値計算法

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

_KyoukaNaiyou_No.4

Microsoft PowerPoint - Statistics[B]

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Medical3

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - statedu_ _open.ppt [互換モード]

中1数学 移行措置資料

[1] の問題は四分位数の計算方法を知っているだけでは解けず, 四分位数や箱ひげ図の意味がわかり, また,2 回目とのデータの比較について箱ひげ図からわかることの判断といったことができるかどうかが問われていた しかも (2) と (3) はそれぞれ選択肢を 4 個と 2 個答えるが, それぞれ完答を

回答形式 : 微妙にちがう態度と印象態度を聞く質問 ( リッカード尺度 ) 質問 -: あなたはLINEアプリは高校生に使用制限をつけた方がいいと思いますか? そう思う 思わない データ入力は結構大変で 誤りも起きる回答 やっと終わった 質問 - あなたはタブレットが高齢者に役立つと思いますか? 役

Microsoft PowerPoint - A1.ppt [互換モード]

0415

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

平成 28 年度山梨県学力把握調査 結果分析資料の見方 調査結果概況 正答数分布グラフ 分布の形状から児童生徒の解答状況が分かります 各学校の集計支援ツールでは, 形状だけでなく, 県のデータとの比較もできます 設問別正答率 無解答率グラフ 設問ごとの, 正答率や無解答率が分かります 正答率の低い設

学習指導要領

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft Word - Stattext11.doc

図 1 左側は 全病院における病床規模の分布を 右側は回答者施設の病床規模の分布を示す 200 床以上 ~500 床未満 500 床以上では全体に占める割合に比べて回答者の割合がやや高く 200 床未満では やや低い 以下 回答施設全体の統計要約は この点を考慮に入れてみる必要がある 図 1 全病院

Microsoft Word - appendix_b

スライド 1

基礎統計

学習指導要領

Microsoft PowerPoint - statistics pptx

ビジネス統計 統計基礎とエクセル分析 正誤表

2 ( 生物統計学 ) データを大きさの順に並べてデータが奇数個なら中央に位置するデータの値, データが偶数個なら中央に位置する2つのデータの平均である 例 1 11,14,15,17,20 例 2 2,4,8,10,12,16 3 集めたデータの中で, 最も多く現れた値あるいは階級のこと. 名目デ

Microsoft Word - SPSS2007s5.doc

Transcription:

データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ ) というものがある. 母集団から無作為抽出された個体のことを標本といい, その個数を標本の大きさまたは標本サイズと呼ぶ. 標本 = 観測データ と読み替えても良い 統計データの構造 - データ解析では調査項目のことを変量と呼ぶ. 質的変量 名義尺度 : 名前, 性別 順序尺度 : 好きなもの順位など 量的変量 ( 連続的変量 ) 間隔尺度 : 温度, 成績など 比例尺度 : 距離, 重量, 金額など 統計データの構造 -: 名義尺度 対象者特性を便宜的に数字で表現 性別 : 男性 =, 女性 = 好きな動物 : 犬 =, 猫 =, ウサギ = 統計的処理 度数のカウント 例 ) 男性 人, 女性 人名義尺度の数字は, 加減乗除算ができない

統計データの構造 -: 順位尺度 順位やベスト, ワースト などで表現 行きたい国から順に つ書いてください. 次のタレントを好きな順に 名書いてください. 統計的処理 例 ) 順位別の度数 位ドイツ 名 位中国 名 位オランダ 名 統計データの構造 -: 間隔尺度 評価などの質問 ( 等間隔の順序尺度 ) で使われる 満足度の調査 非常に満足やや満足どちらでもないやや不満非常に不満 統計的処理 度数のカウント 得点化し, 換算 平均などの統計量を計算 統計データの構造 -: 比例尺度 度数分布表 : 質的データ例 数や量などを質問 年収, 年齢 年間売上高, 来場者数 統計的処理 カテゴリー化して度数を計算 平均などの統計量の計算 ID 頭部損傷ヘルメット着用 有り 着用 無し 着用 無し 非着用 有り 着用 無し 着用 有り 非着用 7 有り 非着用 無し 着用 79 有り 非着用 応答パターン 頭部損傷 :( 有り, 無し ) ヘルメット着用 : ( 着用, 非着用 ) 7

度数分布表 : 質的な観測データの要約 データで各々の値の個数 ( 度数 ) を求める. 度数を表形式にしたものが度数分布表である 頭部損傷 ヘルッメ着用の有無着用非着用計 有 7 無 計 7 79 度数分布表 : 量的な観測データの要約 データ集計 度数分布表 ( 区間数 ) 度数分布表の作成区間 ( 以上 - 未満 ) 頻度 ID AGE SAL - - - - - - - 7 7 9 9 7 7 - - 9 9-9 度数分布表 : 度数分布表の作成 度数分布表作成手順. データ項目を適当な階級に分ける. 各階級に入る度数を数える 更に必要ならば,. 相対度数, 累積度数, 累積相対度数を計算 相対度数は, データの大きさが異なる複数のデータの分布の比較に有効 度数分布表 : 用語の復習 階級 : 標本値が取り得る値を適当な区間に分けたもの 階級値 : 階級を代表する値. 通常階級の上限と下限の中間値 度数 : 階級に入る標本値の個数 相対度数 : 度数を全標本値の個数で割って, 比率にしたもの 累積度数, 累積相対度数 : 度数, 相対度数を下の階級から順に足したもの

度数分布表 : ヒストグラムの作成 度数分布表 : 度数分布表の読み方 ヒストグラム : グラフの分布の形を見るために, 度数分布表をグラフにしたもの 度数分布表を作成して, ヒストグラムを描くことによってデータの分布を知ることが出来る. データ解析のはじめの一歩!! 区間 ( 以上 - 未満 ) 度数 相対度数累積度数累積相対度数 -.. -. 7. -.. -.. -.7.7 -.. - 7.. 7 -.7.9-9..9 9 -. 9. データ区間 : 以上 未満階級値 : =(+)/ 度数 : データ区間に 人相対度数 : 9 人は全体の% 累積度数 : 最初から数えてこのデータ区間までに 人累積相対度数 : 最初から数えてこのデータ区間までの人数は全体の% 度数分布表 7: ヒストグラムの作成 例題 : 得点データ 度数分布表 区間 ( 以上 - 未満 ) 頻度 - - - - - - - 7 7 - - 9 9 - - - - ヒストグラム - - - - 7 7 - - 9 9 - 学籍番号 得点 性別 IV 7 女子 IV 男子 IV 男子 IV 男子 IV 男子 IV 男子 IV7 女子 IV 女子 IV9 男子 IV 女子 IV 9 女子 IV 男子 IV 79 女子 IV 女子 IV 男子 IV 女子 IV7 女子 IV 女子 IV9 7 女子 IV 女子 IV 女子 IV 男子 IV 7 男子 IV 男子 IV 男子 学籍番号 得点 性別 IV 女子 IV7 9 男子 IV 男子 IV9 77 男子 IV 女子 IV 男子 IV 7 男子 IV 女子 IV 女子 IV 男子 IV 男子 IV7 女子 IV 男子 IV9 7 男子 IV 男子 IV 女子 IV 男子 IV 男子 IV 男子 IV 男子 IV 女子 IV7 女子 IV 男子 IV9 女子 IV 9 男子 IV 男子 IV 9 男子 学籍番号 得点 性別 IV 女子 IV 男子 IV 女子 IV 9 女子 IV 女子 IV 7 男子 IV7 女子 IV 7 女子 IV9 男子 IV7 女子 IV7 男子 IV7 男子 IV7 女子 IV7 男子

例題 : 度数分布表 例題 : ヒストグラム 度数分布表 ( 全体 ) 区間 度数相対頻度 ~. ~. ~. ~7. 7~. 度数分布表 ( 男子 ) 区間 度数相対頻度 ~. ~ 7. ~.7 ~7 7.7 7~. 度数分布表 ( 女子 ) 区間 度数相対頻度 ~. ~. ~. ~7. 7~ 9.9 データのまとめ方によって, 異なる解釈ができる場合がある. ヒストグラム : 全体 ~ ~ ~ ~7 7~ ヒストグラム : 男子 ~ ~ ~7 ~ 7~ ヒストグラム : 女子 ~ ~ ~7 ~ 7~ 7 分布の特性値 度数分布やヒストグラムを見ることで分布の形状を知るができる. 数値で分布の概要を把握するための指標として, 代表値 : データの中心の位置 散布度 : データの散らばり具合 がある. つの指標を総称して 分布の特性値 という. 分布の特性値 : 代表値 データの分布がどのような値を中心に散らばっているか明らかにする. 平均 : データのすべての値を足し合わせて, データ数で割ったもの 最頻値 : 分布の最も高い場所 中央値 ( メジアン ): データの中央にくる値のこと 9

分布の特性値 : 代表値 日本全国の平均世帯収入は? 渡辺久哲 調査データにだまされない法 創元社より 中央値 density 総務庁の統計局の家計調査によると, 平成 年度の全国平均の世帯年収は 7 万円であった. 全国の一般世帯およそ 標本について収入と支出についての調査...... 最頻値 x 平均値 最頻値 この 7 万円という世帯年収を聞いての感想は, ふつうの家はそんなに稼いでいるのか!! 例えば, ボーナスを年間 ヶ月分支給すると仮定それば,ヶ月の収入は約 万円となる. 日本全国の平均世帯収入は? 分布の特性値 : 散布度散布度 : 分散 ( 標準偏差 ) 9 7 平均年収が7 万円となった理由 万円以上稼ぐ高所得者がその平均を引き上げていたため 次の つのデータの平均を考える. 平均値は同じである データのもつ意味が全く違う データを要約する値としては不十分? データの散らばりを表す量も表示する - - - - - - 7 7 - - 9 9 - - 単位 : 万円

7 分布の特性値 : 散布度例 ) 散布度 : 分散 ( 標準偏差 ) クラスで, 統計学の試験をし, 各クラスで 人ずつ選び平均点を計算すると 点であった. このデータから, ヒストグラムを作成したところ以下のような結果であったた. この平均点だけで, データを解釈しても良いか. クラス A のヒストグラム 7 7 9 7 クラス B のヒストグラム 7 7 9..... クラス C のヒストグラム 7 7 9 データの散らばりを表す量 散布度 : 分散 ( 標準偏差 ) 分散 : データの散らばりを表現する量 データの散らばり具合が大きいほど, 分散の値は大きくなる. つのクラスの分散の大きさは, クラス A< クラス B< クラス C 標準偏差 : 分散を平方根したもの データの散らばりを表す量 散布度 : 分散 ( 標準偏差 ) 平均, 分散の計算式 density..... 分布 分布 の平均 = 分布 の平均分布 の分散 < 分布 の分散 分布 - - x n x= x x x n 個の観測データ (,,..., ) が得られたする. このとき, この観測データから標本平均と標本分散 は以下の式で計算される. 標本平均 標本分散 x n = x i n i = n n = ( i ) = i n n i= i= s x x x x 7

平均値の意味 以下の 人の学生の得点を表した図 9 7 点 数 得点と平均点との距離 7 9 番号 平均点 番号得点 7 7 9 7 平均値の意味 人の得点を x= ( x,..., x) と書く. このとき, ある値 α と得点の距離を d = ( x α ) ( i=,...,), i i で定義すると, その距離の総和 y は y = di ( xi α) α xi xi x = = + i i= i= i= i= i= このとき, y の最小値は, この項がのとき, x の標本分散 yは最小になる α = x i = x i= であるので, 平均値は観測値との距離を最小にする値となる. 9 例題 : 平均値の意味 次の度数分布表とヒストグラムはあるテスト結果をまとめたものである. わかることを述べなさい. 度数分布表 区間度数 - - - - - - - 7 7 - - 9 9-7 - ヒストグラム - - - - - - 7 - - 9-7 9 例題 : 基本統計量 以下のデータは, 日間にわたる つのストアの 日の売り上げ高 ( 単位 : 万円 ) である. どちらのお店がより安定しているか答えなさい. 日 7 9 平野ストア 7 松原マート 9 7 7

例題 : 折れ線グラフ 平野ストア 9 7 松原マート 平均 分散 標準偏差 平野ストア 9... 松原マート... 7 9 ( 日 ) 例題 : 基本統計量 以下のデータは, 同じ科目を講義中心と演習中心というつの異なる講義方法でおこない, クラスA( 講義中心 ) とクラスB( 実習中心 ) からそれぞれ 名を選び, 試験をおこなった結果である.つのクラスを比較しなさい. No 7 9 講義中心 A 7 実習中心 B 7 77 9 No 7 9 講義中心 A 7 7 7 実習中心 B 9 9 例題 : 基本統計量 例題 : 基本統計量 基本統計量 平均 分散 標準偏差 講義中心 A..9. 実習中心 B 9. 7.7.7 度数分布表 区間 A B - - - - - 7-7 7 - - 9 9-7 A B - - - - - - 7 7 - - 9 9 -

度数分布とヒストグラム 度数分布とヒストグラム 区間 クラスA クラスB 7 7 7 9 合計 9 左表はつのクラス (A, B) で 点満点の試験結果を 点刻みの区間に分け, その区間内に入る人数を数えたものである. 7 人 数 クラス A と B の得点分布 7 7 9 得点範囲クラス A クラス B つのクラスを比べたときでは, どちらのクラスの出来具合が良いでしょうか? 7 度数分布とヒストグラム 区間 クラスA クラスB つのクラスを比べたとき.. では, どちらのクラスの出.. 来具合が良いでしょう.. か?...7.7 7.. 7.7. 9.. 合計.. 9 度数分布とヒストグラム % 7% % クラス A と B と得点分布 % %% 7% % % % 7% % % つのクラスを比べたと % きでは, どちらのクラス % の出来具合が良いでしょうか? % 7 7 9

度数分布とヒストグラム 度数分布とヒストグラム ある銀行のある月にかかってきた電話,9 件の通話時間の度数分布を作成し, ヒストグラムを 描いた結果 ある銀行のある月にかかってきた電話,9 件全通話のうち7% 7.% が 秒以内の通話時間の度数分布を作成し, ヒストグラムを で終わっている描いた結果 7 9 < 7 9 < まとめ データからの情報抽出 : データの要約 度数分布表, ヒストグラム 分布の中心を表す特性値 代表値 : 平均, 最頻値, 中央値 分布のばらつきを表す特性値 散布度 : 分散, 標準偏差