Microsoft PowerPoint - データ解析基礎2.ppt

Size: px
Start display at page:

Download "Microsoft PowerPoint - データ解析基礎2.ppt"

Transcription

1 データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ ) というものがある. 母集団から無作為抽出された個体のことを標本といい, その個数を標本の大きさまたは標本サイズと呼ぶ. 標本 = 観測データ と読み替えても良い 統計データの構造 - データ解析では調査項目のことを変量と呼ぶ. 質的変量 名義尺度 : 名前, 性別 順序尺度 : 好きなもの順位など 量的変量 ( 連続的変量 ) 間隔尺度 : 温度, 成績など 比例尺度 : 距離, 重量, 金額など 統計データの構造 -3: 名義尺度 対象者特性を便宜的に数字で表現 性別 : 男性 =, 女性 = 好きな動物 : 犬 =, 猫 =, ウサギ =3 統計的処理 度数のカウント例 ) 男性 人, 女性 人名義尺度の数字は, 加減乗除算ができない 3

2 統計データの構造 -: 順位尺度 順位やベスト 3, ワースト 3 などで表現 行きたい国から順に3つ書いてください. 次のタレントを好きな順に3 名書いてください. 統計的処理 例 ) 順位別の度数 位ドイツ 名 位中国 名 3 位オランダ 名 統計データの構造 -: 間隔尺度 評価などの質問 ( 等間隔の順序尺度 ) で使われる 満足度の調査 非常に満足やや満足どちらでもないやや不満非常に不満 統計的処理 度数のカウント 得点化し, 換算 平均などの統計量を計算 統計データの構造 -: 比例尺度 度数分布表 : 質的データ例 数や量などを質問 年収, 年齢 年間売上高, 来場者数 統計的処理 カテゴリー化して度数を計算 平均などの統計量の計算 ID 頭部損傷ヘルメット着用 有り 着用 無し 着用 3 無し 非着用 有り 着用 無し 着用 有り 非着用 7 有り 非着用 無し 着用 793 有り 非着用 応答パターン 頭部損傷 :( 有り, 無し ) ヘルメット着用 : ( 着用, 非着用 ) 7

3 度数分布表 : 質的な観測データの要約 度数分布表 : 量的な観測データの要約 データで各々の値の個数 ( 度数 ) を求める. 度数を表形式にしたものが度数分布表である 頭部損傷 ヘルッメ着用の有無着用非着用計 有 7 3 無 3 計 データ集計 度数分布表の作成 ID AGE SAL 度数分布表 ( 区間数 ) 区間 ( 以上 - 未満 ) 頻度 度数分布表 3: 度数分布表の作成 度数分布表作成手順. データ項目を適当な階級に分ける. 各階級に入る度数を数える更に必要ならば, 3. 相対度数, 累積度数, 累積相対度数を計算 相対度数は, データの大きさが異なる複数のデータの分布の比較に有効 度数分布表 : 用語の復習 階級 : 標本値が取り得る値を適当な区間に分けたもの 階級値 : 階級を代表する値. 通常階級の上限と下限の中間値 度数 : 階級に入る標本値の個数 相対度数 : 度数を全標本値の個数で割って, 比率にしたもの 累積度数, 累積相対度数 : 度数, 相対度数を下の階級から順に足したもの

4 度数分布表 : ヒストグラムの作成 度数分布表 : 度数分布表の読み方 ヒストグラム : グラフの分布の形を見るために, 度数分布表をグラフにしたもの 度数分布表を作成して, ヒストグラムを描くことによってデータの分布を知ることが出来る. データ解析のはじめの一歩!! 区間 ( 以上 - 未満 ) 度数 相対度数累積度数累積相対度数 データ区間 : 3 以上 未満階級値 : 3=(3+)/ 度数 : データ区間に 3 人相対度数 : 9 人は全体の % 累積度数 : 最初から数えてこのデータ区間までに 3 人累積相対度数 : 最初から数えてこのデータ区間までの人数は全体の % 3 度数分布表 7: ヒストグラムの作成 例題 : 得点データ 度数分布表 区間 ( 以上 - 未満 ) 頻度 ヒストグラム 学籍番号 得点 性別 IV 7 女子 IV 男子 IV3 男子 IV 男子 IV 男子 IV 男子 IV7 女子 IV 女子 IV9 男子 IV 女子 IV 9 女子 IV 男子 IV3 79 女子 IV 女子 IV 男子 IV 女子 IV7 女子 IV 女子 IV9 7 女子 IV 女子 IV 女子 IV 男子 IV3 7 男子 IV 男子 IV 男子 学籍番号 得点 性別 IV 女子 IV7 9 男子 IV 男子 IV9 77 男子 IV3 女子 IV3 男子 IV3 7 男子 IV33 女子 IV3 女子 IV3 男子 IV3 男子 IV37 女子 IV3 男子 IV39 7 男子 IV 男子 IV 女子 IV 男子 IV3 男子 IV 男子 IV 男子 IV 女子 IV7 女子 IV 3 男子 IV9 女子 IV 39 男子 学籍番号 得点 性別 IV 女子 IV 3 男子 IV3 女子 IV 9 女子 IV 女子 IV 7 男子 IV7 女子 IV 7 女子 IV9 男子 IV7 女子 IV7 男子 IV7 男子 IV73 女子 IV7 男子

5 例題 : 度数分布表 例題 : ヒストグラム 度数分布表 ( 全体 ) 区間 度数相対頻度 3~. ~ 3.3 ~.3 ~7. 7~. 度数分布表 ( 男子 ) 区間 度数相対頻度 3~. ~ 7. ~.37 ~ ~. 度数分布表 ( 女子 ) 区間 度数相対頻度 3~.3 ~. ~.33 ~7.3 7~ データのまとめ方によって, 異なる解釈ができる場合がある. ヒストグラム : 全体 3~ ~ ~ ~7 7~ ヒストグラム : 男子 3~ ~ ~ ~7 7~ ヒストグラム : 女子 3~ ~ ~ ~7 7~ 7 分布の特性値 度数分布やヒストグラムを見ることで分布の形状を知るができる. 数値で分布の概要を把握するための指標として, 代表値 : データの中心の位置 散布度 : データの散らばり具合 がある. つの指標を総称して 分布の特性値 という. 分布の特性値 : 代表値 データの分布がどのような値を中心に散らばっているか明らかにする. 平均 : データのすべての値を足し合わせて, データ数で割ったもの 最頻値 : 分布の最も高い場所 中央値 ( メジアン ): データの中央にくる値のこと 9

6 分布の特性値 : 代表値 日本全国の平均世帯収入は? 渡辺久哲 調査データにだまされない法 創元社より 中央値 総務庁の統計局の家計調査によると, 平成 年度の全国平均の世帯年収は 73 万円であった. desity 最頻値 x 平均値 最頻値 全国の一般世帯およそ 標本について収入と支出についての調査 この73 万円という世帯年収を聞いての感想は, ふつうの家はそんなに稼いでいるのか!! 例えば, ボーナスを年間 3ヶ月分支給すると仮定それば,ヶ月の収入は約 万円となる. 日本全国の平均世帯収入は? 分布の特性値 : 散布度散布度 : 分散 ( 標準偏差 ) 平均年収が 73 万円となった理由 万円以上稼ぐ高所得者がその平均を引き上げていたため 次の つのデータの平均を考える. 平均値は同じである データのもつ意味が全く違う データを要約する値としては不十分? データの散らばりを表す量も表示する 単位 : 万円 3

7 7 3 分布の特性値 : 散布度例 ) 散布度 : 分散 ( 標準偏差 ) 3 クラスで, 統計学の試験をし, 各クラスで 3 人ずつ選び平均点を計算すると 点であった. このデータから, ヒストグラムを作成したところ以下のような結果であった. この平均点だけで, データを解釈しても良いか. 3 クラス A のヒストグラム クラス B のヒストグラム クラス C のヒストグラム データの散らばりを表す量散布度 : 分散 ( 標準偏差 ) 分散 : データの散らばりを表現する量 データの散らばり具合が大きいほど, 分散の値は大きくなる. 3 つのクラスの分散の大きさは, クラス A< クラス B< クラス C 標準偏差 : 分散を平方根したもの データの散らばりを表す量散布度 : 分散 ( 標準偏差 ) 平均, 分散の計算式 desity x 分布 分布 の平均 = 分布 の平均分布 の分散 < 分布 の分散 分布 個の観測データx= ( x, x,..., x ) が得られたする. x = i= x i このとき, この観測データから標本平均と標本分散は以下の式で計算される. 標本平均標本分散 = ( i ) = i i= i= s x x x x 7

8 平均値の意味 9 7 点 数 3 以下の 人の学生の得点を表した図 得点と平均点との距離 番号 平均点 番号得点 平均値の意味 人の得点を x= ( x,..., x) と書く. このとき, ある値 α と得点の距離を di = ( xi α) ( i=,...,) で定義すると, その距離の総和 y は y = di ( xi α) α xi xi x = = + i i= i= i= i= i= このとき, y の最小値は, この項がのとき, x の標本分散 yは最小になる α = xi = x i= であるので, 平均値は観測値との距離を最小にする値となる. 9 3 例題 : 平均値の意味 次の度数分布表とヒストグラムはあるテスト結果をまとめたものである. わかることを述べなさい. 度数分布表 区間 度数 ヒストグラム 例題 : 基本統計量 以下のデータは, 日間にわたる つのストアの 日の売り上げ高 ( 単位 : 万円 ) である. どちらのお店がより安定しているか答えなさい. 日 平野ストア 7 松原マート

9 例題 : 折れ線グラフ 例題 3: 基本統計量 平野ストア 松原マート 平均 分散 標準偏差 平野ストア 松原マート ( 日 ) 以下のデータは, 同じ科目を講義中心と演習中心という つの異なる講義方法でおこない, クラス A( 講義中心 ) とクラス B( 実習中心 ) からそれぞれ 名を選び, 試験をおこなった結果である. つのクラスを比較しなさい. No 講義中心 A 実習中心 B No 講義中心 A 実習中心 B 例題 3: 基本統計量 例題 3: 基本統計量 基本統計量 平均 分散 標準偏差 講義中心 A..9. 実習中心 B 度数分布表 区間 A B A B 3 3

10 まとめ データからの情報抽出 : データの要約 度数分布表, ヒストグラム 分布の中心を表す特性値 代表値 : 平均, 最頻値, 中央値 分布のばらつきを表す特性値 散布度 : 分散, 標準偏差 37

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 度数分布とヒストグラム データとは 複雑な確率ゲームから生まれたと考えてよい データ分析の第一歩として データの持つ基本的特性を把握することが重要である 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える データが母集団からのランダムサンプルならば 母集団についての推測を行う 度数分布とヒストグラムの作成

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2 春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの

More information

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

Microsoft PowerPoint - CVM.ppt [互換モード]

Microsoft PowerPoint - CVM.ppt [互換モード] 遺伝子組み換えコーン油を事例とした CVM 質問 問 1 現在 遺伝子組み換えトウモロコシを原料として使っているコーン油が 1 本 900gあたり約 600 円で販売されています もし 遺伝子組み換え原料を完全に使っていないコーン油を販売しようとすれば それは 流通管理を徹底しなければならないことから 値段がより高くなることが予想されます あなたは 900g のコーン油 1 本について 追加的な値上がりが何円までだったら

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

データの種類とデータの分布

データの種類とデータの分布 データの種類とデータの分布 統計基礎の補足資料 218 年 6 月 4 日金沢学院大学経営情報学部藤本祥二 2( 教科書 P.52) データのばらつき 分布について データの分布データ全体のばらつき具合 ( 広がり具合 ) 等の全体的な様子をとらえたもの 度数 ( 頻度数 ) ある項目, 又はある値, 又は範囲にデータがどれくらい存在するのかを頻度で示したもの 度数分布度数に関するデータ全体の様子

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 絶対値の意味を理解し適切な処理することができる 例題 1-3 の絶対値をはずせ 展開公式 ( a + b ) ( a - b ) = a 2 - b 2 を利用して根号を含む分数の分母を有理化することができる 例題 5 5 + 2 の分母を有理化せよ 実数の整数部分と小数部分の表し方を理解している

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx 統計の分析と利用. データとその扱い -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばり データの尺度 -. 二次元のデータ 堀田敬介 散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 0/9/30, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット, =9, =-3, =4, =5, =3, 67 = 箱ひげ図,, 3,

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに

More information

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63> 単元観 中学校学習指導要領では 目的に応じて資料を収集し, コンピュータを用いたりするなどして表やグラフに整理し, 代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする と示されている この内容を受け, 本単元では, 資料を収集, 整理する場合には, 目的に応じた適切で能率的な資料の集め方や, 合理的な処理の仕方が重要であることを理解すること, ヒストグラムや代表値などについて理解し,

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第1章 母集団と統計データ 本章では, ビジネスのさまざまな場面において統計データを扱ううえで, もっとも基本的事項となる母集団の概念と統計データの種類についてまとめています 母集団の統計的性質を調べるためにとても重要な概念であるサンプリングについて述べるとともに, ランダムサンプリングの重要性についても説明します 統計分析の考え方 ビジネスの多くの場面において, 統計分析は重要です この場合の統計分析とは,

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email [email protected] webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - - 統計学 Ⅰ(8) 章度数分布とローレンツ曲線. 度数分布表 教科書 8- ページ. 度数分布表 () データの表し方 () 度数分布表 () 度数, 相対度数, 累積度数. ヒストグラム () ヒストグラム () 階級の決め方 () ヒストグラムにおける階級幅の調整 () クロス集計. ローレンツ曲線とジニ係数 () 所得格差の問題 () ローレンツ曲線 () ジニ係数 () データの表し方 例 :

More information

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx 都市工学数理 浅見泰司 東京大学大学院工学系研究科教授 Yasushi Asami 1 0. 統計学的検定の基本 母集団と標本 世論調査では 日本人全員に聞くというのは事実上不可能 そこで 日本人全員 (= 母集団 ) から 一部 (= 標本 ) を選んで そこで得られた傾向 (= 仮説 ) が日本人全体にもある程度の信頼性で成り立つかどうかを考える (= 検定 ) 注意 サンプリングの方法 ランダムサンプリングが基本

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

新学習指導要領における数学科 「資料の活用」および「データの分析」 で育む統計的問題解決授業

新学習指導要領における数学科 「資料の活用」および「データの分析」 で育む統計的問題解決授業 授業案 Ⅰ 中学 1 年 資料の整理 貧困率 を例にした分布と代表値の理解 筑波大学附属中学校 中本信子 本事例では 子どもたちの身の周りの事象を事象を実データを基にして 統計的な観点から考察させることをねらいとする 学習指導要領では 中学校 1 年生の 資料の整理 の目的として 小学校における学習の上にたって 資料を収集 整理する場合には 1 目的に応じた適切で能率的な資料の集め方や 合理的な処理の仕方が重要であることを理解できるようにする

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A 第 4 章データの分析 No.01 ( 中学校での履修事項 ) 1 年生 : 資料の整理 1 階級 階級の幅 度数 度数分布表 ヒストグラム ( 柱状グラフ ) 度数折れ線 相対度数 2 範囲 代表値 ( 平均値 中央値 最頻値 ) 3 近似値 誤差 有効数字 3 年生 : 標本調査 1 標本 母集団 標本調査 全数調査 無作為抽出を学んだそうですね? ( なぜ データの分析 を学ぶのか?) 社会活動で

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 3 よく使う記述統計量 事務連絡 Webclass を使ってみようと思います. 登録できる人はしておいてください. 宿題を webclass 経由で回収 返却する予定です. じつはすでにデータをアップロードしています. MS-Word, Excel が使えますか? VBA とかできなくてもいいです. 宿題をこれらで出していただけると, 採点しやすいです. 互換機能 ( 校閲機能含む

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実数 の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい ア イ 無理数 整数 ウ 無理数の加法及び減法 乗法公式などを利用した計 算ができる また 分母だけが二項である無理数の 分母の有理化ができる ( 例 1)

More information

DVIOUT-mem

DVIOUT-mem 統計学講義メモ (1): 記述統計 高木真吾, 北海道大学 目次 1 データの全体像を見る 1 1.1 全体像を把握する : ヒストグラム.................................. 1 1. 分布状態を比較する : ローレンツ曲線................................ 3 データを要約する 8.1 データを代表する尺度 : 代表値...................................

More information

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5 1. 分布を把握する ( 度数分布表 ヒストグラム ) 本章の目標 度数分布やヒストグラムの必要性やその方法を理解する 度数分布やヒストグラムを用いて, 分布の様子を調べることができる 相対度数や累積相対度数を用いて, 異なるグループの分布を比較することができる Key Words: 階級 度数 相対度数 度数分布 ヒストグラム 1. 度数分布表 ( 量的 ) 変数 ( 例 : 世帯人員数 ) がとる値の範囲をグループ分けしたそれぞれの区間を階級という.

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

[12]SPSS_01.indd

[12]SPSS_01.indd データ分析 (SPSS) 第 01 回講義ノート p.1 講義ノート用スペース その回の授業の内容について 箇条書きや図版などが書き記されている 講義ノートは当該授業の翌週までしか配布しないので注意すること ノートの取り方 この部分 ( 右側 ) に書き込み書き込みをするのは主に授業中 スライドにしか書いてないことなどは 必要に応じてノートに追記を行うこと 講義ノートの活用法 授業中でふれる内容は

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

Microsoft PowerPoint - Statistics[B]

Microsoft PowerPoint - Statistics[B] 講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 [email protected]

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Python-statistics5   Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 ( http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

Microsoft Word - SPSS2007s5.doc

Microsoft Word - SPSS2007s5.doc 第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では

More information

スライド 1

スライド 1 都市環境計画 都市環境計画のための 調査 分析 調査 分析手法の概論分析 ( 主に多変量解析 ) の概論 試験想定問題 多変量解析手法について以下のキーワードを用いて説明せよ 定量データ ( 量的データ ), 定性データ ( 質的データ ) 目的変数 ( 従属変数 ), 説明変数 ( 独立変数 ), 重回帰分析, 判別分析, 因子分析, 数量化 Ⅰ 類, 数量化 Ⅱ 類, 数量化 Ⅲ 類 利用者の利用実態や評価構造の解明等に関する研究

More information