講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

Size: px
Start display at page:

Download "講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー"

Transcription

1 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1

2 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )3 第 5 週 ビジネスでデータサイエンスを実現するために 2

3 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1 ( 概要 ) 第 6 回 ビジネスにおける比較 2 ( 適切な A/B テストの活用 ) 3

4 Analysis ( 分析 ) とは 分析 = 複雑な事柄を要因に分け その構造 関係を解明 仮説に基づいて 各要因と結果 (KGI) の関係を調査する 要因 ( 変数 )? 結果 (KGI) どのように関係しているかを調査するこの際 要因と結果 (KGI) を数学的に変数として表現する 分析の第一歩は 1 変数による状況把握と 要因と結果を 2 変数の関係として解明すること 4

5 変数の尺度 分析手法を理解する前提として必ずおさえたい知識 名義尺度 ( 質的 ) カテゴリに分類するための特性を表す尺度 順序無し順序付き 順序に意味がない例 : 性別 都道府県 血液型など 順序に意味がある例 : 満足度 順位など 連続尺度 ( 量的 ) 数値で表し測れる大小の関係がある尺度 間隔尺度比率尺度 順序及び和差の演算が意味がある例 : 年齢 セ氏度など 順序及び和差積商の演算が意味がある例 : 体重 金額 速度など 変数の尺度により分析手法を変える必要がある 5

6 顧客数 顧客数 1 変数の状況を把握 ( データチェック ) 分析の第一歩としては 可視化と代表値により 各要因 (1 変数 ) の状況を把握 棒グラフ 可視化 ヒストグラム 可視化 代表値 カテゴリ数 最頻値 など 購入金額 代表値 平均値 標準偏差 最頻値 など 1 変数の可視化と代表値の算出は鳥瞰的な状況把握と分析の次のステップを計画するのに重要 6

7 来客数 サイト閲覧時間 来客数 2 変数の関係を調査 KGI と要因の関係を調査するために 尺度によって様々な手法がある 比較 傾向 名義 vs 名義 : クロス集計を用いて 離散分布を比較する 名義 vs 連続 : ヒストグラムを用いて 連続分布を比較する 連続 vs 連続 : 散布図を用いて 片方の変数に対してもう片方の変数の傾向を見る ( 片方は時間だと 時系列と呼ぶ ) 比較 傾向 名義 vs 名義 名義 vs 連続 連続 vs 連続 来客数 男 女 サイトA 18 3 サイトB 4 16 サイトA サイトB サイト閲覧時間 文章量 時間 クロス集計 ヒストグラム 散布図 時系列 7

8 複数変数の関係を調査したい場合は? 要因が複数の時 要因間の相互作用も考慮すべきであるが 変数が 3~4 個以上になると 前述の手法だけでは困難 要因と結果を示すデータをコンピューターに与え 自動的にその 関係を学習させる機械学習などが有効となる 要因 1 ( 変数 ) 要因 2 ( 変数 )? 結果 (KGI) 要因 N ( 変数 ) 機械学習 機械学習は 第 4 週で紹介 8

9 次回のテーマ 次回は 1 変数の状況の把握 1 ( 可視化の活用 ) お疲れ様でした! 9

10 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 2 回 :1 変数の状況の把握 1 ( 可視化の活用 ) 講師名 : 今津義充 10

11 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1( 概要 ) 第 6 回 ビジネスにおける比較 2( 適切な A/B テストの活用 ) 11

12 頻度 ( データ個数 ) 来客数 可視化の重要性 可視化では様々な情報を一目で把握できる 1 変数の状況把握のために ヒストグラムを用いる 年齢 データの種類 一枚の絵は一千語に匹敵する 12

13 来客数 分布の見方 1 下図は ある店の年代別来客数のヒストグラムです グラフから何が読み取れるでしょうか 1 どんな種類がある? 2 最も多い種類はどれ? 3 大半のサンプルはどこ? 4 最小値はどれぐらい? 5 最大値はどれぐらい? 6 データ不備はある? 年齢 13

14 来客数 分布の見方 代 ~100 歳以上の顧客が存在 230 代は最も多い 3 大半の顧客は 20~50 代 6100 歳以上は意外と多い データ不備の可能性あり 最小の年代は10 代 年齢 5 最大の年代は 100 歳以上 可視化することで様々な情報を一目で把握できる 14

15 分布の見方 3 変数の性質によって特徴の異なる様々な分布がある ピーク ( 峰 ) の数 ピーク ( 峰 ) の偏り 外れ値の有無 異種データの混在の可能性 平均値を見る際に注意 データ不備や異常値の可能性 変数の性質を把握するのに分布特徴に注意すべき 15

16 次回のテーマ 次回は 1 変数の状況の把握 2 ( 代表値の活用 ) お疲れ様でした! 16

17 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 3 回 :1 変数の状況の把握 2 ( 代表値の活用 ) 講師名 : 今津義充 17

18 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1( 概要 ) 第 6 回 ビジネスにおける比較 2( 適切な A/B テストの活用 ) 18

19 代表値の重要性 代表値 ( 統計量 ) は分布の特徴を数値にまとめるもの 代表値では分布を見なくても 分布の特徴を把握できる 一般的には 以下の代表値がよく用いられる 位置を示す代表値 ばらつきを示す代表値 平均値 中央値 最頻値 標準偏差 ( 分散 ) 分布の形を示す代表値 尖度 歪度 代表値では分布の特徴を少ない情報で伝えられる 19

20 位置を示す代表値 1 平均値 : 分布の中心傾向を表す値 但し 分布が偏っている場合や 外れ値が存在する場合には平均値を解釈する際に注意 平均値 偏りと外れ値に注意! 平均値 平均値では分布の中心を推定できる 20

21 位置を示す代表値 2 中央値 : 分布を下半分と上半分に分ける値 最頻値 : 頻度が最も高い値 最頻値 平均値 中央値 最頻値 中央値 平均値 偏りや外れ値がある場合 中央値と最頻値は平均値より有意義であることがある 21

22 割合 (%) 位置を示す代表値の例 1 17 歳の男子の身長分布 ( 平成 26 年度 ) 8% 7% 平均値 = 中央値 = 最頻値 = 170 cm 6% 5% 4% 3% 2% 1% 0% 身長 (cm) 出典 : 平成 26 年度学校保健統計調査結果 ( 文部科学省 ) 22

23 割合 (%) 位置を示す代表値の例 2 貯蓄現在高階級別世帯分布 ( 二人以上の世帯 ) ( 平成 26 年 ) 最頻値 = 200 万円未満 中央値 = 1,052 万円 平均値 = 1,798 万円 貯蓄額 ( 円 ) 出典 : 家計調査結果 ( 総務省 ) 23

24 ばらつきを示す代表値 標準偏差 : 分布が平均値からの散らばりを示す値 標準偏差 標準偏差 = 0.5 標準偏差 = 1.0 標準偏差 = 1.5 分布のばらつきが広いほど 標準偏差が高い 24

25 ~90 cm ばらつきを示す代表値の例 9% 8% 7% 6% 5% 4% 3% 2% 1% 0% 男子の身長分布 ( 平成 26 年度 ) 7 歳 ± 5.1 cm 12 歳 ±7.9 cm 17 歳 ±5.9 cm 出典 : 平成 26 年度学校保健統計調査結果 ( 文部科学省 ) 25

26 分布の形を示す代表値 尖度 : ピーク ( 峰 ) への集中度合いを示す値 歪度 : 左右へのピーク ( 峰 ) の偏りを示す値 尖度 = 0.0 尖度 = 0.5 尖度 = -0.5 歪度 = 0.0 歪度 = 0.5 歪度 =

27 次回のテーマ 次回は 比較して 2 変数の関係を見る お疲れ様でした! 27

28 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 4 回 : 比較して 2 変数の関係を見る講師名 : 今津義充 28

29 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1( 概要 ) 第 6 回 ビジネスにおける比較 2( 適切な A/B テストの活用 ) 29

30 来客数 比較とは 比較する変数の尺度により手法を変える必要がある 名義 vs 名義 : クロス集計を用いて 離散分布を比較する 名義 vs 連続 : ヒストグラムを用いて 連続分布を比較する 名義 vs 名義 来客数 男 女 サイト A 18 3 サイト B 4 16 クロス集計を用いて離散分布を比較する 名義 vs 連続 サイト A サイト B サイト閲覧時間 ヒストグラムを用いて連続分布を比較する 30

31 名義変数 vs 名義変数 : クロス集計 2 変数のカテゴリの組み合わせでデータの個数を集計 横カテゴリにより縦カテゴリの構成が変化するかを調査する あるネット銀行の地域別顧客満足度の構成比 KGI: 顧客満足度 (5 カテゴリ ) 要因 : 地域 (5 カテゴリ ) 100% 90% 5% 7% 10% 15% 13% 10% 20% 19% 地域別顧客満足度 ( 万人 ) 関東関西中部東北中国 満足 やや満足 普通 やや不満 不満 満足やや満足普通やや不満不満 80% 70% 60% 50% 40% 30% 20% 10% 0% 20% 15% 30% 60% 28% 30% 40% 20% 23% 20% 18% 30% 25% 10% 10% 10% 12% 関東 関西 中部 東北 中国 クロス集計で一目で比率の違いを把握できる 31

32 来客数 連続変数 vs 名義変数 : ヒストグラムの比較 平均値や分布の形はカテゴリによって違うか を調査 するために ヒストグラムの比較を行う あるネットショッピングサイトのページ別閲覧時間の分布 KGI: ページ閲覧時間要因 : ページ名 (3 カテゴリ ) ページ A ページ B ページ C ページ閲覧時間 ( 分 ) ヒストグラムの比較でカテゴリによって連続変数の 分布が変わるかを一目で把握できる 32

33 次回のテーマ 次回は ビジネスにおける比較 1( 概要 ) お疲れ様でした! 33

34 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 5 回 : ビジネスにおける比較 1( 概要 ) 講師名 : 渋谷直正 34

35 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1( 概要 ) 第 6 回 ビジネスにおける比較 2( 適切な A/B テストの活用 ) 35

36 ビジネスにおける比較の事例 ビジネスにおいて 比較 は施策の効果検証のためによく用いられる 広告デザインの売上への効果 ウェブサイト コンテンツのクリック率への効果 ワクチンの感染病予防率への効果など 比較による効果検証のために A/B テストを行うことが多い 36

37 A/B テストの事例 サンプル抽出 従来 WEB あるウェブサイトは会員登録ボタンのクリック率を向上させたい そのために ウェブページのデザインを改善した 母集団 サンプル抽出 WEB 改善後 A/B テストの実施 1. 1 ヶ月間の来客を 2 群に分けた 2. 2 デザインをそれぞれの群に出した クリックあり クリックなし 計 クリック率 従来 100 9,900 10, % 3. 各群におけるクリック率を記録した 改善 150 9,850 10, % 4. 2 分布を比較した結果 改善デザインによりクリック率が上がったと分かった 要因 : デザイン ( 従来 改善 ) KGI: クリック率 37

38 A/B テストの紹介 A/B テストは KGI と施策の間の関係 ( 施策効果 ) を調査する手法 以下の流れにより行う 1 対象の集団から小集団を 2 つ取り出す 小集団は 標本 と呼ぶ 効果検証をしたい施策 A と施策 B をそれぞれの標本に適用する それぞれの標本において KGI を測る クリックありクリックなし計クリック率 従来 100 9,900 10, % 改善後 150 9,850 10, % 要因 : 施策 A 又は施策 B のカテゴリをとる 4 両施策による KGI の分布を比較し 有意な効果があるかを判断する 名義変数 KGI: 施策の効果を受ける値 ( 連続変数又は名義変数 ) 38

39 不適切な A/B テストの事例 比較が公平であるようにテストを適切に設計すべき ( 事例 ) ある広告会社は 渋いデザイン と おしゃれなデザイン 2 デザインの売上効果を図るため A/B テストを実施した 標本 A に渋いデザインを 標本 B にオシャレなデザインを設定しアンケートをとった結果 渋いデザインが最も売上を増やすと見られた ただし 渋いデザインの年代分布は年配層に偏っており おしゃれなデザインと分布が異なっていた この場合渋いデザインはベストだと言えるか? 両標本は全ての要因について同一である必要がある 39

40 次回のテーマ 次回は ビジネスにおける比較 2 ( 適切なA/Bテストの活用 ) お疲れ様でした! 40

41 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 6 回 : ビジネスにおける比較 2( 適切な A/B テストの活用 ) 講師名 : 渋谷直正 41

42 第 2 週の内容紹介 第 1 回 Analysis ( 分析 ) とは 第 2 回 1 変数の状況の把握 1 ( 可視化の活用 ) 第 3 回 1 変数の状況の把握 2 ( 代表値の活用 ) 第 4 回 比較して 2 変数の関係を見る 第 5 回 ビジネスにおける比較 1( 概要 ) 第 6 回 ビジネスにおける比較 2( 適切な A/B テストの活用 ) 42

43 公平な比較を行うためのロジック 全ての要因について両標本が等しい必要がある 要因性別母集団 データの全種類が両標本に同率で含まれるようにする 43

44 ランダムサンプリングの紹介 データから標本をランダムに ( 無作為に ) 抽出すること データの各種類が選択される確率はそれぞれの頻度と等しい 全種類が両標本に同率で含まれることを確保できる 母集団 ランダムサンプリング コイントスを実施 標本 A 表 裏 標本 B ランダムにサンプルを抽出後サンプルを標本 A 標本 Bに無作為に振り分ける 今回はコイントスで振り分けを決める 例コイン表 : 標本 A コイン裏 : 標本 B ランダムサンプリングにより 公平な比較を実現できる 44

45 ビジネスにおける比較まとめ 全ての要因について両標本が等しい必要がある 標本はすべての要因について同一である必要がある 分布が偏らないようランダムサンプリングを心がける サンプル抽出 従来 WEB 母集団 サンプル抽出 WEB 改善後 正しいサンプリングと比較を実施することで より正確に A/B テストの効果を測定できる 45

46 次週のテーマ 次週は 分析の具体的手法 お疲れ様でした! 46

対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1

対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1 社会人のためのデータサイエンス演習 対面学習 : 講義 各週の振り返りと PPDAC サイクルの注意点 対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1 コンテンツ 1 第 1 週 ~ 第 4 週の振り返り 2 第 5 週の振り返り

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード] データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第1章 母集団と統計データ 本章では, ビジネスのさまざまな場面において統計データを扱ううえで, もっとも基本的事項となる母集団の概念と統計データの種類についてまとめています 母集団の統計的性質を調べるためにとても重要な概念であるサンプリングについて述べるとともに, ランダムサンプリングの重要性についても説明します 統計分析の考え方 ビジネスの多くの場面において, 統計分析は重要です この場合の統計分析とは,

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C> 統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

_KyoukaNaiyou_No.4

_KyoukaNaiyou_No.4 理科教科内容指導論 I : 物理分野 物理現象の定量的把握第 4 回 ( 実験 ) データの眺め ~ 統計学の基礎続き 統計のはなし 基礎 応 娯楽 (Best selected business books) 村平 科技連出版社 1836 円 前回の復習と今回以降の 標 東京 学 善 郎 Web サイトより データ ヒストグラム 代表値 ( 平均値 最頻値 中間値 ) 分布の散らばり 集団の分布

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 度数分布とヒストグラム データとは 複雑な確率ゲームから生まれたと考えてよい データ分析の第一歩として データの持つ基本的特性を把握することが重要である 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える データが母集団からのランダムサンプルならば 母集団についての推測を行う 度数分布とヒストグラムの作成

More information

講義内容 第 週 データサイエンスとは 第 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎 (

講義内容 第 週 データサイエンスとは 第 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎 ( 社会人のためのデータサイエンス演習 第 3 週 : 分析の具体的手法第 回 : クロス集計の軸設定と見方講師名 : 大黒健一 講義内容 第 週 データサイエンスとは 第 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 ) 第 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎

More information

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと .5 Gage R&R による解析.5.1 Gage R&Rとは Gage R&R(Gage Repeatability and Reproducibility ) とは 測定システム分析 (MSA: Measurement System Analysis) ともいわれ 測定プロセスを管理または審査するための手法である MSAでは ばらつきの大きさを 変動 という尺度で表し 測定システムのどこに原因があるのか

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

データの種類とデータの分布

データの種類とデータの分布 データの種類とデータの分布 統計基礎の補足資料 218 年 6 月 4 日金沢学院大学経営情報学部藤本祥二 2( 教科書 P.52) データのばらつき 分布について データの分布データ全体のばらつき具合 ( 広がり具合 ) 等の全体的な様子をとらえたもの 度数 ( 頻度数 ) ある項目, 又はある値, 又は範囲にデータがどれくらい存在するのかを頻度で示したもの 度数分布度数に関するデータ全体の様子

More information

0415

0415 今回の授業の狙い 基本的な統計量を求め 活用できること 章統計量と確率分布のと確率分布の活用 part 統計解析で用いる代表的な確率分布の特徴を 把握すること 統計解析の全体像 統計解析での注意点 ()( サンプリング サンプル 測定 母集団 何らかの意味で同質性が期待できるものの集団 e 日本人男性同じ条件で作った製品 母集団 推定 アクション 事実に基づく判断 データからモノをいう データ解析

More information

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説 第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

3章 度数分布とヒストグラム

3章 度数分布とヒストグラム 3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft PowerPoint - A1.ppt [互換モード] 011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)

More information

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学研究法 Ⅱ のスクーリングを未受講で 心理学統計法 に履修科目を変更された方は 本科目の学習を行ってください

More information

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では

More information

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx

Microsoft PowerPoint - 14都市工学数理ノンパラ.pptx 都市工学数理 浅見泰司 東京大学大学院工学系研究科教授 Yasushi Asami 1 0. 統計学的検定の基本 母集団と標本 世論調査では 日本人全員に聞くというのは事実上不可能 そこで 日本人全員 (= 母集団 ) から 一部 (= 標本 ) を選んで そこで得られた傾向 (= 仮説 ) が日本人全体にもある程度の信頼性で成り立つかどうかを考える (= 検定 ) 注意 サンプリングの方法 ランダムサンプリングが基本

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

【指導のポイント】

【指導のポイント】 教材 -B-() の解答資料の活用 分析 さいひんち 度数 最頻値 の解決のために さいひんち最頻値の相対度数の求め方 説明文 相対度数は ( 相対度数 )=( 最頻値の階級の度数 ) ( ( ア ) ) で求めることができる 最頻値の階級の度数は ( イ ), ( ア ) は, ( ウ ) であるから求める ( イ ) 相対度数は, =.9 となる ( ウ ) ( ア ) 度数の合計 ( イ )

More information

高齢者におけるサルコペニアの実態について みやぐち医院 宮口信吾 我が国では 高齢化社会が進行し 脳血管疾患 悪性腫瘍の増加ばかりでなく 骨 筋肉を中心とした運動器疾患と加齢との関係が注目されている 要介護になる疾患の原因として 第 1 位は脳卒中 第 2 位は認知症 第 3 位が老衰 第 4 位に

高齢者におけるサルコペニアの実態について みやぐち医院 宮口信吾 我が国では 高齢化社会が進行し 脳血管疾患 悪性腫瘍の増加ばかりでなく 骨 筋肉を中心とした運動器疾患と加齢との関係が注目されている 要介護になる疾患の原因として 第 1 位は脳卒中 第 2 位は認知症 第 3 位が老衰 第 4 位に 高齢者におけるサルコペニアの実態について みやぐち医院 宮口信吾 我が国では 高齢化社会が進行し 脳血管疾患 悪性腫瘍の増加ばかりでなく 骨 筋肉を中心とした運動器疾患と加齢との関係が注目されている 要介護になる疾患の原因として 第 1 位は脳卒中 第 2 位は認知症 第 3 位が老衰 第 4 位に関節疾患 5 位が骨折 転倒であり 4,5 位はいずれも運動器が関係している 骨粗しょう症のメカニズムの解明

More information

stat-base_ppt [互換モード]

stat-base_ppt [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 髙木廣文東邦大学看護学部国際広域保健分野 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは? アンケート調査で学生のアルバイト実施を調べる

More information

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 中学校学習指導要領解説数学統計関係部分抜粋 第 3 節各学年の内容 [ 第 1 学年 ] D 資料の活用 (1) 目的に応じて資料を収集し, コンピュータを用いたりするなどして表やグラフに整理し, 代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする アヒストグラムや代表値の必要性と意味を理解すること イヒストグラムや代表値を用いて資料の傾向をとらえ説明すること 用語 記号

More information

C3 データ可視化とツール

C3 データ可視化とツール < 第 3 回 > データ可視化とツール 統計数理研究所 中野純司 nakanoj@ism.ac.jp データ可視化とツール 概要 データサイエンティスト育成クラッシュコース データサイエンティストとしてデータ分析を行う際に必要な可視化の考え方と それを実行するためのフリーソフトウェアを紹介する 1. はじめに 2. 静的なグラフィックス 3. 動的なグラフィックス 4. 対話的なグラフィックス 1.

More information

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378> 小学校学習指導要領解説算数統計関係部分抜粋 第 3 章各学年の内容 2 第 2 学年の内容 D 数量関係 D(3) 簡単な表やグラフ (3) 身の回りにある数量を分類整理し, 簡単な表やグラフを用いて表したり読み取ったりすることができるようにする 身の回りにある数量を分類整理して, それを簡単な表やグラフを用いて表すことができるようにする ここで, 簡単な表とは, 次のような, 観点が一つの表のことである

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

stat-base [互換モード]

stat-base [互換モード] データ解析の基礎ーデータの分類とまとめ方ー 統計学と統計について 統計学 statistics とは何か? 高木廣文東邦大学看護学部国際保健看護学研究室 統計 : 統計をとる (?) 統計学 : 統計学を使う (?) e-mail: halwin@med.toho-u.ac.jp http://homepage2.nifty.com/halwin/takagi.html 1 2 統計をとる とは?

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 17 回 講義 母平均の区間推定 Part- 016 年 6 14 ( )3 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u toyama.ac.jp website: http://www3.u toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, . 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を

More information

Microsoft Word - apstattext05.docx

Microsoft Word - apstattext05.docx 5 章 群間の量的データの検定 5. 対応のない検定手順例えば 男女の成績を比較しようとして試験を実施した場合 男性の集団 ( 群 ) と女性の集団 ( 群 ) との比較になりますから つの集団に同一人物は 人もいません しかしその試験で英語と国語の平均点を比較する場合 英語と国語を受験した集団には必ず同じ人がいます 前者のような場合を対応のないデータ 後者の場合を対応のあるデータと呼びます 対応のあるデータについては特別の処理ができるので

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx

Microsoft PowerPoint - 11統計の分析と利用_1-1.pptx 統計の分析と利用. データとその扱い -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばり データの尺度 -. 二次元のデータ 堀田敬介 散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 0/9/30, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット, =9, =-3, =4, =5, =3, 67 = 箱ひげ図,, 3,

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - statistics pptx 統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email kkarato@eco.u-toyama.ac.j webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:

More information

2015実験ゼロ結果と考察 UP用.pdf

2015実験ゼロ結果と考察 UP用.pdf 記述統計 ( 代表値 ) 結果と Sophia Cognitive Psychology Lab. 総合人間科学研究科博士後期課程 4 年田根健吾 記述統計とはある集団の身長 165 cm 150 cm 160 cm 175 cm 145 cm 180 cm 165 cm 1: 記述統計 平均身長 162.5 cm 身長の標準偏差 5.0 代表値 散布度 ( 後で説明します ) データの傾向や性質をわかりやすくまとめる

More information

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル 春学期統計学 I 記述統計と推測統計 担当 : 長倉大輔 ( ながくらだいすけ ) 1 本日の予定 本日はまず記述統計と推測統計の違い 推測統計学の基本的な構造について説明します 2 記述統計と推測統計 統計学とは? 与えられたデータの背後にある 特性 法則 を 検証 発見 分析 するための手法の開発 その応用などに関わる学問の事です 3 記述統計と推測統計 データの種類 データの種類はおおまかに

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

Microsoft Word - SPSS2007s5.doc

Microsoft Word - SPSS2007s5.doc 第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定 異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

<89C88CA B28DB88C8B89CA955C8F4390B394C E786C73782E786C73>

<89C88CA B28DB88C8B89CA955C8F4390B394C E786C73782E786C73> 表 -1 行動項目 過去 1 年間の保健師活動における 活動の必要性と成果を見せる行動項目 の到達度 活動の必要性を見せる行動項目 1. 個人 / 家族の健康課題の明確化において根拠のある方法論に基づいてアセスメントした記録を示す 2. 集団 / 組織の健康課題の明確化において根拠のある方法論に基づいてアセス メントした記録を示す. 地域の健康課題の明確化において根拠のある方法論に基づいてアセスメントした記録を示す.

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

Blue circle & gradation

Blue circle & gradation 数学 1 に関連した統計教材 Takakazu Sugiyama http://www.statistics.co.jp/ これは 2013 年に東京都教育委員会の要請による講演のパワーポイントです. データの要約をしよう! 1.1 データの性格 日本人の死因を集積したデータ アンケートや問診票にある性別 薬局の満足度を 非常に満足 やや満足 どちらともいえない やや不満 非常に不満 によって評価したデータなどのように

More information

Microsoft Word - apstattext03.docx

Microsoft Word - apstattext03.docx 3 章質的データの検定これから検定の手法を順番に詳しく見て行きましょう 最初は質的データの検定についてです 質的データの検定は構成比率の検定で アンケートで賛成が過半数であるかとか 賛成の比率が男女で異なるかといったことを調べます これからは最初に例題を置き それについて College Analysis による回答を示します 理論のところではその検定のために使った公式を簡単に表示しますが 必要なければ無視してもらって結構です

More information

散布度

散布度 散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (

More information

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - -

統計学 Ⅰ(8) 累積度数 : ある階級以下に含まれる度数の合計 階級 度数 相対度数累積度数 累積相対度数 点以上 ~ 点未満.. ~.. ~. 7. ~ 6..6 ~. 6.8 ~ ~ ~ ~ ~.. ~.. 合計. - - 統計学 Ⅰ(8) 章度数分布とローレンツ曲線. 度数分布表 教科書 8- ページ. 度数分布表 () データの表し方 () 度数分布表 () 度数, 相対度数, 累積度数. ヒストグラム () ヒストグラム () 階級の決め方 () ヒストグラムにおける階級幅の調整 () クロス集計. ローレンツ曲線とジニ係数 () 所得格差の問題 () ローレンツ曲線 () ジニ係数 () データの表し方 例 :

More information

不偏推定量

不偏推定量 不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)

More information

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074>

<4D F736F F F696E74202D B835E89F090CD89898F4B81408F6489F18B4195AA90CD A E707074> 重回帰分析 (2) データ解析演習 6.9 M1 荻原祐二 1 発表の流れ 1. 復習 2. ダミー変数を用いた重回帰分析 3. 交互作用項を用いた重回帰分析 4. 実際のデータで演習 2 復習 他の独立変数の影響を取り除いた時に ある独立変数が従属変数をどれくらい予測できるか 変数 X1 変数 X2 β= 変数 Y 想定したモデルが全体としてどの程度当てはまるのか R²= 3 偏相関係数と標準化偏回帰係数の違い

More information

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63> 第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(

More information

スライド タイトルなし

スライド タイトルなし アンケート調査とデータ集計 データ集計編 32 次のようなアンケート調査を実施した ( ことにする ) 生活実態調査 調査の主旨 : 生活満足度と経済力の関係を調べるためにアンケートを実施します なお 本目的以外にデータは利用しません ご協力をお願いします 整理番号 ( ) Q.1 自分の性別に 印をつけて下さい 1. 男 2. 女プロフィール項目 Q.2 年齢を記入して下さい ( ) 才質的データ

More information

代表値

代表値 代表値 統計基礎の補足資料 2019 年 6 月 13 日金沢学院大学経営情報学部藤本祥二 量的データの分析 (P.78~119) 分布全体の様子を知るのが目的 (P.99のまとめ) 1. 単峰性,2. ピークの位置と散らばり具合, 3. 左右対称性,4. 外れ値の存在 度数分布, ヒストグラムを描き形状を見る (P.78~P.91) 数値で分布を要約する (P.99~P.117) 基本統計量 :

More information

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5

これに対する度数分布表は次のようになる : 階級 階級値 度数 相対度数 累積度数 累積相対度数 ( 以上 ) ~ ( 未満 ) 0 ~ (3/50 = ) ~ (2/50 = ) ~ (6/5 1. 分布を把握する ( 度数分布表 ヒストグラム ) 本章の目標 度数分布やヒストグラムの必要性やその方法を理解する 度数分布やヒストグラムを用いて, 分布の様子を調べることができる 相対度数や累積相対度数を用いて, 異なるグループの分布を比較することができる Key Words: 階級 度数 相対度数 度数分布 ヒストグラム 1. 度数分布表 ( 量的 ) 変数 ( 例 : 世帯人員数 ) がとる値の範囲をグループ分けしたそれぞれの区間を階級という.

More information

Microsoft Word - Stattext11.doc

Microsoft Word - Stattext11.doc 章母集団と指定値との量的データの検定. 検定手順 前章で質的データの検定手法について説明しましたので ここからは量的データの検定について話します 量的データの検定は少し分量が多くなりますので 母集団と指定値との検定 対応のない 群間の検定 対応のある 群間の検定 と 3つに章を分けて話を進めることにします ここでは 母集団と指定値との検定について説明します 例えば全国平均が分かっている場合で ある地域の標本と全国平均を比較するような場合や

More information

高生 ) の傾向を推測することが可能となるが, そのような作業には膨大な時間と費用が必要であり, リアルタイムに教育現場にフィードバックすることは困難である また, 教育現場にとっては, 日本全体の傾向に対する推測統計よりも, 教員が直接担当するクラスの傾向の分析, つまり, 記述統計が優先される

高生 ) の傾向を推測することが可能となるが, そのような作業には膨大な時間と費用が必要であり, リアルタイムに教育現場にフィードバックすることは困難である また, 教育現場にとっては, 日本全体の傾向に対する推測統計よりも, 教員が直接担当するクラスの傾向の分析, つまり, 記述統計が優先される 間隔尺度と順序尺度の観点から考えるアンケート データの解析手法 代表値 可視化 検定に基づく相違点の抽出 井上聡 環太平洋大学次世代教育学部 概要授業改善を図るうえにおいて, 担当クラスへのアンケート調査に基づく効果測定は不可欠な要素である 本研究では, 筆者が行った授業アンケート ( 満足度の推移と心理的欲求の変化 ) をもとにして, 質的 量的, 順序尺度 間隔尺度, 離散変数 連続変数の観点から分析を行った

More information

1

1 < 参考資料 1> 想定最大規模降雨に関する地域区分について 我が国は 東西南北に広い上 脊梁山脈など地形特性もあり 例えば日本海側 太平洋側等といった地域ごとに気温や降雨などの気象の状況は異なる このため これまで観測された降雨データを用いて想定最大規模降雨を設定するにあたり 降雨の特性の類似する地域に区分することとする 気象現象に関する地域区分については 例えば地域別比流量図 ( クリーガー曲線

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63> 第 5 回統計的推定 実験計画学 A. 統計的推定と検定母集団から無作為抽出した標本から母集団についてなんらかの推論を行う. この場合, 統計から行う推論には統計的 ( ) と統計的 ( ) の 2つがある. 推定統計的に標本の統計量から母集団の母数 ( 母平均, 母標準偏差など ) を推論することを統計的推定という. 例 : 視聴率調査を 200 人に対して行い, 番組 Aの視聴率を推定した. 検定統計的に標本の統計量から母数に関する予想の真偽を検証することを統計的検定という.

More information

初めて学ぶ統計-公務員のためのオンライン講座-コースポイント集

初めて学ぶ統計-公務員のためのオンライン講座-コースポイント集 初めて学ぶ統計 公務員のためのオンライン講座 コースポイント集 第 1 章統計とは第 章データの性質と代表値第 3 章データの分布と相関第 4 章データの見方第 5 章行政運営のための公的統計 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 初めて学ぶ統計 公務員のためのオンライン講座 では上記の内容を学習しました

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

untitled

untitled 分析の信頼性を支えるもの データ評価のための統計的方法 確率分布と平均値の推定 検定 田中秀幸 1 はじめに前回は, 統計的手法を適用するために意味のあるデータをどのように取得するのかについて, 母集団と標本について, 期待値 分散 標準偏差について解説した 今回は, 統計的推定 検定の基礎となる確率分布とその確率分布を用いた推定 検定について解説する 2 確率分布 測定データを取得したとき, そのデータのばらつきを視覚的に表すために,

More information

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

Microsoft PowerPoint - 10統計の分析と利用_1.pptx 統計の分析と利用 00/9/4 統計の分析と利用. データとその扱い 堀田敬介 -.. 一次元のデータ度数分布 ヒストグラム 幹葉プロット 箱ひげ図代表値と散らばりデータの尺度 -.. 二次元のデータ散布図 クロス集計二次元データの関係 : 相関係数 相関比 連関係数 00/9/4, Fri.~ -. 一次元のデータ 度数分布 ヒストグラム 幹葉プロット 箱ひげ図 (,,, ) 個 L,, 3, 4,

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0

統計学 Ⅱ(06) 0 章 0 章 統計学の基本的な考え方 データ = 母集団から抽出された標本とみなす 実際に標本抽出されたデータ 視聴率, 失業率 そうでないデータ GDP, 株価, 為替レート, 試験の得点 このようなデータも母集団からの標本とみなす ( 母集団を想定する ) cf. 例題 0 統計学 Ⅱ(06) 0 章 0 章 0 章標本抽出と標本分布. 母集団と標本 () 視聴率調査 () 有限母集団と無限母集団 (3) データと母集団. 標本抽出法 () 全数調査と標本調査 () 無作為抽出と有意抽出 (3) 単純無作為抽出法 (4) 層別抽出法 (5) 多段抽出法 (6) 系統抽出法 (7) その他の抽出法 3. 標本平均 の標本分布 () 標本平均の標本分布の例 () 標本平均

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,, (1 C205) 4 8 27(2015) http://www.math.is.tohoku.ac.jp/~obata,.,,,..,,. 1. 2. 3. 4. 5. 6. 7.... 1., 2014... 2. P. G., 1995.,. 3.,. 4.. 5., 1996... 1., 2007,. ii 2. F. ( ),.. 3... 4.,,. 5. G., L., D. ( )

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63> 単元観 中学校学習指導要領では 目的に応じて資料を収集し, コンピュータを用いたりするなどして表やグラフに整理し, 代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする と示されている この内容を受け, 本単元では, 資料を収集, 整理する場合には, 目的に応じた適切で能率的な資料の集め方や, 合理的な処理の仕方が重要であることを理解すること, ヒストグラムや代表値などについて理解し,

More information

1. 推計の概要 ブログ SNS 市場の市場規模の現状や将来動向について 推計を実施 具体的には ブログ SNS 市場及び関連市場の定義を行い それぞれについて 28 年度の市場規模を推計した また 21 年度の市場規模予測も行った (P3~4 参照 ) 推計に当たり 利用者数や閲覧数といった ブロ

1. 推計の概要 ブログ SNS 市場の市場規模の現状や将来動向について 推計を実施 具体的には ブログ SNS 市場及び関連市場の定義を行い それぞれについて 28 年度の市場規模を推計した また 21 年度の市場規模予測も行った (P3~4 参照 ) 推計に当たり 利用者数や閲覧数といった ブロ ブログ SNS の経済効果の推計 平成 21 年 7 月 総務省情報通信政策研究所調査研究部 1. 推計の概要 ブログ SNS 市場の市場規模の現状や将来動向について 推計を実施 具体的には ブログ SNS 市場及び関連市場の定義を行い それぞれについて 28 年度の市場規模を推計した また 21 年度の市場規模予測も行った (P3~4 参照 ) 推計に当たり 利用者数や閲覧数といった ブログ SNS

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

基礎統計

基礎統計 基礎統計 第 2 回講義資料 講義資料 テキスト 入門統計解析 倉田博史 星野崇宏, 新世社,2009. (2500 円 + 税 ) スライド資料 http://lecture.ecc.u-tokyo.ac.jp/~candoma/ 基礎統計 ( 16) にてスライド資料 (PDF ファイル ) 学内の PC 端末からアクセスするには 情報教育棟にある PC 端末で Safari を起動すると 講義用

More information