ビッグデータ利活用入門

Size: px
Start display at page:

Download "ビッグデータ利活用入門"

Transcription

1 解析力 データ分析手法とツール

2 目的 統計の理論ではなく その使い方や意義を学習するモノとして データ分析のニーズに応じたデータの性質 および代表的な統計的手法を学習すること データ分析に関わる ICT 環境 ツールを理解すること

3 目標 データ利活用の方針とシナリオに整合したデータ分析の運用を計画することができる データ分析の目的に応じた分析手法の選択を行うことができる データ分析の目的との整合を検討することができる データの特性を理解した分析手法を選択することができる データ利活用を行うツールの特徴を説明することができる

4 前提 数値データを使用した分析を行うために 中学校数学程度の四則演算知識を有すること Microsoft Excel 等の集計 表計算ソフトの使用経験を有すること

5 目次 ( データ分析手法とツール ) 1. なぜデータ分析が必要なのか 2. 目的にあったデータ分析を選ぶには 3. 全体像を把握する分析手法 4. 比較して判断する分析手法 5. 仮説検証を使った分析手法 6. 知識を発見する分析手法 7. データ分析とICT 8. まとめ 9. その他 参考

6 1. なぜデータ分析が必要なのか 目標 ビッグデータを利活用するためには データ分析手法とツールの使い方や意義が大切であることを認識する データを用いた分析の結果が意思決定に与える影響を説明することができる

7 1. なぜデータ分析が必要なのか 1.1. データ分析の使い方と意義 1.2. データ分析する背景

8 1.1. データ分析の使い方と意義 ビジネスを成功させるためには 裏付けとなるデータが必要 ビジネスへのデータ利活用の導入 ( 企画 計画 ) 目的の明確化 シナリオの立案 シナリオの有効性評価 実行判断 環境準備 ビジネス展開 ( 運用 ) オペレーションの設計 ビジネスでの実行 施策判断 業務の実施 結果の確認 施策の検討 施策の実行 ICT データの棚卸 データの収集 データの蓄積 データの分析 データの収集 データの蓄積 データの分析 データだけを集めてもビジネスに利用できるデータにはならない 分析手法 ツールの使い方を知ることが大切

9 1.2. データ分析をする背景 データ分析が決定を促す いくつか案がある 方策の決定 適切な情報がないと決められない 解決すべき問題 課題 適切な情報を得るには データ分析が必要 データ分析手法

10 ( 参考 ) 意思決定モデル どのような考え方で意思決定がなされるのかを知ることで 意思決定に必要な情報が理解ができ データ分析手法を選択しやすくなる アンゾフの意思決定モデル 戦略的意思決定トップ マネジメント 管理的意思決定ミドル マネジメント 業務的意思決定ロアー マネジメント 経営職層が決定すべき 企業目標や自社ドメインの選択等が挙げられる 企業全体に関わる重要なテーマが対象となる 決定が企業に与える影響が大きい 管理職層が決定すべき組織構造の決定や経営資源の調達等が挙げられる 経営層が決定した方針を受けて 担当する部門での実行を行うための意思決定を行う 戦略的意思決定と業務的意思決定の中間に位置する 現場に近い層が決定すべき 経営資源の配分や日常の業務方針の決定等が挙げられる 実際に業務を遂行する際の問題が対象となる 日常的に繰り返され 対応も定型的であることが多い 決定が企業に与える影響は小さい

11 考えてみましょう データ分析は なぜ必要なのでしょうか?

12 2. 目的にあったデータ分析を選ぶには 目標 目的とデータ分析の種類を説明できるようになる

13 2. 目的にあったデータ分析を選ぶには 2.1. データ分析の用途 2.2. 目的とデータ分析手法との関係

14 2.1. データ分析の用途 全体像を把握する A B 比較して判断する 仮説を検証する 知識を発見する

15 2.2. 目的とデータ分析手法との関係 (1/4) 全体像を把握する フォーカスしたいところを特定する 度数分布とヒストグラム どのような状況になっているかを特定する 統計的なデータから どのような予測が立つかを特定する 一部のデータ ( 標本 ) から全体像を把握する 一部のデータ ( 標本 ) の平均から 全体の平均を推測する 平均と標準偏差 正規分布 標本調査 ( 全体像の推測 ) 標本平均

16 2.2. 目的とデータ分析手法との関係 (2/4) A B 比較して判断する 複数のデータの関係性から 隠れた特徴を抽出する 相関関係

17 2.2. 目的とデータ分析手法との関係 (3/4) 仮説を検証する 相関関係のある一部のデータから 全体像を推測する 散布図と回帰分析 2 つ以上の複合した相関関係のある一部のデータから 全体像を推測する 重回帰分析 そのままでは計算できない質を表したデータを分析する 質的データの取扱い

18 2.2. 目的とデータ分析手法との関係 (4/4) 知識を発見する テキスト情報から一定の知見や発想を得る テキストマイニング 突出したデータに着目し 想定外を特定する 外れ値の取扱い

19 確認テスト データの分析用途として大きく 4 つに分類されます 以下の空欄をうめてください を把握する比較して判断する仮説を検証する知識をする

20 3. 全体像を把握する分析手法 目標 全体像を把握する分析手法にどのようなモノがあるかを 説明できるようになる

21 3. 全体像を把握する分析手法 3.1. 全体像を把握する分析手法の紹介 3.2. 度数分布とヒストグラム 3.3. 平均と標準偏差 3.4. 正規分布 3.5. 標本調査と標本平均

22 3.1. 全体像を把握する分析手法の紹介 度数分布とヒストグラム 平均と標準偏差 正規分布 標本調査 ( 全体像の推測 ) 標本平均

23 3.2. 度数分布とヒストグラム 度数分布とはデータを一定のルールで整理し データがどのような値を中心にしてどのようなばらつき方をしているのかを調べることで 全体データの特徴や性質などを理解する手法です ヒストグラムとはばらつきの分布状態 ( 度数分布 ) を棒グラフで表示したもの 他の表現方法として 幹葉図や箱ひげ図があります 度数分布表 年齢 ( 中央値 ) 人数 21~25(23) 1 26~30(28) 4 31~35(33) 9 36~40(38) 16 41~45(43) 21 46~50(48) ヒストグラム

24 8 時 9 時 10 時 11 時 12 時 13 時 14 時 15 時 16 時 17 時 18 時 19 時 度数分布とヒストグラムの利用イメージ フォーカスしたいところを特定する データ 利用イメージ 購入履歴 ( 金額 販売日時 ) 販売日時 金額 4/1 8: /1 8: /1 12: /1 12: /1 19: /1 19: 度数分布表 時間帯人数平均金額 8 時 時 時 時 時 時 時 時 時 時 時 時 ヒストグラム 1 日にピークが 2 回あり それぞれの客単価平均は 12 時 :812 円 18 時 :843 円

25 3.3. 平均と標準偏差 平均とはデータ全体を代表する値です 他に 最頻値 中央値でも表す方法もあります 平均値 = データの値の総計データ数 分散とはデータのバラツキを表します 標準偏差とは データのバラツキ度合いを異なるデータ間で比較できる 平均値からのバラツキの幅を測定できる という特徴を用いて データが示す傾向や性質を把握できます 平均 平均との差の 2 乗 の平均 標準偏差 = データの値 平均 2 の総計 データの数 分散の平方根

26 平均と標準偏差の利用イメージ どのような状況になっているかを特定する データ 6 月前半の来店者数 月日 A 店 B 店 C 店 D 店 6 月 1 日 月 2 日 月 3 日 月 4 日 月 5 日 月 6 日 月 7 日 月 8 日 月 9 日 月 10 日 利用イメージ A 店 B 店 C 店 D 店 平均 標準偏差 平均と標準偏差から分かる状況は バラツキ 高い 平均 低い 小さい B 店 C 店 大きい A 店 D 店 来店者数の平均をみると A 店がトップだが バラツキも考慮すると B 店が優れているとわかった

27 3.4. 正規分布 正規分布とは発生確率の高い平均値 ( 中央値 ) を中心として 左右対象に確率が低くなっていく確率分布のことです 正規分布の分布図は 下図のような釣鐘状になります データが正規分布をしていることが想定できる場合 平均値と標準偏差値がわかれば データの範囲を推定することができます y 標準偏差が大きい = バラツキが大きい 標準偏差 y 標準偏差が小さい = バラツキが小さい 標準偏差 平均値 ( 中心値 ) x 平均値 ( 中心値 ) x

28 正規分布の利用イメージ 統計的なデータから どのような予測が立つかを特定する 正規分布を利用して 過去実績の納入日数から 8 割以上の確率で納品できるバッファ期間を特定したい 使用するデータ 利用イメージ 正規分布曲線 過去実績の納入日数製品 Aの納期日数 10 日 8 日 12 日 10 日 15 日 84% が 14 日以内 偏差値 率 50% 16% 納期 10 日 14 日 過去実績の納期日数を正規分布にあてはめると 偏差値 60 以上 (16%) で 4 日以上遅れるとわかった 14 日 ( 平均 10 日 + バッファ 4 日 ) あれば 8 割以上の確率で納品できると特定できた

29 3.5. 標本調査と標本平均 標本調査とは大量データから一部を入手 観測した場合に その背後にある大量データを推測する手段として仮説検定の考え方による統計的推定の手法です 標本 ( サンプル ) 無作為抽出 統計的推測 母集団 ( 調査対象となる全体 ) 標本平均とは標本調査から得られた情報から母集団の傾向を推測する手法の 1 つ 母集団の平均を推測するために標本データの平均値を利用する方法です 標本平均 = ( 抽出した標本データの合計 ) ( 抽出した標本データ数 )

30 標本調査の利用イメージ 一部のデータ ( 標本 ) から全体像を把握する データ市在住のモニターへのアンケート結果標本 ( サンプル ) 無作為抽出 利用イメージ 母集団 市在住モニター =500 人 アンケート結果 ジムに興味のあるモニター 統計的推測 標本の取り出し方で結果は変わるため 誤差が含まれる 市在住者 =15 万人 見込み顧客 モニターへのアンケート結果をもとにした推測から スポーツジムの見込み顧客を把握できた

31 確認テスト 全体像を把握する分析手法には何があるか 1 つ答えてください

32 4. 比較して判断する分析手法 目標 比較して判断する分析手法にどのようなモノがあるかを 説明できるようになる

33 4. 比較して判断する分析手法 4.1. 比較して判断する分析手法の紹介 4.2. 相関関係 4.3. 相関関係と因果関係

34 4.1. 比較して判断する分析手法の紹介 A B 相関関係

35 4.2. 相関関係 相関関係とは 一方の値が変化すれば 他方の値も変化するという 2 つの値の関連性 正の相関 2 つのデータのうち一方が増加すると もう一方も増加 負の相関 2 つのデータのうち一方が増加すると もう一方が減少 y 正の相関 ( 右上がり ) 負の相関 ( 右下がり ) 無相関 y y 増 減 増 増 x x x

36 相関係数 相関係数とは相関係数は -1 から 1 までの値を取り 0 に近いほど相関が弱く 1 に近いほど相関が強くなります 共分散を一方の標準偏差と他方の標準偏差をかけあわせた値で割った値のことです 完全な負の相関がある 相関がない 完全な正の相関がある y y y y y x x x x x

37 相関関係の利用イメージ (1/2) 複数のデータの関係性から 隠れた特徴を抽出する 使用するデータ 顧客満足度アンケートの結果 ( 全体と項目別の5 段階評価 ) 合総合設備設備設備設備設備設備図開催曜日アクセス開始時間案内図終了時間アクセス開催曜日案内図開始時間開催曜日終了時間開始時間終了時間足度満足度 ( 電源等 ) ( スクリーン ) ( 電源等 ) ( スクリーン ) ( 電源等 ) ( スクリーン ) 3回答者 平均 回答者 回答者 回答者 平均 回答者 回答者 平均 ~1.0 2回答者 回答者 ~ 回答者 回答者 ~ 平均値 相関係数満足度 a. 会場へのアクセス b. 会場内案内利用イメージ相関係数 0.76 満足度 3.0 a. c. 会場へのアクセスセミナーの開催曜日 b. d. 会場内案内セミナーの開始時間 相関係数 満足度 a. c. e. 会場へのアクセスセミナーの開催曜日セミナーの終了時間 b. d. f. 会場設備会場内案内セミナーの開始時間 ( 電源 ネットワーク等 ) c. e. g. 会場設備セミナーの開催曜日セミナーの終了時間 ( スクリーン 椅子等 ) d. f. 会場設備セミナーの開始時間 ( 電源 ネットワーク等 ) e. g. 会場設備セミナーの終了時間 ( スクリーン 椅子等 ) f. 相関係数の絶対値会場設備 ( 電源 ネットワーク等相関係数の解釈 ) g. 会場設備 1.0 ( スクリーン 椅子等完全に相関がある ) 強い相関がある相関がある低い相関がある 0~0.2 ほとんど相関がない 0 相関がない 総合満足度と相関が強い かつ満足度が低い 項目 = 効果が出そうな 項目を見つけることができる

38 相関関係の利用イメージ (2/2) 複数のデータの関係性から 隠れた特徴を抽出する 使用するデータ 総合満足度と各項目の相関 相関係数満足度 a. 会場へのアクセス b. 各項目の満足度の平均会場内案内相関係数 0.76 満足度 3.0 a. c. 会場へのアクセスセミナーの開催曜日 b. d. 会場内案内セミナーの開始時間 相関係数 満足度 a. c. e. 会場へのアクセスセミナーの開催曜日セミナーの終了時間 b. d. f. 会場設備会場内案内セミナーの開始時間 ( 電源 ネットワーク等 ) c. e. g. 会場設備セミナーの開催曜日セミナーの終了時間 ( スクリーン 椅子等 ) d. f. 平均会場設備セミナーの開始時間 ( 電源 ネットワーク等 ) e. g. 会場設備セミナーの終了時間 ( スクリーン 椅子等 ) f. 平均会場設備 ( 電源 ネットワーク等 ) g. 会場設備 ( スクリーン 椅子等 ) 平均 総合満足度 利用イメージ 領域 4: 現状の維持 領域 3: 改善 アクセス 開始時間 領域 1: 重点的に維持 設備 領域 2: 早急に改善 相関係数 店舗改善の項目について 4 つの領域に分けて整理することで 対応すべき事項の優先度や実行判断の検討がしやすくなった

39 4.3. 相関関係と因果関係 相関関係とは一方の値が変化すれば 他方の値も変化するという 2 つの値の関連性 因果関係とは 2 つ以上の事柄の間に原因と結果の関係があると言い切れる関係 相関があっても因果があるとは限らない 相関関係 = 因果関係 ではない 相関関係 因果関係 変化 変化 原因 結果 連動 時間的先行性変数間の結びつきの強さ関連の普遍性関連の整合性

40 考えてみましょう 相関関係があると思われる事例を 1 つ挙げてください

41 5. 仮説検証を使った分析手法 目標 仮説検証を使った分析手法にどのようなモノがあるかを 説明できるようになる

42 5. 仮説検証を使った分析手法 5.1. 仮説検証を使った分析手法の紹介 5.2. 仮説検証の特徴 5.3. 回帰分析と重回帰分析 5.4. 質的データの取扱い

43 5.1. 仮説検証を使った分析手法の紹介 散布図と回帰分析 重回帰分析 質的データの取扱い

44 5.2. 仮説検証の特徴 データ分析から類推する 仮説の正しさを証明するには 統計的推測などのデータ分析から類推することが必要です 仮説がないとデータ分析手法が決まらない どのような結果を求めるのか ( 仮説 ) を立てないと データ分析手法を決定することは 困難です 量的データ or 質的データを理解する 取り扱うデータの性質 ( 量的データ or 質的データ ) を理解することが重要です

45 5.3. 回帰分析と重回帰分析 回帰分析とは 原因となる数値 と 結果となる数値 の関連性を 統計的手法を用いて調べる方法のことです 原因となる数値 ( 説明変数 ) の変化によって 結果となる数値 ( 目的変数 ) が変化することを推測できます これによって仮説を立てることが可能になります 式 Y = a + bx Y ( 結果となる数値 ) 回帰線の誤差を最小にするには 差を最小にする a データの分布を 直線に近似すると 他のデータの推測が可能になる 回帰直線 x( 原因となる数値 ) Y = a +bx a: 切片 b: 傾き 重回帰分析とは 1つの目的変数を複数の説明変数で予測しようとする統計的手法のことです 式 Y = a + b1x + b2x + b3x + +bnx

46 入場者 散布図と回帰分析の利用イメージ 相関関係のある一部のデータから 全体像を推測する 仮説 : 気温が上がれば 涼を求めてプールの入場者数が増えるのでは 使用するデータ 昨年度の入場者数の実績データ日別の気温データ 日付 気温 ( ) 入場者 8 月 1 日 月 2 日 月 3 日 月 4 日 月 5 日 月 6 日 月 7 日 月 8 日 月 9 日 月 10 日 月 11 日 月 12 日 月 13 日 月 14 日 月 15 日 入場者数 ( 人 ) 利用イメージ y = x R² = 気温と入場者数の散布図をつくると 直線上にデータが並んだ 気温 ( ) 気温 ( ) 気温とプール入場者数の相関を検証して 関連を直線で表し 気温から入場者数の予測ができた

47 重回帰分析の利用イメージ 2 つ以上の複合した相関関係のある一部のデータから 全体像を推測する 仮説 : 気温と降雨確率によって 入場者数が増減するのでは 使用するデータ 昨年度の入場者数の実績データ日別の気温データ 降雨確率 入場者数 ( 人 ) Y 260 利用イメージ 気温と降雨確率と入場者数の 3 次元の散布図をつくると 面上にデータを近似できた 気温 ( ) X 35 イメージです 30 降雨確率 (%) Z 気温 降雨確率 入場者数の相関を検証して 関連を面で表し 入場者数の予測ができた

48 5.4. 質的データの取扱い そのままでは計算できない質を表したデータを分析する データ 量的データ 質的データ 数値の大きさが意味をもつデータ例 ) 売上高 人数 時間 数値の大きさが意味を持たないデータ例 ) 性別 業種 天気 使用するデータ 飲料別の テレビ CM の有無 ウェブ広告の有無 売り上げ本数 利用イメージ 質的データから量的データへ変換し 統計分析ができるデータにした テレビCMテレビウェブ広告 CM ウェブ広告売上本数売上本数 テレビCMテレビウェブ広告 CM ウェブ広告売上本数売上本数 飲料 A 飲料あり A ありなし なし 4,500 4,500 飲料 A 飲料 A , ,500 飲料 B 飲料なし B なしあり あり 3,900 3,900 飲料 B 飲料 B , ,900 飲料 C 飲料あり C ありあり あり 5,800 5,800 飲料 C 飲料 C , ,800 飲料 D 飲料あり D ありなし なし 4,000 4,000 飲料 D 飲料 D ,000 4,000 飲料 E 飲料なし E なしなし なし 3,000 3,000 飲料 E 飲料 E ,000 3,000 飲料 F 飲料なし F なしなし なし 2,800 2,800 飲料 F 飲料 F , ,800 飲料 G 飲料なし G なしあり あり 3,800 3,800 飲料 G 飲料 G , ,800

49 考えてみましょう 仮説分析において データ分析手法を決定する際は 何をもとに検討するとよいでしょうか?

50 6. 知識を発見する分析手法 目標 知識を発見する分析手法にどのようなモノがあるかを 説明できるようになる

51 6. 知識を発見する分析手法 6.1. 知識を発見する分析手法の紹介 6.2. テキストマイニング 6.3. 外れ値の取扱い

52 6.1. 知識を発見する分析手法の紹介 テキストマイニング 外れ値の取扱い

53 6.2. テキストマイニング テキストマイニングとはテキストマイニングとは 大量のテキストデータから 役に立つ知識や情報を見つけ出す分析技術のことです 膨大に蓄積されたテキストデータを単語やフレーズに分解して これらの関係を一定のルールにそって分析することにより 出現頻度や相関関係を把握し 単語の関係や時系列の変化などを抽出することによって 客観的な分析に利用できます 出典 : テキストマイニングによる国土政策評価手法の研究 国土交通省 P11

54 テキストマイニングの利用イメージ テキスト情報から一定の知見や発想を得る 使用するデータ 検索ワード SNS の口コミ 利用イメージ 検索ワード ( 自社 競合 ) と共に特徴的なキーワードを抽出し 出現頻度の高いキーワードを比較 おいしいおいしい 取り組む予定はない 24.3% 自社 無回答 2.7% 既に取り組んでいる 16.2% 取り組む予定はない 19.8% 競合 無回答 2.5% 既に取り組んでいる 37.0% 友達とおいしいメンチカツを 今後取り組む予定である 56.8% 今後取り組む予定である 40.7% 自社 / 他社の評判を分析 ( 比較 ) し 新たな気づきが得られた単語の関係や時系列の変化などを抽出することで さらなる気づきも

55 テキストマイニングの事例 国土交通省の テキストマイニングによる国土政策評価手法の研究 国土に関する社会的心理状態 ( センチメント ) の可視化や 地域や時間軸において特徴的に現れるキーワードの抽出等を行い リアルタイムに国土や土地 不動産市場の情報を捉える手法の可能性が検討された

56 6.3. 外れ値の取扱い 突出したデータに着目し 想定外を特定する 他の値とくらべて 外れている値があるなぜだろう? 外れ値 せっかくデータ分析を行ったとしても あたりまえ や 想定範囲内 というような反応を受けることがあります そのような場合は 想定範囲外 となった値に着目して その値の背景となる事象をとらえることで 新たな仮説を導き出すことにつながることがあります 想定範囲外 となった値のことを 外れ値 と呼びます

57 考えてみましょう 外れ値を分析することの利点には 何が考えられますか?

58 7. データ分析と ICT 目標 情報の活用を目的とするツールの特徴を説明することができる

59 7. データ分析と ICT 7.1. データ分析におけるICTの位置づけ 7.2. 代表的な分析ツール 7.3. データ分析業務の外部委託

60 7.1. データ分析における ICT の位置づけ ビジネスへのデータ利活用の導入 ( 企画 計画 ) ビジネス展開 ( 運用 ) 実行判断 ビジネスでの実行 業務の実施 目的の明確化 シナリオの立案 シナリオの有効性評価 環境準備 オペレーションの設計 施策判断 結果の確認 施策の検討 施策の実行 ICT データの棚卸 データの収集 データの蓄積 データの分析 データの収集 データの蓄積 データの分析

61 7.2. 代表的な分析ツール 集計をメインとするツール 表計算ツールのような数値データの集計 分析 グラフ作成を行うアプリケーション 代表的なツ-ル : Microsoft Excel(Microsoft) 分析がメインで パターン化された分析を行うツール データベースからデータを検索 抽出 加工してレポートにまとめることができるアプリケーション プログラミング知識がなくともデータ集計や分析を行うことができる 代表的なツ - ル : Business Objects(SAP) Dr. Sum EA( ウイングアーク ) 分析がメインで 独自の分析プログラムを開発できるツール 統計解析の専門ツールであり 高度な統計手法の実行が可能であり 分析結果の信頼性も高い GUI が発達したソフトも存在するが 高度な分析や独自手法を用いた分析を行う場合には プログラミング知識を必要とする 代表的なツ - ル : SPSS(IBM) SAS(SAS Institute) MINITAB(MINITAB) R( オープンソフトウェア )

62 7.3. データ分析業務の外部委託 データ分析業務の委託契約時に検討する事項の例 データの提供と返却 成果の帰属 分析委託金の支払 分析の追加 修正 受託者における結果の利用 個人情報の取扱い

63 考えてみましょう 自社で データ分析する ICT ツールを どのように活用して行くのが良いと考えますか?

64 8. まとめ (1/2) データ分析の目的に応じた分析手法の選択を行うことができる データ分析の目的との整合を検討することができる データの特性を理解した分析手法を選択することができる 情報活用を行うツールの特徴を説明することができる

65 8. まとめ (2/2) 発展学習への誘い 今回紹介したデータ分析手法は 基本的な分析手法です データ分析について更に深く学習したい方は 統計解析のトレーニングを受講されることをお勧め致します

66 9. その他 参考 用語 仮説検証 統計解析 用語 解説 仮説の真偽を 事実情報に基づいた実験や観察などを通じて確かめること 統計処理ともいう 統計学の手法で データを解析して客観的に説明する方法

67 考えてみましょう データ分析は なぜ必要なのでしょうか? 適切な情報がないと決められず 適切な情報を得るには データ分析が必要になるから

68 確認テスト データの分析用途として大きく 4 つに分類されます 以下の空欄をうめてください 全体を把握する比較して判断する仮説を検証する知識を発見する

69 確認テスト 全体像を把握する分析手法には何があるか 1 つ答えてください 度数分布とヒストグラム

70 確認テスト 相関関係があると思われる事例を 1 つ挙げてください コーヒーを多く飲む人ほど 死亡率が高い

71 考えてみましょう 仮説分析において データ分析手法を決定する際は 何をもとに検討するとよいでしょうか? 仮説

72 考えてみましょう 外れ値を分析することの利点には 何が考ええられますか? 想定範囲外となった値に着目して その値の背景となる事象をとらえることで 新たな仮説を導き出すことにつながる

73 考えてみましょう 自社で データ分析する ICT ツールを どのように活用して行くのが良いと考えますか? 例 ) まずは Excel から 効果の見込みが持てたら専用の分析ツールの導入を検討する

74 参考文献 Copyright (c) 2014 Ministry of Internal Affairs and Communications All Rights Reserved このテキスト ( 又はカリキュラム ) は 総務省の 高度 ICT 利活用テキスト ( 実践編科目データ分析手法とツール ) に改変を加えたものです

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー 社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を テレビ学習メモ 第 40 回 第 5 章データの分析 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータのを 1 つの数値で表す 2共分散と 3実際のデータからを求める ポイント 1 2 種類のデータのを 1 つの数値で表す 2 種類のデータの散らばりは散布図で見ることができました

More information

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード] R で統計解析入門 (4) 散布図と回帰直線と相関係数 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. の場所に移動し, データを読み込む 4. データ DEP から薬剤

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

第4回

第4回 Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C> 統計の種類 統計学 データの種類データのグラフ化中心を表す特性値 記述統計母集団 ( 調査対象の集団 ) をすべて調査でき その調査結果に基づき データをまとめる統計 推測統計母集団 ( 調査対象の集団 ) をすべて調査できないが 一部のデータから母集団の状況を推測する統計 外れ値 データの中には 他の観測値に比べて著しく離れた値が含まれている場合があります ( 入力ミスではなく ) このような値のことを外れ値といいます

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 ) データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65

More information

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint - データ解析基礎2.ppt データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378> 高等学校学習指導要領解説数学統計関係部分抜粋 第 部数学第 2 章各科目第 節数学 Ⅰ 3 内容と内容の取扱い (4) データの分析 (4) データの分析統計の基本的な考えを理解するとともに, それを用いてデータを整理 分析し傾向を把握できるようにする アデータの散らばり四分位偏差, 分散及び標準偏差などの意味について理解し, それらを用いてデータの傾向を把握し, 説明すること イデータの相関散布図や相関係数の意味を理解し,

More information

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード] データ解析基礎. 正規分布と相関係数 keyword 正規分布 正規分布の性質 偏差値 変数間の関係を表す統計量 共分散 相関係数 散布図 正規分布 世の中の多くの現象は, 標本数を大きくしていくと, 正規分布に近づいていくことが知られている. 正規分布 データ解析の基礎となる重要な分布 平均と分散によって特徴づけることができる. 平均値 : 分布の中心を表す値 分散 : 分布のばらつきを表す値 正規分布

More information

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

スライド タイトルなし

スライド タイトルなし 回帰分析 怪奇な現象を回帰分析で数学的に説明しよう! 回帰分析編 24 相関図 データ X に対応してデータ Y が決まるような (Xi,Yi) のデータの組を考えます これを X-Y 座標にプロットすると 次のような相関図ができます 正の相関相関がない負の相関 相関係数 :X と Y の関係の強さを示す (-1 相関係数 1) プロットの傾きではなく 線上への密集の度合いで強さが決まる 回帰分析

More information

セミナー標準カリキュラム4.0

セミナー標準カリキュラム4.0 Excel を活用してビジネスで勝つよう! 企業研修 公開セミナー 標準カリキュラムのご案内 Ver. 4.0 2014/02/10 ハロー! データマイニング米谷学 http://www.datamining.jp - 1 / 11 - 研修について : この度は 企業研修 公開セミナーについて ご照会をいただきまして まことにありがとうございます Excel を使った データ活用 データ分析をテーマに

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Excelによる統計分析検定_知識編_小塚明_1_4章.indd 第1章 母集団と統計データ 本章では, ビジネスのさまざまな場面において統計データを扱ううえで, もっとも基本的事項となる母集団の概念と統計データの種類についてまとめています 母集団の統計的性質を調べるためにとても重要な概念であるサンプリングについて述べるとともに, ランダムサンプリングの重要性についても説明します 統計分析の考え方 ビジネスの多くの場面において, 統計分析は重要です この場合の統計分析とは,

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

人間生活学研究第 7 号 2016 座を受講した際に 講座に対する課題などを受講者に自由に指摘してもらい 適宜改善を進めている 将来的には その成果を授業の中で活かし 多くの学生に還元する予定である 受講対象受講対象は 統計処理を利用する機会が多くあると考えられる健康栄養学科の学生で 希望者を募集し

人間生活学研究第 7 号 2016 座を受講した際に 講座に対する課題などを受講者に自由に指摘してもらい 適宜改善を進めている 将来的には その成果を授業の中で活かし 多くの学生に還元する予定である 受講対象受講対象は 統計処理を利用する機会が多くあると考えられる健康栄養学科の学生で 希望者を募集し 身近なデータを用いた基礎統計教育の試み 身近なデータを用いた基礎統計教育の試み 高原尚志 1 * 近年 インターネットを通じて大量のデータを取得することができるようになり 取得したデータを処理する ( ビッグデータ解析 ) ための能力が求められている しかし ビッグデータ解析を行うためには インターネット上から目的に合ったデータを取得する能力と取得したデータを適切に解析する統計処理の能力が必要になる

More information

Excelによるデータ分析

Excelによるデータ分析 Excel による データ分析 多変量解析編 矢野佑樹 2013/07/27 Excel で学ぶデータ分析 ( 多変量解析編 ) 多変量解析では, 気温とアイスの売上個数の関係や, 最寄り駅からの距離と来店者数の 関係など,2 つ以上の変数を一度に分析します. では, 早速 2 つのデータ間の関係を Excel によって分析しましょう. < 散布図と相関 > 例 1. あるアイスクリーム販売店では,1

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

Microsoft PowerPoint - CVM.ppt [互換モード]

Microsoft PowerPoint - CVM.ppt [互換モード] 遺伝子組み換えコーン油を事例とした CVM 質問 問 1 現在 遺伝子組み換えトウモロコシを原料として使っているコーン油が 1 本 900gあたり約 600 円で販売されています もし 遺伝子組み換え原料を完全に使っていないコーン油を販売しようとすれば それは 流通管理を徹底しなければならないことから 値段がより高くなることが予想されます あなたは 900g のコーン油 1 本について 追加的な値上がりが何円までだったら

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

Excelによる統計分析検定_知識編_小塚明_5_9章.indd 第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,

More information

対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1

対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1 社会人のためのデータサイエンス演習 対面学習 : 講義 各週の振り返りと PPDAC サイクルの注意点 対面学習の学習目標 データ分析のケーススタディ の講義と演習を通じて 以下の理解を深め 実践できるようになることを目標とする 分析の設計 データから現状の把握 現状から 課題の抽出 課題に対する解決のための分析設計 1 コンテンツ 1 第 1 週 ~ 第 4 週の振り返り 2 第 5 週の振り返り

More information

分野 コース名 基礎的 IT セミナーコース一覧 内容 I T 理解 I T スキル活用 I T 倫理 新技術動向 業務の I T 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新

分野 コース名 基礎的 IT セミナーコース一覧 内容 I T 理解 I T スキル活用 I T 倫理 新技術動向 業務の I T 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新 コース名 基礎的 セミナーコース一覧 内容 理解 スキル活用 倫理 新技術動向 業務の 化 ネットワーク 表計算 ベデーースタ プンレ / ゼ文ン書テ作ー成ショ ホームページ 情報発信コンンプスライア 情報テセィキュリ 1 第 4 次産業革命のインパクト新技術の概要 新技術の導入事例 2 A( 人工知能 ) の現状 A( 人工知能 ) の概要 A の活用事例と今後の展望 3 ビッグデータの概要データの収集

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード] データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ

More information

青焼 1章[15-52].indd

青焼 1章[15-52].indd 1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし

More information

数値計算法

数値計算法 数値計算法 008 4/3 林田清 ( 大阪大学大学院理学研究科 ) 実験データの統計処理その 誤差について 母集団と標本 平均値と標準偏差 誤差伝播 最尤法 平均値につく誤差 誤差 (Error): 真の値からのずれ 測定誤差 物差しが曲がっていた 測定する対象が室温が低いため縮んでいた g の単位までしかデジタル表示されない計りで g 以下 計りの目盛りを読み取る角度によって値が異なる 統計誤差

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

Microsoft Word - 【6.5.4】特許スコア情報の活用

Microsoft Word - 【6.5.4】特許スコア情報の活用 Q 業界における自社および競合他社のポジショニングを確認する際など 様々な場面で特許情報分析を行うことがあるが 特許の量的側面 ( 件数 ) のみではなく 特許の質 価値的側面からの分析ができないだろうか? 1. 特許の質 価値を機械的 客観的 定量的に評価した情報として提供される特許スコア企業の知的財産戦略の策定にあたり 業界における自社および競合他社のポジショニングを確認する際など 様々な場面で特許情報分析を行うことがあるが

More information

カリキュラムB

カリキュラムB 表計算ソフトの業務活用 B01 ステップ1 6~12 時間 業務で活用するために必要となる表計算ソフトの基本操作 ( ワークシート及びセル操作等 ) を習得する 表計算ソフト概要と基本操作 ワークシートの活用 グラフの作成 表計算ソフトの概要 特徴等 データ入力方法 簡単な計算式の入力 計算式の入力 ( 合計 平均 ) 罫線 複写 ( データ 計算式 罫線 ) 移動 グラフの種類 グラフの作成 グラフの書式設定

More information

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって

More information

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

Microsoft PowerPoint slide2forWeb.ppt [互換モード] 講義内容 9..4 正規分布 ormal dstrbuto ガウス分布 Gaussa dstrbuto 中心極限定理 サンプルからの母集団統計量の推定 不偏推定量について 確率変数, 確率密度関数 確率密度関数 確率密度関数は積分したら. 平均 : 確率変数 分散 : 例 ある場所, ある日時での気温の確率. : 気温, : 気温 が起こる確率 標本平均とのアナロジー 類推 例 人の身長の分布と平均

More information

基礎統計

基礎統計 基礎統計 第 4 回講義資料 本日の講義内容 第 3 章 : 次元データの整理 散布図 [ グラフ ] 共分散と相関係数 [ 数値 ] 回帰分析 [ 数値とグラフ ] 偏相関係数 [ 数値 ] 第 3 章 次元のデータ 第 3 章 : 次元のデータ ( 目的 ) 変数間の関係を探る 相関と回帰 ( 相関 ) 変数を区別せず対等にみる ( 相関関係 ) 身長と体重, 教科目の成績 ( 回帰 ) 一方が他方に影響を与える

More information

スライド 1

スライド 1 2009 年度 VMStudio & TMStudio 学生研究奨励賞 テキストマイニングツールを 利用した視線データの分析 東京大学大学院工学系研究科 白山研究室 江川陽 樋渡哲郎 1 目次 背景 目的 手法 実験 結果 考察 結論 2 背景 : 視線分析とは 視線分析とは 人間の視線の移動軌跡や分布 ( 視線データ ) を計測 分析することにより 人の認知処理を観察 解明するための手法 近年,

More information

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc color 実験の Normalization color 実験で得られた複数のアレイデータを相互比較するためには Normalization( 正規化 ) が必要です 2 つのサンプルを異なる色素でラベル化し 競合ハイブリダイゼーションさせる 2color 実験では 基本的に Dye Normalization( 色素補正 ) が適用されますが color 実験では データの特徴と実験の目的 (

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

Microsoft Word - apstattext01b.docx

Microsoft Word - apstattext01b.docx 1. 量的データの集計 1..1 分布とヒストグラム量的なデータの集計では まずデータの分布を見ることが大切です どの範囲にどれだけの数のデータがあるのかを示すのが度数分布表です 度数分布表の階級がデータを分類する範囲で 度数がどれだけのデータがその範囲に入っているかを表します 相対度数は その度数の全体から見た割合です また それに加えて累積度数と累積相対度数を加える場合もあります 累積度数はその階級以前の度数の合計

More information

学力スタンダード(様式1)

学力スタンダード(様式1) (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 稔ヶ丘高校学力スタンダード 有理数 無理数の定義や実数の分類について理解し ている 絶対値の意味と記号表示を理解している 実数と直線上の点が一対一対応であることを理解 し 実数を数直線上に示すことができる 例 実数 (1) -.5 () π (3) 数直線上の点はどれか答えよ

More information

課題研究の進め方 これは,10 年経験者研修講座の各教科の課題研究の研修で使っている資料をまとめたものです 課題研究の進め方 と 課題研究報告書の書き方 について, 教科を限定せずに一般的に紹介してありますので, 校内研修などにご活用ください

課題研究の進め方 これは,10 年経験者研修講座の各教科の課題研究の研修で使っている資料をまとめたものです 課題研究の進め方 と 課題研究報告書の書き方 について, 教科を限定せずに一般的に紹介してありますので, 校内研修などにご活用ください 課題研究の進め方 これは,10 年経験者研修講座の各教科の課題研究の研修で使っている資料をまとめたものです 課題研究の進め方 と 課題研究報告書の書き方 について, 教科を限定せずに一般的に紹介してありますので, 校内研修などにご活用ください 課題研究の進め方 Ⅰ 課題研究の進め方 1 課題研究 のねらい日頃の教育実践を通して研究すべき課題を設定し, その究明を図ることにより, 教員としての資質の向上を図る

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 絶対値の意味を理解し適切な処理することができる 例題 1-3 の絶対値をはずせ 展開公式 ( a + b ) ( a - b ) = a 2 - b 2 を利用して根号を含む分数の分母を有理化することができる 例題 5 5 + 2 の分母を有理化せよ 実数の整数部分と小数部分の表し方を理解している

More information

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

学習指導要領

学習指導要領 (1) 数と式 ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 自然数 整数 有理数 無理数の包含関係など 実数 の構成を理解する ( 例 ) 次の空欄に適当な言葉をいれて, 数の集合を表しなさい ア イ 無理数 整数 ウ 無理数の加法及び減法 乗法公式などを利用した計 算ができる また 分母だけが二項である無理数の 分母の有理化ができる ( 例 1)

More information

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式 統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : 統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST

More information

13章 回帰分析

13章 回帰分析 3 章回帰分析の基礎 つ以上の変数についての関係を見る. つの変数を結果, その他の変数を原因として, 因果関係を説明しようとするもの. 厳密な意味での因果関係ではない 例 因果 相関関係等 勤務年数が長ければ, 年間給与は上がる. 景気が良くなれば, 株価は上がる 父親の身長が高ければ, 子供の身長も高い. 価格が低下すれば需要が増える. 自身の兄弟数が多いと, 育てる子供の数も多い. サッカー人気が上がると,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション データ分析基礎研修事業のご案内 データ分析への関心 気づきをより身近に体感していただくため簡易なサンプルデータを基に 実際に PC(Excel) を扱いながら体験学習していくことをベースとした基礎研修事業のご案内 ( 一社 ) 九州テレコム振興センター (KIAI) こんなデータ分析で終わっていませんか? 例 : 来訪した方に対するアンケート調査 < アンケート調査項目例 > 項目 評価点 接客 1.

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次 夏期講習高 センター数学 ⅠA テキスト第 講 第 講 三角比 データの分析 ABC は AB=,BC=,AC= を満たす ⑴ cos B= アイ である 辺 BC 上に点 D を取り, ABD の外接円の半径を R とするとき, AD R = ウであり, 点 D を点 B から点 C まで移動させるとき,R の最小値はエである ただし, 点 D は点 B とは異なる点とする ⑵ ABD の外接円の中心が辺

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

相関分析・偏相関分析

相関分析・偏相関分析 相関分析 偏相関分析 教育学研究科修士課程 1 回生 田中友香理 MENU 相関とは 相関分析とは ' パラメトリックな手法 ( Pearsonの相関係数について SPSSによる相関係数 偏相関係数 SPSSによる偏相関係数 順位相関係数とは ' ノンパラメトリックな手法 ( SPSS による順位相関係数 おまけ ' 時間があれば ( 回帰分析で2 変数間の関係を出す 曲線回帰分析を行う 相関とは

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく

More information

1

1 < 参考資料 1> 想定最大規模降雨に関する地域区分について 我が国は 東西南北に広い上 脊梁山脈など地形特性もあり 例えば日本海側 太平洋側等といった地域ごとに気温や降雨などの気象の状況は異なる このため これまで観測された降雨データを用いて想定最大規模降雨を設定するにあたり 降雨の特性の類似する地域に区分することとする 気象現象に関する地域区分については 例えば地域別比流量図 ( クリーガー曲線

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

MedicalStatisticsForAll.indd

MedicalStatisticsForAll.indd みんなの 医療統計 12 基礎理論と EZR を完全マスター! Ayumi SHINTANI はじめに EZR EZR iii EZR 2016 2 iv CONTENTS はじめに... ⅲ EZR をインストールしよう... 1 EZR 1...1 EZR 2...3...8 R Console...10 1 日目 記述統計量...11 平均値と中央値... 11...12...15...18

More information

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散, . 無作為標本. 基本的用語 推測統計における基本的な用語を確認する 母集団 調査の対象になる集団のこと 最終的に, 判断の対象になる集団である 母集団の個体 母集団を構成する つ つのもののこと 母集団は個体の集まりである 個体の特性値 個体の特性を表す数値のこと 身長や体重など 特性値は, 変量ともいう 4 有限母集団と無限母集団 個体の個数が有限の母集団を 有限母集団, 個体の個数が無限の母集団を

More information

統計学の基礎から学ぶ実験計画法ー1

統計学の基礎から学ぶ実験計画法ー1 第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3

More information

Excel で学ぶ 実験計画法データ処理入門 坂元保秀 まえがき 本テキストは, 大学の統計解析演習や研究室ゼミ生の教育の一環として, 実験計画法を理解するための序論として, 工業系の分野で収集される特性データを Microsoft Excel を用いて実践的に処理する方法を記述したものである. 当初は, 完全ランダム実験で二元配置法まで Excel 関数を利用して実施していたが, 企業の皆様から身近に解析ができる

More information

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1918A8AD695AA90CD2E646F63> 第 回相関分析 9 年 月 日 A.つの変数間の関係を調べる. 散布図を書く例 水稲の収量に関連のある生育指標を知りたい. 例えば草丈と収量には関連があるだろうか? 例 トマトの糖度は施肥量によってどのように変化するかを知りたい. 例えば, 窒素施肥量を増加させると糖度はどうなるか? 散布図の書き方 )x 軸 ( 横軸 ) には原因となる変量を, y 軸 ( 縦軸 ) には結果となる変量をとる. サツマイモの収量

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション GSN を応用したナレッジマネジメントシステムの提案 2017 年 10 月 27 日 D-Case 研究会 国立研究開発法人宇宙航空研究開発機構 研究開発部門第三研究ユニット 梅田浩貴 2017/3/27 C Copyright 2017 JAXA All rights reserved 1 目次 1 課題説明 SECI モデル 2 GSN を応用したナレッジマネジメントシステム概要 3 ツリー型チェックリスト分析

More information

学習指導要領

学習指導要領 (1) 数と式 学習指導要領ア数と集合 ( ア ) 実数数を実数まで拡張する意義を理解し 簡単な無理数の四則計算をすること 千早高校学力スタンダード 自然数 整数 有理数 無理数の用語の意味を理解す る ( 例 ) 次の数の中から自然数 整数 有理 数 無理数に分類せよ 3 3,, 0.7, 3,,-, 4 (1) 自然数 () 整数 (3) 有理数 (4) 無理数 自然数 整数 有理数 無理数の包含関係など

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

リスクテンプレート仕様書

リスクテンプレート仕様書 目次 1. リスク管理の概要... 2 1.1 言葉の定義... 2 1.2 リスクモデル... 2 2. テンプレート利用の前提... 4 2.1 対象... 4 2.2 役割... 4 2.3 リスクの計算値... 4 2.4 プロセス... 4 2.5 ステータス... 5 3. テンプレートの項目... 6 3.1 入力項目... 6 3.2 入力方法および属性... 6 3.3 他の属性...

More information

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63> 第 5 回統計的推定 実験計画学 A. 統計的推定と検定母集団から無作為抽出した標本から母集団についてなんらかの推論を行う. この場合, 統計から行う推論には統計的 ( ) と統計的 ( ) の 2つがある. 推定統計的に標本の統計量から母集団の母数 ( 母平均, 母標準偏差など ) を推論することを統計的推定という. 例 : 視聴率調査を 200 人に対して行い, 番組 Aの視聴率を推定した. 検定統計的に標本の統計量から母数に関する予想の真偽を検証することを統計的検定という.

More information

2015実験ゼロ結果と考察 UP用.pdf

2015実験ゼロ結果と考察 UP用.pdf 記述統計 ( 代表値 ) 結果と Sophia Cognitive Psychology Lab. 総合人間科学研究科博士後期課程 4 年田根健吾 記述統計とはある集団の身長 165 cm 150 cm 160 cm 175 cm 145 cm 180 cm 165 cm 1: 記述統計 平均身長 162.5 cm 身長の標準偏差 5.0 代表値 散布度 ( 後で説明します ) データの傾向や性質をわかりやすくまとめる

More information

Microsoft Word - Stattext13.doc

Microsoft Word - Stattext13.doc 3 章対応のある 群間の量的データの検定 3. 検定手順 この章では対応がある場合の量的データの検定方法について学びます この場合も図 3. のように最初に正規に従うかどうかを調べます 正規性が認められた場合は対応がある場合の t 検定 正規性が認められない場合はウィルコクソン (Wlcoxo) の符号付き順位和検定を行ないます 章で述べた検定方法と似ていますが ここでは対応のあるデータ同士を引き算した値を用いて判断します

More information

目次. はじめに. ログインについて. 画面の機能説明. レーダーチャート. 来店回数. 来店頻度 7. 商圏分析 8. 併用分析 9. 滞在時間 0. 指定日分析. ヒートマップ Copyright FutureScope. Corp ALL Rights Reserv

目次. はじめに. ログインについて. 画面の機能説明. レーダーチャート. 来店回数. 来店頻度 7. 商圏分析 8. 併用分析 9. 滞在時間 0. 指定日分析. ヒートマップ Copyright FutureScope. Corp ALL Rights Reserv Ve r.. ( 08 / 0 / 9 更新 ) 管理画面使い方ガイド Copyright 00-08 FutureScope. Corp ALL Rights Reserved. 目次. はじめに. ログインについて. 画面の機能説明. レーダーチャート. 来店回数. 来店頻度 7. 商圏分析 8. 併用分析 9. 滞在時間 0. 指定日分析. ヒートマップ 7 9 7 9 Copyright 00-08

More information

画像類似度測定の初歩的な手法の検証

画像類似度測定の初歩的な手法の検証 画像類似度測定の初歩的な手法の検証 島根大学総合理工学部数理 情報システム学科 計算機科学講座田中研究室 S539 森瀧昌志 1 目次 第 1 章序論第 章画像間類似度測定の初歩的な手法について.1 A. 画素値の平均を用いる手法.. 画素値のヒストグラムを用いる手法.3 C. 相関係数を用いる手法.4 D. 解像度を合わせる手法.5 E. 振れ幅のヒストグラムを用いる手法.6 F. 周波数ごとの振れ幅を比較する手法第

More information

Microsoft PowerPoint - 基礎・経済統計6.ppt

Microsoft PowerPoint - 基礎・経済統計6.ppt . 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別

More information

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学) 回帰分析の用途 実験計画法の意義 グラフィカルモデリングの活用 早稲田大学創造理工学部 経営システム工学科 永田靖, The Institute of JUSE. All Rights Reserved. 内容. 回帰分析の結果の解釈の仕方. 回帰分析による要因効果の把握の困難さ. 実験計画法の意義 4. グラフィカルモデリング 参考文献 : 統計的品質管理 ( 永田靖, 朝倉書店,9) 入門実験計画法

More information

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および 心理学研究法 Ⅱ のスクーリングを未受講で 心理学統計法 に履修科目を変更された方は 本科目の学習を行ってください

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

因子分析

因子分析 因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が

More information

Microsoft Word - SPSS2007s5.doc

Microsoft Word - SPSS2007s5.doc 第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では

More information

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2 2 群の関係を把握する方法 ( 相関分析 単回帰分析 ) 2018 年 10 月 2, 4 日データサイエンス研究所伊藤嘉朗 本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2 相関分析 ( 散布図 ) セールスマンの訪問回数と売上高 訪問回数 売上高 38 523 25 384 73 758 82 813 43 492 66 678 38 495 29 418 71

More information

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63> 第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを

More information