テレビ学習メモ 数学 Ⅰ 第 40 回 第 5 章データの分析 相関係数 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します 相関係数は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータの相関関係を

Similar documents
平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

学習指導要領

学習指導要領

学習指導要領

学習指導要領

相関係数と偏差ベクトル

散布度

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

学習指導要領

学習指導要領

学習指導要領

データ 統計 情報 計算 分析 ( 数量的情報 定性的情報 ) 上の図にもあるように 統計学 の目的の一つとして データ ( 中学校では資料と呼んでいた ) や 統計 を正しく分析し 我々の判断や 行動に役立つ 情報 を導き出す力を養うことが挙げられる ( 度数分布表とヒストグラム ) 1 年 A

学習指導要領

Microsoft Word - M1-05.docx

Microsoft Word - 町田・全 H30学力スタ 別紙1 1年 数学Ⅰ.doc

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

【FdData中間期末過去問題】中学数学1年(負の数/数直線/絶対値/数の大小)

Microsoft Word - lec_student-chp3_1-representative

ビジネス統計 統計基礎とエクセル分析 正誤表

Ⅰ 指導と評価の年間計画 及び 評価規準と単元計画 の作成の手引き 1 指導と評価の年間計画 についてこれは 次の 2 の 評価規準と単元計画 の全単元について その概要を記述したものである 生徒の学習活動に対するより適正な評価 及び生徒の学習の改善に生かされる評価 ( 指導と評価の一体化 ) の実

1.民営化

[1] の問題は四分位数の計算方法を知っているだけでは解けず, 四分位数や箱ひげ図の意味がわかり, また,2 回目とのデータの比較について箱ひげ図からわかることの判断といったことができるかどうかが問われていた しかも (2) と (3) はそれぞれ選択肢を 4 個と 2 個答えるが, それぞれ完答を

Microsoft PowerPoint - e-stat(OLS).pptx

学習指導要領

学力スタンダード(様式1)

中1数学 移行措置資料

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

13章 回帰分析

FdData中間期末数学1年

三科目合計の算出関数を用いて各教科の平均点と最高点を求めることにする この2つの計算は [ ホーム ] タブのコマンドにも用意されているが 今回は関数として作成する まず 表に 三科目合計 平均 と 最高点 の項目を用意する 項目を入力する際 適宜罫線などを設定し 分かりやすい表作成を心がけること

Microsoft Word - 数学Ⅰ

O359P_T_[ ]

13章 回帰分析

平成 28 年度山梨県学力把握調査 結果分析資料の見方 調査結果概況 正答数分布グラフ 分布の形状から児童生徒の解答状況が分かります 各学校の集計支援ツールでは, 形状だけでなく, 県のデータとの比較もできます 設問別正答率 無解答率グラフ 設問ごとの, 正答率や無解答率が分かります 正答率の低い設

1 次関数 1 次関数の式 1 次の表は, ろうそくを燃やした時間 x 分と残りのろうそくの長さ ycm の関係を表しています 次の問いに答えなさい x( 分 ) y(cm ) (1) 上の表のをうめなさい (2) ろうそくは,5 分間に何 cm 短くなっていく

Microsoft PowerPoint - データ解析基礎2.ppt

1. CS(Customer Satisfaction) 分析とは ここでは CS 分析について解説します 1.1. CS 分析とは 魅力的な自動車を販売しているが買い手がつかない 面白いゲーム機を販売しているが 売れ行きが悪い この原因は何でしょうか? 商品の価格 サポート 店員の対応 店内の雰囲

d_cj02

測量試補 重要事項

Microsoft PowerPoint - 7.Arithmetic.ppt

満足度調査(CS 分析Ⅵ1) 顧客に対しアンケート調査を行う 質問内容は商品の満足度と, それに関連すると思われる項目で, 満足度の点数を回答してもらいます 例えば新開発の携帯電話であれば, 価格, 重さ, デザインといった関連項目と携帯電話そのものの総合評価, といった具合です 2) 回答を分析す

Microsoft Word - 19-d代 試é¨fi 解ç�fl.docx

<4D F736F F D F90948A F835A E815B8E8E8CB189F090E05F81798D5A97B98CE38F4390B A2E646F63>

untitled

untitled


Microsoft PowerPoint ppt

様々なミクロ計量モデル†

経営統計学

第9回 配列(array)型の変数

基礎統計

ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝

データ解析

Microsoft PowerPoint - statedu_ _open.ppt [互換モード]

2019年度 千葉大・理系数学

平成 30 年度 前期選抜学力検査問題 数学 ( 2 時間目 45 分 ) 受検番号氏名 注 意 1 問題は, 表と裏にあります 2 答えは, すべて解答欄に記入しなさい 1 次の (1)~(7) の問いに答えなさい (1) -3 (-6+4) を計算しなさい 表合計 2 次の (1)~(6) の問

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

測量士補 重要事項「標準偏差」

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

はじめに:ロシア政治を考える視点

< 文字式問題文の意味を文字式で表す > No. 桁 ( ケタ ) の整数 自然数 例 ) 8 という整数は が つ が 8 つ集まってできている整数である これを踏まえて 8 = + 8 と表すことができる (1) 十の位の数字が χ 一の位の数字が у である 桁の整数は χ と у を用いてど

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

年生 章資料の活用 ( 基本問題練習 ) 入試問題を解くための準備問題です 1 に適当なことばを入れなさい 資料のとる値のうち, 最大のものから最小のものをひいた差を ア という 度数分布表において, 資料を整理するための区間を階級といい, その幅を 3 右の表は, 生徒 人のある日の睡眠時間を,

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Microsoft Word - apstattext04.docx

PowerPoint プレゼンテーション

2015-2017年度 2次数学セレクション(複素数)解答解説

Microsoft Word - 操作マニュアル-Excel-2.doc

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

_KyoukaNaiyou_No.4


Blue circle & gradation

情報処理実習(芸術1)

2011年度 東京大・文系数学

本日の内容 相関関係散布図 相関係数偏相関係数順位相関係数 単回帰分析 対数目盛 2

比例・反比例 例題編 問題・解答

【指導のポイント】

立体切断⑹-2回切り

3 学校教育におけるJSLカリキュラム(中学校編)(数学科)4.授業事例 事例1 1年 正負の数「正の数、負の数」

Excelによるデータ分析

中学 1 年数学 ( 東京書籍 ) 単元別コンテンツ一覧 単元ドリル教材解説教材 確認問題ライブラリ (OP) プリント教材 教材数 :8 問題数 : 基本 40, 標準 40, 挑戦 40 正の数 負の数などの問題を収録 解説教材 :3 確認問題 :3 数直線 数の大小と絶対値などの解説 確認問題

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

Microsoft PowerPoint - Econometrics pptx

学習指導要領 ( イ ) 集合集合と命題に関する基本的な概念を理解し それを事象の考察に活用すること 向丘高校学力スタンダード 三つの集合について 共通部分 和集合を求めることができる また 二つの集合について ド モルガンの法則 を理解する ( 例 ) U ={ n n は 1 桁の自然数 } を

スライド 1

Microsoft PowerPoint - 10統計の分析と利用_1.pptx

PowerPoint プレゼンテーション

Microsoft Word - 微分入門.doc

2014-9

2017年度 京都大・文系数学

2018年度 東京大・理系数学

スライド 1

Microsoft PowerPoint - while.ppt

Transcription:

テレビ学習メモ 第 40 回 第 5 章データの分析 監修 執筆 湯浅弘一 今回学ぶこと データの分析の最終回 今までの代表値を複合し ながら 2 種類のデータの関係を数値化します は 相関がどの程度強いのかを表しています 学習のポイント 12 種類のデータのを 1 つの数値で表す 2共分散と 3実際のデータからを求める ポイント 1 2 種類のデータのを 1 つの数値で表す 2 種類のデータの散らばりは散布図で見ることができました これを数値化するには? 四分位数 ( 中央値から見る ) 散らばりを見るには分散 ( 平均値から見る ) 2 種類のデータの関係を四分位数を使って表すと イメージは y 0 x これだと x と y の関係は見えません!! そこで 平均値から見てみると 159

例 あるグループ 8 人にごはんとパンの好きな度合いと 魚と肉の好きな度合いのアンケートをと りました アンケートは次の通りです 魚が好き肉が好き 1 2 3 4 5 ごはんが好きパンが好き 1 2 3 4 5 回答は 1 5 の整数値に限定しました 結果は以下の通りです メンバー A B C D E F G H 魚と肉 (x) 1 2 3 4 4 5 5 5 ごはんとパン (y) 5 4 3 2 5 1 3 5 これを散布図で表すと 相関が見える? y 5 4 3 2 1 0 1 2 3 4 5 x ここで平均から見ることにすると x= 1 8 (1+2+3+4+4+5+5+5)=29 8 =3.625 y= 1 8 (5+4+3+2+5+1+3+5)=28 8 =3.5 x の平均 y y = 3.5 A E H 5 B 4 C G 3 D 2 F 1 y の平均 O 1 2 3 4 5 x = 3.625 x これは見にくいので x の平均と y の平均の交点を O にするように変化を与えます それが偏差です ( ) でした 160

先ほどのデータを使って メンバー A B C D E F G H x 1 2 3 4 4 5 5 5 y 5 4 3 2 5 1 3 5 x - y -2.625-1.625-0.625 0.375 0.375 1.375 1.375 1.375 y - x 1.5 0.5-0.5-1.5 1.5-2.5-0.5 1.5 下の 2 段を図示すると y-y y-y A 1.5 E H A E H B -2.625-1.625 0.5-0.625 0.375 1.375 C -0.5 G x-x 簡易版 B C O G x-x -1.5 D D -2.5 F F これにアンケート項目を入れると パン A E H B 魚 C O G 肉 D F 一目でわかります ごはん これを数値化すると (x - x) (y - y) を作る パン 魚 負正 正負 肉 エリアで符号が決まります この符号 は x>0( 肉好き ) と y>0( パン好き ) ごはん の積 ( かけ算 ) で決まります 161

(x - x) (y - y) の値の絶対値が好きな度合いです メンバー A B C D E F G H x - x -2.625-1.625-0.625 0.375 0.375 1.375 1.375 1.375 y - y 1.5 0.5-0.5-1.5 1.5-2.5-0.5 1.5 (x - x) (y - y) -3.9375-0.8125 0.3125-0.5625 0.5625-3.4375-0.6875 2.0625 A さんはとても魚とパンが好き F さんはとても肉とごはんが好き H さんはとても肉とパンが好き ポイント 2 共分散と 上の積 (x - x) (y - y) の平均値を x と y の共分散といいます 平均値を中心に考えたときの上下左右への散らばり具合の目安 ( イメージ ) がわかります そして その共分散をもとにして = x と y の共分散 x の分散 y の分散 = r と定めます この値 r は必ず - 1 r 1 を満たします そして { r 0.7 : 強い相関がある r - 0.7 { 0.4 r < 0.7 : 中程度の相関がある ( やや相関がある ) - 0.7 < r - 0.4 { 0.2 < r < 0.4 : 弱い相関がある - 0.4 < r <- 0.2-0.2 r 0.2 は 相関がないとされています 162

を求める手順手順 1 与えられたデータからを求めやすいように表を作る x y x-x y-y (x-x) 2 (y-y) 2 (x-x) (y-y) 3 4 5 6 7 3 4 5 6 7 3 4 5 6 7 1 2 作業 1 :x の平均値 x を求めて1に書き込む そして x の平均値 x を求める 作業 2 :y の平均値 y を求めて2に書き込む そして y の平均値 y を求める 作業 3 :x のデータから平均値 x をひいて3に書き込む 作業 4 :y のデータから平均値 y をひいて4に書き込む 作業 5 :3の各データを 2 乗して5に書き込む 作業 6 :4の各データを 2 乗して6に書き込む 作業 7 :3と4のデータの積を計算して7に書き込む 作業 8 :5の平均が x の分散 作業 9 :6の平均が y の分散 作業 10 :7の平均を計算する ( 共分散という ) 手順 2 作成した表をもとにして r を求める x y の読み取り方 完全な負の 強い負の 負の が ない 正の 強い正の 完全な正の 相関 r =-1 r =- 0.9 r =- 0.4 r = 0 r = 0.4 r = 0.9 r =1 163

分析 1 :r の範囲は - 1 r 1 である 分析 2 :r の値が 1 に近いほど正の相関が強くなる ( 右上がりの直線上 ) 分析 3 :r の値が- 1 に近いほど負の相関が強くなる ( 右下がりの直線上 ) 分析 4 :r の値が 0 に近いほど相関は弱くなる ( 散らばった状態 ) 例題 下表はある月の連続 6 日間の最高気温とある店のおでんの売り上げのデータである このデータの最高気温 x( ) とおでんの売り上げ y( 万円 ) の r を小数第 3 位 を四捨五入して求めよ 1 日目 2 日目 3 日目 4 日目 5 日目 6 日目 x( ) 10 7 6 12 9 10 y( 万円 ) 13 19 19 12 15 12 答え x y x-x y-y (x-x ) 2 (y-y ) 2 (x-x ) (y-y ) 1 日目 10 13 1-2 1 4-2 2 日目 7 19-2 4 4 16-8 3 日目 6 19-3 4 9 16-12 4 日目 12 12 3-3 9 9-9 5 日目 9 15 0 0 0 0 0 6 日目 10 12 1-3 1 9-3 合計 54 90 0 0 24 54-34 x= 1 6 (10+7+6+12+9+10)= 54 6 =9 y= 1 6 (13+19+19+12+15+12)= 90 6 =15 x の分散は (x-x )2 の総和 6 = 24 6 =4 y の分散は (y-y )2 の総和 6 = 54 6 =9 164

x と y の共分散は r = x とyの共分散 xの分散 yの分散 = (- 17 3 ) 4 9 =- 17 18 (x-x ) (y-y ) の総和 = -34 6 6 =- 17 3 =- 0.9444-0.94 ( 強い負の相関がある ) ポイント 3 実際のデータからを求める 問題 20 人に数学と英語のテストを実施しその結果をまとめたところ 下のような相関表になった 表中の数値は 数学の得点と英語の得点の組み合わせに対応する人数を表している 英語 ( 点 ) 数学 ( 点 ) 10 9 8 7 6 5 4 3 2 1 10 1 9 1 8 1 1 7 2 6 1 2 5 1 1 4 2 1 3 1 2 3 1 1 1 165

以下の値を求めなさい (1) 英語の中央値は? (2) 英語の箱ひげ図を書け (3) 英語の平均値は? (4) 英語の分散は? (5) 数学の平均値は? (6) 数学の分散は? (7) 英語と数学の共分散は? (8) 英語と数学のは? 答え 英語と数学の得点をそれぞれ x,y として次の表を作る ここで x = 100 20 = 5 y = 100 20 = 5 x は小さい順に並べます 生徒 x y x-x y-y (x-x ) 2 (y-y ) 2 (x-x ) (y-y ) 1 1 1 4 4 16 16 16 2 1 4 4 1 16 1 4 3 2 2 3 3 9 9 9 4 2 2 3 3 9 9 9 5 2 2 3 3 9 9 9 6 3 3 2 2 4 4 4 7 4 1 1 4 1 16 4 8 4 6 1 1 1 1 1 9 4 6 1 1 1 1 1 10 5 5 0 0 0 0 0 11 5 6 0 1 0 1 0 12 6 4 1 1 1 1 1 13 6 4 1 1 1 1 1 14 6 5 1 0 1 0 0 15 7 7 2 2 4 4 4 16 7 7 2 2 4 4 4 17 8 8 3 3 9 9 9 18 8 10 3 5 9 25 15 19 9 8 4 3 16 9 12 20 10 9 5 4 25 16 20 計 100 100 136 136 115 166

(1) 生徒 1011の英語の平均なので 5( 点 ) (2) 英語の第 1 四分位数は 5と6の平均 2.5( 点 ) 第 3 四分位数は15と16の平均 7( 点 ) 第 2 四分位数は (1) より 5( 点 ) なので 0 1 2 3 4 5 6 7 8 9 10 ( 点 ) (3) x = xの総和 = 100 20 20 = 5( 点 ) (4) (x-x ) 2 の総和 20 = 136 20 = 6.8( 点 ) (5) y = yの総和 = 100 20 20 = 5( 点 ) (6) (y-y ) 2 の総和 20 = 136 20 = 6.8( 点 ) (7) (8) (x-x ) (y-y ) の総和 = 115 20 20 = 5.75( 点 ) 5.75 6.8 6.8 =5.75 6.8 = 575 = 0.845 0.85 680 167