講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

Similar documents
[12]SPSS_01.indd

第4回

Microsoft PowerPoint - データ解析基礎2.ppt

Microsoft PowerPoint ppt

経済データ分析A

Microsoft PowerPoint - 代表値と散布度.ppt [互換モード]

経営統計学

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft PowerPoint - 基礎・経済統計6.ppt

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

PowerPoint プレゼンテーション

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

Microsoft PowerPoint - e-stat(OLS).pptx

ビジネス統計 統計基礎とエクセル分析 正誤表

情報工学概論

散布度

Microsoft Word - apstattext01b.docx

Microsoft Word - apstattext04.docx

第1回

コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

モジュール1のまとめ

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

Medical3

Microsoft Word - lec_student-chp3_1-representative

データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2

基礎統計

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

スライド 1

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

スライド 1

はじめに:ロシア政治を考える視点

データ解析

夏期講習高 センター数学 ⅠA テキスト第 講 [] 人の生徒に数学のテストを行った 次の表 は, その結果である ただし, 表 の数値はすべて正確な値であるとして解答せよ 表 数学のテストの得点 次

Microsoft PowerPoint - Statistics[B]

PowerPoint プレゼンテーション

スライド 1

EBNと疫学

Microsoft Word - Stattext07.doc

Microsoft Word - Stattext12.doc

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

0415

三科目合計の算出関数を用いて各教科の平均点と最高点を求めることにする この2つの計算は [ ホーム ] タブのコマンドにも用意されているが 今回は関数として作成する まず 表に 三科目合計 平均 と 最高点 の項目を用意する 項目を入力する際 適宜罫線などを設定し 分かりやすい表作成を心がけること

Microsoft PowerPoint - データ解析基礎4.ppt [互換モード]

心理学統計法科目コード FB3537 単位数履修方法配当年次担当教員 2 R or SR( 講義 ) 2 年以上河地庸介 2017 年度以前 2018 年度以降に入学した方どちらも履修登録できます 2017 年度以前入学者で 心理学研究法 Ⅱ を履修登録しておらず認定心理士の取得を目指す方 および

ANOVA

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

3章 度数分布とヒストグラム

<4D F736F F D20438CBE8CEA8D758DC F0939A82C282AB2E646F63>

Medical3

スライド 1

<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>

3章 度数分布とヒストグラム

stat-base_ppt [互換モード]

Sheet2 に作成する表 問題 2 前問の成績表 (Sheet2) の各教科の順位の列の次に評価の列を作って 生徒ごとに各教科の評価をし なさい なお評価は 各教科 A(100~85) B(84~70) C(69~55) D(54 以下 ) とする 1.4 集中力度チェックテスト自分の集中力がどの

数値計算法

Microsoft Word - mstattext02.docx

Microsoft Word - SPSS2007s5.doc

Microsoft Word - Stattext11.doc

目次 1. ひまわり先生の基本設定は, かんたん3ステップ 3 <ステップ1> 先生の登録 3 <ステップ2> 児童の登録 4 <ステップ 3> テストの登録 6 (1) テストの登録の手順 6 (2) 自作のテストやプリントの追加 7 (3) 評価基準の設定 8 (4) 単元の移動, 単元の保留

講義「○○○○」

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

stat-base [互換モード]

スライド 1

初めてのプログラミング

PowerPoint プレゼンテーション

_KyoukaNaiyou_No.4

ワープロソフトウェア

平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

経済統計分析1 イントロダクション

Microsoft PowerPoint - statistics pptx

Microsoft PowerPoint - A1.ppt [互換モード]

Microsoft Word - apstattext05.docx

基本統計量・クロス集計表の作成

Microsoft Word - 操作マニュアル-Excel-2.doc

PowerPoint プレゼンテーション

Microsoft PowerPoint - 資料04 重回帰分析.ppt

ワープロソフトウェア

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

Microsoft PowerPoint - 測量学.ppt [互換モード]

スライド 1

代表値

Microsoft Word - 保健医療統計学112817完成版.docx

§2-2 記述統計と推測統計

統計的データ解析

不偏推定量

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

統計学の基礎から学ぶ実験計画法ー1

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

Microsoft Word - Stattext13.doc

相関係数と偏差ベクトル

Microsoft PowerPoint - while.ppt


PowerPoint プレゼンテーション

正誤表(FPT1004)

口腔ケア アセスメント解析データベース 平成 23 年度に作成した, 口腔ケア アセスメント票 の結果を効率的に管理, 分析できるソフトです 平成 24 年度, 仙台保健福祉事務所が介護老人保健施設ももせ塩竈において実施した, 口腔ケアの取組強化を目的としたモデル事業において, 仙台保健福祉事務所と

Transcription:

講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.3 fig. 度数分布表の出力例 基本統計量の算出 度数分布表のオプションで 統計量 を選ぶ fig. 基本統計量の算出 中心傾向 ( 代表値 ) 散らばり ( 散布度 ) 分布 前回のサンプルデータを用いて整理する 手元に無い人はダウンロードしておくこと

講義ノート p.4 ばらつき具合とその指標 Excel を用いた基本統計量の理解代表値 ( 中心傾向 ) 平均値 (=average 関数 ) 中央値 (=median 関数 ) 散布度 ( 散らばり ) 分散 標準偏差 } 今日はここを理解する 本日の内容ばらつき具合とその指標散布度の求め方 Z スコアと偏差値 使用するデータの特徴代表値代表値として 平均値 を用いる数学的に最も高度な代表値分布の全ての値を使って求める分布の形いわゆる 正規分布 を前提とする 正規分布の特徴を確認してみよう正規分布の特徴 左右対称 中央部分が最も値が多い 極端な値は少ない 釣り鐘型 fig. 正規分布の例

講義ノート p.5 正規分布の比較と標準正規分布平均値が等しい正規分布の比較平均値が等しいからといっても同じ正規分布ではない平均値が等しい正規分布の比較下の二つの図は何が違うのか? fig. 平均値の等しい 2 種類の正規分布の例 解答 : ばらつき具合の違いの表現なだらかな分布データがばらついている尖った分布データがばらついていない 尖度 という指標で確認可能 SPSS では 0 を基準としているプラスの値は尖った分布を意味するデータのばらつきが分布の形を決める ばらつき具合を他人に伝えるためには? 視覚的に把握する簡潔には伝えられない数値で表現する 散布度 という指標を用いる 代表値 と 散布度 で分布の特徴を表現する 代表値 とは何か 簡潔に説明できるようになっておこう!

講義ノート p.6 簡単な散布度範囲 ( 分析 記述統計 度数分布表 の 統計量 ) 最大値と最小値から求める値極端な値に弱い 2 つの値しか使っていないので 情報量が少ない平均値のように 全てのデータ を使いたいより高度なばらつき具合の表現へ ばらつき具合の表現ばらつきとは 何からの ばらつきか? 代表値 ( 平均値 ) からどれだけ離れているかそれぞれの値が平均値からどれだけ離れているかを計算して集計すれば良い 以下の表の空欄を埋める CourceN@vi からファイルをダウンロードし Excel で実習する SPSS で値だけ求めても無意味 それが何の意味なのか理解しておく必要がある 散布度の計算過程 名前得点得点 - 平均値 ( 得点 - 平均値 )^2 A 2 B 2 C 3 D 3 E 5 F 6 G 6 H 7 I 8 J 8 平均値合計値合計値 = 偏差平方和 5 分散 = 偏差平方和 / データ数 標準偏差 = 分散

講義ノート p.7 偏差代表値からどれだけ離れているか偏差 = 個々の値 - 平均値計算結果を p.6 の表に書き入れること偏差の合計偏差を出し終えたら合計する 0になる証明は以下の通り偏差の平均 = 偏差の合計 / データ数 =(( それぞれのデータから平均値を引いたもの ) の合計 ) データ数 =( 全データの合計から平均値 データ数を引いたもの ) データ数 =( 全データの合計 データ数 ) ー ( 平均値 データ数 データ数 ) = 平均値ー平均値 =0 従ってそのままでは立ち行かなくなる偏差二乗和なぜ偏差の合計は 0 になるかは上の証明通りならば全てを正の数にすればいい二乗すれば正の数になる ( 単位も二乗になる ) 全て計算したら合計する計算結果を p.6 の表に書き入れること偏差二乗和 (Sum of Squares = SS) 偏差二乗和 偏差自乗和 偏差平方和 どれも同じものを指す最も基本となる散布度の指標データ数が増えると値が大きくなる分散偏差二乗和をデータ数で調整した値不偏分散 = 偏差二乗和 自由度 ( データ数 -1) 調整してあるので ばらつき具合の評価が比較しやすい自由度で割っているので母集団の性質を求めているただし単位は二乗のまま 不偏標準偏差 ( 本来は 標本標準偏差 と言われるが 混乱を避けるために 不偏標準偏差 とする ) 不偏分散の単位を元の単位に戻したもの不偏分散の平方根 ( ルート ) を取る不偏標準偏差 = 不偏分散 p.6 のサンプルデータの不偏標準偏差 5.56 2.36 このテストの結果は平均 5.0 点で おおよそのばらつき具合は平均点を中心にしてを 2.36 点である といえる

講義ノート p.8 散布度についてのまとめ代表値と散布度でデータのおおまかな性質を捉えられる代表値平均値 中央値 最頻値散布度偏差二乗和 分散 標準偏差 データを比較する 異なる科目のテストで同じ点数を取ったとする それぞれの科目の平均値が同じなら成績は等しくなるか? 実は散布度を考慮していない設問 各科目の成績はどの程度ばらついているか の情報が必要 平均 50 点のテストで 60 点を取った場合標準偏差 10 点の分布 60 点は標準偏差 1 つ分上回っているといえる標準偏差 5 点の (10 点よりもばらつきが少ない ) 分布 60 点は標準偏差 2 つ分上回っているといえる標準偏差を単位として個々の得点がどれだけ平均値から離れているかが数値化できる偏差 標準偏差 = 標準得点データを全て標準得点に直した分布を 標準正規分布 と呼ぶ標準正規分布の形に変換することを 標準化 という 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 4.0 0.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 4.0 0.5 0.4 0.3 0.2 0.1 0.0-4.0-3.0-2.0-1.0 0.0 1.0 2.0 3.0 4.0 fig. 標準化の模式図 Z スコア ( 個々の得点ー平均値 ) 標準偏差 = Z スコア ( 標準得点 ) 標準正規分布の形に変換すればどんなデータでも比較可能異なる科目間身長と体重

講義ノート p.9 以下の表を埋めてみよう データの標準化 (Z スコア ) と偏差値 名前得点偏差 A 2 Z スコア ( 偏差 / 標準偏差 ) B 2 C 3 D 3 E 5 F 6 G 6 H 7 I 8 J 8 Z スコアの意味 E くん ( 平均値と完全に一致した成績 ) 0 2.36 = 0 F くん ( 平均値 +1.0SD の成績 ) 1 2.36 0.42 データの個々の位置を表すのに役立つ 偏差値 Z スコアには小数点以下の値もマイナスの値もある Z スコアを 10 倍して 50 を足した値が 偏差値 偏差値 60 は 標準偏差 1 つ分プラスである という意味 上側確率 標準正規分布の特徴 全体の面積を 1 とした際の ある値より上 の面積が既に計算済み 斜線の部分の面積は全体の 2.5% 標準偏差 ±1 の範囲に 全体の 68.26% が入る このテストの結果は平均 5.0 点で 平均点を中心とした ±2.36 点の範囲に全体の 68.26% のデータが入る といえる

講義ノート p.10 SPSS での Z スコアと偏差値の求め方 ただし SPSS では不偏標準偏差 ( 不偏分散の平方根 ) を用いて計算される データビューに Excel のデータをコピーする fig. Excel のデータをコピー & 貼り付け 変数ビューを編集する fig. 変数ビューの 名前 と 尺度 を編集 分析 記述統計 記述統計 を選択 fig. メニューから分析方法を選択

講義ノート p.11 Z スコアに変換する変数の指定 標準化された値を変数として保存 にチェック fig. 変数の指定 必要なら記述統計のオプションを指定 fig. 記述統計のオプションを指定 続行ボタンを押すと 結果と共にデータビューに Z スコアの値が自動的に入力される fig. Z スコアの出力結果

講義ノート p.12 Z スコアと偏差値 いわゆる 偏差値 は Z スコアを 10 倍し 50 を加算するという線形変換をした値である 偏差値 =Z スコア *10+50 SPSS では以下のようにして算出することが可能である 前提として Z スコアを算出しておく 変換 変数の計算 を選択 fig. 変数の計算を選択 出現した 変数の計算 ダイアログボックスで Z スコアの変数 を選択する 数式 欄で その変数名に 10 を乗算し 50 を加算する Z 成績 *10+50 となる目標変数の名称を入力する ( ここでは 偏差値 とした ) fig. 目標変数と数式を入力 OK ボタンを押すと 全データの偏差値が出力される

講義ノート p.13 fig. 偏差値の出力 Excel での偏差値の求め方 各 Z スコアのセルを指定し = セル番地 *10+50 として算出する 練習問題 以下のサンプルデータの菓子 A と菓子 B について それぞれ基本統計量と Z スコアを求めなさい 名前 性別 菓子 A 菓子 B 安藤 1 7 9 石井 2 7 10 今井 2 6 7 上田 1 6 10 遠藤 1 8 7 大塚 2 7 6 大和田 1 5 7 香山 2 9 6 桑原 2 7 6 近藤 2 10 10 佐藤 1 8 5 島村 1 8 8 杉田 2 6 4 立川 1 4 9 戸田 2 9 9 新倉 1 2 4 深町 2 8 2 町田 1 7 8 山田 1 8 8 横川 2 6 3

講義ノート p.14 第 2-3 回課題 ( 次々回授業前までを提出期限とする ) なお 計算には Excel を用いても SPSS を用いても良いが どちらの環境で算出したかを明記すること 問 1 あるテストを 10 人に課したところ 得点が以下のようなものになった a:22 b:24 c:55 d:46 e:47 f:38 g:53 h:60 i:74 j:51 1-1 平均値を求めなさい 1-2 偏差平方和を求めなさい 1-3 分散を求めなさい 1-4 標準偏差を求めなさい 1-5 f と i の z スコアを求めなさい 1-6 g の偏差値を求めなさい 問 2 データ数が 25 分散が 16.0 であったとき 標準偏差と偏差二乗和を求めなさい 問 3 以下のデータから平均値 偏差二乗和 分散 標準偏差を求めなさい また j の偏差値を求めなさい a:48 b:42 c:49 d:43 e:51 f:59 g:65 h:68 i:78 j:84 平均値は小数点以下第 1 位まで求め 散布度は小数点以下第 2 位まで求めなさい 偏差値は整数位までで 良いものとする 問 4 10 人のデータの値が全て同じものであった場合 標準偏差を求めることはできるかどうか考察しなさい