講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成
|
|
|
- さみ きせんばる
- 7 years ago
- Views:
Transcription
1 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー
2 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成
3 講義ノート p.3 fig. 度数分布表の出力例 基本統計量の算出 度数分布表のオプションで 統計量 を選ぶ fig. 基本統計量の算出 中心傾向 ( 代表値 ) 散らばり ( 散布度 ) 分布 前回のサンプルデータを用いて整理する 手元に無い人はダウンロードしておくこと
4 講義ノート p.4 ばらつき具合とその指標 Excel を用いた基本統計量の理解代表値 ( 中心傾向 ) 平均値 (=average 関数 ) 中央値 (=median 関数 ) 散布度 ( 散らばり ) 分散 標準偏差 } 今日はここを理解する 本日の内容ばらつき具合とその指標散布度の求め方 Z スコアと偏差値 使用するデータの特徴代表値代表値として 平均値 を用いる数学的に最も高度な代表値分布の全ての値を使って求める分布の形いわゆる 正規分布 を前提とする 正規分布の特徴を確認してみよう正規分布の特徴 左右対称 中央部分が最も値が多い 極端な値は少ない 釣り鐘型 fig. 正規分布の例
5 講義ノート p.5 正規分布の比較と標準正規分布平均値が等しい正規分布の比較平均値が等しいからといっても同じ正規分布ではない平均値が等しい正規分布の比較下の二つの図は何が違うのか? fig. 平均値の等しい 2 種類の正規分布の例 解答 : ばらつき具合の違いの表現なだらかな分布データがばらついている尖った分布データがばらついていない 尖度 という指標で確認可能 SPSS では 0 を基準としているプラスの値は尖った分布を意味するデータのばらつきが分布の形を決める ばらつき具合を他人に伝えるためには? 視覚的に把握する簡潔には伝えられない数値で表現する 散布度 という指標を用いる 代表値 と 散布度 で分布の特徴を表現する 代表値 とは何か 簡潔に説明できるようになっておこう!
6 講義ノート p.6 簡単な散布度範囲 ( 分析 記述統計 度数分布表 の 統計量 ) 最大値と最小値から求める値極端な値に弱い 2 つの値しか使っていないので 情報量が少ない平均値のように 全てのデータ を使いたいより高度なばらつき具合の表現へ ばらつき具合の表現ばらつきとは 何からの ばらつきか? 代表値 ( 平均値 ) からどれだけ離れているかそれぞれの値が平均値からどれだけ離れているかを計算して集計すれば良い 以下の表の空欄を埋める CourceN@vi からファイルをダウンロードし Excel で実習する SPSS で値だけ求めても無意味 それが何の意味なのか理解しておく必要がある 散布度の計算過程 名前得点得点 - 平均値 ( 得点 - 平均値 )^2 A 2 B 2 C 3 D 3 E 5 F 6 G 6 H 7 I 8 J 8 平均値合計値合計値 = 偏差平方和 5 分散 = 偏差平方和 / データ数 標準偏差 = 分散
7 講義ノート p.7 偏差代表値からどれだけ離れているか偏差 = 個々の値 - 平均値計算結果を p.6 の表に書き入れること偏差の合計偏差を出し終えたら合計する 0になる証明は以下の通り偏差の平均 = 偏差の合計 / データ数 =(( それぞれのデータから平均値を引いたもの ) の合計 ) データ数 =( 全データの合計から平均値 データ数を引いたもの ) データ数 =( 全データの合計 データ数 ) ー ( 平均値 データ数 データ数 ) = 平均値ー平均値 =0 従ってそのままでは立ち行かなくなる偏差二乗和なぜ偏差の合計は 0 になるかは上の証明通りならば全てを正の数にすればいい二乗すれば正の数になる ( 単位も二乗になる ) 全て計算したら合計する計算結果を p.6 の表に書き入れること偏差二乗和 (Sum of Squares = SS) 偏差二乗和 偏差自乗和 偏差平方和 どれも同じものを指す最も基本となる散布度の指標データ数が増えると値が大きくなる分散偏差二乗和をデータ数で調整した値不偏分散 = 偏差二乗和 自由度 ( データ数 -1) 調整してあるので ばらつき具合の評価が比較しやすい自由度で割っているので母集団の性質を求めているただし単位は二乗のまま 不偏標準偏差 ( 本来は 標本標準偏差 と言われるが 混乱を避けるために 不偏標準偏差 とする ) 不偏分散の単位を元の単位に戻したもの不偏分散の平方根 ( ルート ) を取る不偏標準偏差 = 不偏分散 p.6 のサンプルデータの不偏標準偏差 このテストの結果は平均 5.0 点で おおよそのばらつき具合は平均点を中心にしてを 2.36 点である といえる
8 講義ノート p.8 散布度についてのまとめ代表値と散布度でデータのおおまかな性質を捉えられる代表値平均値 中央値 最頻値散布度偏差二乗和 分散 標準偏差 データを比較する 異なる科目のテストで同じ点数を取ったとする それぞれの科目の平均値が同じなら成績は等しくなるか? 実は散布度を考慮していない設問 各科目の成績はどの程度ばらついているか の情報が必要 平均 50 点のテストで 60 点を取った場合標準偏差 10 点の分布 60 点は標準偏差 1 つ分上回っているといえる標準偏差 5 点の (10 点よりもばらつきが少ない ) 分布 60 点は標準偏差 2 つ分上回っているといえる標準偏差を単位として個々の得点がどれだけ平均値から離れているかが数値化できる偏差 標準偏差 = 標準得点データを全て標準得点に直した分布を 標準正規分布 と呼ぶ標準正規分布の形に変換することを 標準化 という fig. 標準化の模式図 Z スコア ( 個々の得点ー平均値 ) 標準偏差 = Z スコア ( 標準得点 ) 標準正規分布の形に変換すればどんなデータでも比較可能異なる科目間身長と体重
9 講義ノート p.9 以下の表を埋めてみよう データの標準化 (Z スコア ) と偏差値 名前得点偏差 A 2 Z スコア ( 偏差 / 標準偏差 ) B 2 C 3 D 3 E 5 F 6 G 6 H 7 I 8 J 8 Z スコアの意味 E くん ( 平均値と完全に一致した成績 ) = 0 F くん ( 平均値 +1.0SD の成績 ) データの個々の位置を表すのに役立つ 偏差値 Z スコアには小数点以下の値もマイナスの値もある Z スコアを 10 倍して 50 を足した値が 偏差値 偏差値 60 は 標準偏差 1 つ分プラスである という意味 上側確率 標準正規分布の特徴 全体の面積を 1 とした際の ある値より上 の面積が既に計算済み 斜線の部分の面積は全体の 2.5% 標準偏差 ±1 の範囲に 全体の 68.26% が入る このテストの結果は平均 5.0 点で 平均点を中心とした ±2.36 点の範囲に全体の 68.26% のデータが入る といえる
10 講義ノート p.10 SPSS での Z スコアと偏差値の求め方 ただし SPSS では不偏標準偏差 ( 不偏分散の平方根 ) を用いて計算される データビューに Excel のデータをコピーする fig. Excel のデータをコピー & 貼り付け 変数ビューを編集する fig. 変数ビューの 名前 と 尺度 を編集 分析 記述統計 記述統計 を選択 fig. メニューから分析方法を選択
11 講義ノート p.11 Z スコアに変換する変数の指定 標準化された値を変数として保存 にチェック fig. 変数の指定 必要なら記述統計のオプションを指定 fig. 記述統計のオプションを指定 続行ボタンを押すと 結果と共にデータビューに Z スコアの値が自動的に入力される fig. Z スコアの出力結果
12 講義ノート p.12 Z スコアと偏差値 いわゆる 偏差値 は Z スコアを 10 倍し 50 を加算するという線形変換をした値である 偏差値 =Z スコア *10+50 SPSS では以下のようにして算出することが可能である 前提として Z スコアを算出しておく 変換 変数の計算 を選択 fig. 変数の計算を選択 出現した 変数の計算 ダイアログボックスで Z スコアの変数 を選択する 数式 欄で その変数名に 10 を乗算し 50 を加算する Z 成績 *10+50 となる目標変数の名称を入力する ( ここでは 偏差値 とした ) fig. 目標変数と数式を入力 OK ボタンを押すと 全データの偏差値が出力される
13 講義ノート p.13 fig. 偏差値の出力 Excel での偏差値の求め方 各 Z スコアのセルを指定し = セル番地 *10+50 として算出する 練習問題 以下のサンプルデータの菓子 A と菓子 B について それぞれ基本統計量と Z スコアを求めなさい 名前 性別 菓子 A 菓子 B 安藤 石井 今井 上田 遠藤 大塚 大和田 香山 桑原 近藤 佐藤 島村 杉田 立川 戸田 新倉 深町 町田 山田 横川 2 6 3
14 講義ノート p.14 第 2-3 回課題 ( 次々回授業前までを提出期限とする ) なお 計算には Excel を用いても SPSS を用いても良いが どちらの環境で算出したかを明記すること 問 1 あるテストを 10 人に課したところ 得点が以下のようなものになった a:22 b:24 c:55 d:46 e:47 f:38 g:53 h:60 i:74 j: 平均値を求めなさい 1-2 偏差平方和を求めなさい 1-3 分散を求めなさい 1-4 標準偏差を求めなさい 1-5 f と i の z スコアを求めなさい 1-6 g の偏差値を求めなさい 問 2 データ数が 25 分散が 16.0 であったとき 標準偏差と偏差二乗和を求めなさい 問 3 以下のデータから平均値 偏差二乗和 分散 標準偏差を求めなさい また j の偏差値を求めなさい a:48 b:42 c:49 d:43 e:51 f:59 g:65 h:68 i:78 j:84 平均値は小数点以下第 1 位まで求め 散布度は小数点以下第 2 位まで求めなさい 偏差値は整数位までで 良いものとする 問 4 10 人のデータの値が全て同じものであった場合 標準偏差を求めることはできるかどうか考察しなさい
[12]SPSS_01.indd
データ分析 (SPSS) 第 01 回講義ノート p.1 講義ノート用スペース その回の授業の内容について 箇条書きや図版などが書き記されている 講義ノートは当該授業の翌週までしか配布しないので注意すること ノートの取り方 この部分 ( 右側 ) に書き込み書き込みをするのは主に授業中 スライドにしか書いてないことなどは 必要に応じてノートに追記を行うこと 講義ノートの活用法 授業中でふれる内容は
第4回
Excel で度数分布表を作成 表計算ソフトの Microsoft Excel を使って 度数分布表を作成する場合 関数を使わなくても 四則演算(+ */) だけでも作成できます しかし データ数が多い場合に度数を求めたり 度数などの合計を求めるときには 関数を使えばデータを処理しやすく なります 度数分布表の作成で使用する関数 合計は SUM SUM( 合計を計算する ) 書式 :SUM( 数値数値
Microsoft PowerPoint - データ解析基礎2.ppt
データ解析基礎. 度数分布と特性値 keyword データの要約 度数分布表, ヒストグラム 分布の中心を表す基本統計量 平均, 最頻値, 中央値 分布のばらつきを表す統計量 分散, 標準偏差 統計データの構造 - データ解析の目的 具体的な対象 ( 母集団 ) についての調査結果 ( 標本をどう加工 処理し, 有益な情報を引き出すかである. 加工 処理するための調査結果として, データ ( 観測データ
Microsoft PowerPoint ppt
情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています
経営統計学
5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており
目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順
SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3
Microsoft PowerPoint - 基礎・経済統計6.ppt
. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別
目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...
Microsoft Excel 2013 - グラフ完成編 - 明治大学教育の情報化推進本部 2017 年 2 月 1 日 目次 1. はじめに... 2 1.1. Excel シートからグラフの選択... 2 1.2. グラフの各部の名称... 3 2. 成績の複合グラフを作成... 4 2.1 各生徒の 3 科目の合計点を求める... 4 2.2 合計点から全体の平均を求める... 5 2.3
PowerPoint プレゼンテーション
総務省 ICTスキル総合習得教材 概要版 eラーニング用 [ コース3] データ分析 3-3: 基本統計量 クロス集計表の作成 [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 座学実習紹介[3] ピボットテーブルとクロス集計表 本講座の学習内容 (3-3: 基本統計量 クロス集計表の作成 ) 講座概要 数値データの尺度に基づく
Microsoft PowerPoint - e-stat(OLS).pptx
経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
散布度
散布度 統計基礎の補足資料 2018 年 6 月 18 日金沢学院大学経営情報学部藤本祥二 基本統計量 基本統計量 : 分布の特徴を表す数値 代表値 ( 分布の中心を表す数値 ) 平均値 (mean, average) 中央値 (median) 最頻値 (mode) 散布度 ( 分布のばらつき具合を表す数値 ) 分散 (variance) 標準偏差 (standard deviation) 範囲 (
Microsoft Word - apstattext04.docx
4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1
第1回
やすだ社会学研究法 a( 2016 年度春学期担当 : 保田 ) 基礎分析 ( 1): 一変量 / 二変量の分析 SPSSの基礎 テキスト pp.1-29 pp.255-257 データの入力 [ データビュー ] で Excelのように直接入力できる [ 変数ビュー ] で変数の情報を入力できる 名前 変数の形式的なアルファベット名例 )q12 ラベル 変数の内容を表現例 ) 婚姻状態値 各値の定義例
コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx
コンピュータリテラシ 第 6 回表計算 2 このスライド 例題 http://cobayasi.com/jm/6th/6th.pdf /reidai6.xlsx /reidai6a.xlsx 課題 12 /reidai6b.xlsx /table12_13.xlsx 今日の学習要点 ( テキスト P152-167) IF 関数の使い方 IF 関数による条件判定 複合条件による判定 順位付け (RANK.EQ)
Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ
カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では
モジュール1のまとめ
数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST
Medical3
Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー
Microsoft Word - lec_student-chp3_1-representative
1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )
データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2
春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの
基礎統計
基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと
JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
はじめに:ロシア政治を考える視点
エクセルによる表計算の方法 (2): 偏差値の計算 UENO Toshihiko, Professor of Russian Politics Department of Russian Language and Studies, Faculty of Foreign Studies, Sophia University e-mail: [email protected];
データ解析
データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第
Microsoft PowerPoint - Statistics[B]
講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 [email protected]
スライド 1
6B-1. 表計算ソフトの操作 ( ) に当てはまる適切な用語とボタン ( 図 H 参照 ) を選択してください ( 選択肢の複数回の選択可能 ) (1) オートフィルオートフィルとは 連続性のあるデータを隣接 ( りんせつ ) するセルに自動的に入力してくれる機能です 1. 図 1のように連続した日付を入力します *( ア ) は 下欄 ( からん ) より用語を選択してください セル A1 クリックし
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
Microsoft Word - Stattext12.doc
章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ
講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー
社会人のためのデータサイエンス演習第 2 週 : 分析の概念と事例第 1 回 :Analysis( 分析 ) とは講師名 : 今津義充 1 講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデータ分析基礎
ANOVA
3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.
Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (
http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています
3章 度数分布とヒストグラム
度数分布とヒストグラム データとは 複雑な確率ゲームから生まれたと考えてよい データ分析の第一歩として データの持つ基本的特性を把握することが重要である 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える データが母集団からのランダムサンプルならば 母集団についての推測を行う 度数分布とヒストグラムの作成
<4D F736F F D20438CBE8CEA8D758DC F0939A82C282AB2E646F63>
C 言語講座第 2 回 作成 : ハルト 前回の復習基本的に main () の中カッコの中にプログラムを書く また 変数 ( int, float ) はC 言語では main() の中カッコの先頭で宣言する 1 画面へ出力 printf() 2 キーボードから入力 scanf() printf / scanf で整数を表示 / 入力 %d 小数を表示 / 入力 %f 3 整数を扱う int 型を使う
Medical3
1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー
スライド 1
第 6 章表計算 B(Excel 2003) ( 解答と解説 ) 6B-1. 表計算ソフトの操作 1 条件付き書式の設定 1. ( ア )=E ( イ )= お 条件付き書式とは セルの数値によりセルの背景に色を付けたり 文字に色を付けたり アイコンをつけたりして分類することができる機能です 本問題では 以下の手順が解答となります 1 2 ユーザー定義の表示形式 1. ( ア )=2 ( イ )=4
<4D F736F F D AAE90AC94C5817A E7793B188C481698D5D E7397A791E58A A778D5A814094F68FE3816A2E646F63>
単元観 中学校学習指導要領では 目的に応じて資料を収集し, コンピュータを用いたりするなどして表やグラフに整理し, 代表値や資料の散らばりに着目してその資料の傾向を読み取ることができるようにする と示されている この内容を受け, 本単元では, 資料を収集, 整理する場合には, 目的に応じた適切で能率的な資料の集め方や, 合理的な処理の仕方が重要であることを理解すること, ヒストグラムや代表値などについて理解し,
3章 度数分布とヒストグラム
3 章度数分布とヒストグラム データの中の分析 ( 記述統計 ) であれ データの外への推論 ( 推測統計 ) であれ まず データの持つ基本的特性を把握することが重要である 1 分析の流れ データの分布 ( 散らばり ) を 度数分布表にまとめ グラフ化する 3 章 グラフに 平均値や分散など 分布の特徴を示す客観的な数値を加える 4 5 6 章 データが母集団からのランダムサンプルならば 母集団についての推測を行う
Microsoft Word - mstattext02.docx
章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で
Microsoft Word - SPSS2007s5.doc
第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では
目次 1. ひまわり先生の基本設定は, かんたん3ステップ 3 <ステップ1> 先生の登録 3 <ステップ2> 児童の登録 4 <ステップ 3> テストの登録 6 (1) テストの登録の手順 6 (2) 自作のテストやプリントの追加 7 (3) 評価基準の設定 8 (4) 単元の移動, 単元の保留
基本の設定 ( かんたん 3 ステップ ) -1- 目次 1. ひまわり先生の基本設定は, かんたん3ステップ 3 先生の登録 3 児童の登録 4 テストの登録 6 (1) テストの登録の手順 6 (2) 自作のテストやプリントの追加 7 (3) 評価基準の設定 8 (4) 単元の移動, 単元の保留 9
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
Excelによる統計分析検定_知識編_小塚明_1_4章.indd
第2章 1 変量データのまとめ方 本章では, 記述統計の手法について説明します 具体的には, 得られたデータから表やグラフを作成し, 意昧のある統計量を算出する方法など,1 変量データのまとめ方について学びます 本章から理解を深めるための数式が出てきますが, 必ずしも, これらの式を覚える必要はありません それぞれのデータの性質や統計量の意義を理解することが重要です 円グラフと棒グラフ 1 変量質的データをまとめる方法としてよく使われるグラフは,
初めてのプログラミング
Excel の使い方 2 ~ 数式の入力 グラフの作成 ~ 0. データ処理とグラフの作成 前回は エクセルを用いた表の作成方法について学びました 今回は エクセルを用いたデータ処理方法と グラフの作成方法について学ぶことにしましょう 1. 数式の入力 1 ここでは x, y の値を入力していきます まず 前回の講義を参考に 自動補間機能を用いて x の値を入力してみましょう 補間方法としては A2,
PowerPoint プレゼンテーション
1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定
平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )
データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65
経済統計分析1 イントロダクション
1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,
Microsoft PowerPoint - A1.ppt [互換モード]
011/4/13 付録 A1( 推測統計学の基礎 ) 付録 A1 推測統計学の基礎 1. 統計学. カイ 乗検定 3. 分散分析 4. 相関係数 5. 多変量解析 1. 統計学 3 統計ソフト 4 記述統計学 推測統計学 検定 ノンパラメトリック検定名義 / 分類尺度順序 / 順位尺度パラメトリック検定間隔 / 距離尺度比例 / 比率尺度 SAS SPSS R R-Tps (http://cse.aro.affrc.go.jp/takezawa/r-tps/r.html)
基本統計量・クロス集計表の作成
総務省 ICT スキル総合習得教材 [ コース 3] データ分析 知 難 易 技 3-3: 基本統計量 クロス集計表の作成 http://www.soumu.go.jp/ict_skill/pdf/ict_skill_3_3.pdf [ コース1] データ収集 [ コース2] データ蓄積 [ コース3] データ分析 [ コース4] データ利活用 1 2 3 4 5 1 実習本講座の学習内容 [3-3:
Microsoft Word - 操作マニュアル-Excel-2.doc
Excel プログラム開発の練習マニュアルー 1 ( 関数の学習 ) 作成 2015.01.31 修正 2015.02.04 本マニュアルでは Excel のプログラム開発を行なうに当たって まずは Excel の関数に関する学習 について記述する Ⅰ.Excel の関数に関する学習 1. 初めに Excel は単なる表計算のソフトと思っている方も多いと思います しかし Excel には 一般的に使用する
PowerPoint プレゼンテーション
学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: [email protected]) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合
Microsoft PowerPoint - 資料04 重回帰分析.ppt
04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline
< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )
2005 年度茅ヶ崎市情報教育研修会 < 目次 > 1. 練習ファイルのダウンロード... 2 2. 表計算ソフト Excel の基本... 3 2-1 Excel でできること... 3 2-2 Excel の画面... 3 2-3 セル 行 列の選択... 4 2-4 セルにデータを入力する ( 半角英数字の場合 )... 4 2-5 セルにデータを入力する ( 日本語の場合
Microsoft PowerPoint - 測量学.ppt [互換モード]
8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,
スライド 1
(6A-1) 1 条件付き書式の設定 英語 数学 国語 の点数が 80 点より高い場合は セルの数字を 太字斜体 の 赤 にする 1. 条件の設定 以下の問の ( ) に当てはまる適切なものを選択してください セル [B3:D5] を範囲選択 [ ホーム ] タブ ( 図 A) の ( ア ) ボタンをクリック 一覧から図 1の ( イ ) をクリックし さらに図 2の ( ウ ) をクリック 2.
Microsoft Word - 保健医療統計学112817完成版.docx
講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
不偏推定量
不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)
統計学の基礎から学ぶ実験計画法ー1
第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>
第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを
はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式
統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値
相関係数と偏差ベクトル
相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする
Ecel 演習問題 Work Shee 解答 第 章 Ecel 演習問題 WorkShee 解答 問題 - 4 8 7 転置行列 4 8 7 TRANSPOSE( ) 問題 - X.6 4 4.8 8 4.9 6. 7 48 8. X 転置行列 4 8 7 4 6 48 TRANSPOSE( ).6 4.8.9. 8. 問題 -.6 4 4.8 8 y.9. 7 8. 転置行列 4 8 7 TRANSPOSE(
PowerPoint プレゼンテーション
平成 28 年度全国学力 学習状況調査 中学校数学 2 特徴的な問題 A 問題より A B C 垂線の作図方法について理解しているかどうか 3 関連問題 問題番号 問題の概要 全国正答率 三重県 公立 正答率 H24A 4 (1) 角の二等分線の作図の方法で作図された直線がもつ性質として, 正しい記述を選ぶ 58.2% 56.9% H26A 4 (2) 線分の垂直二等分線の作図の方法で作図される直線について,
正誤表(FPT1004)
1 Introduction 本書で学習を進める前に ご一読ください 1 第 1 章関数の利用 第 章表作成の活用 第 3 章グラフの活用 第 章グラフィックの利用 SmartArt 第 5 章複数ブックの操作 第 章データベースの活用 第 7 章ピボットテーブルとピボットグラフの作成 第 章マクロの作成 第 9 章便利な機能 総合問題 Excel 付録 1 ショートカットキー一覧 Excel 付録
口腔ケア アセスメント解析データベース 平成 23 年度に作成した, 口腔ケア アセスメント票 の結果を効率的に管理, 分析できるソフトです 平成 24 年度, 仙台保健福祉事務所が介護老人保健施設ももせ塩竈において実施した, 口腔ケアの取組強化を目的としたモデル事業において, 仙台保健福祉事務所と
口腔ケア アセスメント結果を 入力, 管理, 分析するソフト! 宮城県リハビリテーション支援センター 口腔ケア アセスメント解析データベース 平成 23 年度に作成した, 口腔ケア アセスメント票 の結果を効率的に管理, 分析できるソフトです 平成 24 年度, 仙台保健福祉事務所が介護老人保健施設ももせ塩竈において実施した, 口腔ケアの取組強化を目的としたモデル事業において, 仙台保健福祉事務所と共同で開発しました
