目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Similar documents
Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Medical3

第1回

Microsoft Word - SPSS2007s5.doc

第1回

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint - e-stat(OLS).pptx

Medical3

ANOVA

Microsoft Word - SPSS_Manual_I.doc

情報工学概論

統計的データ解析

スライド 1

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

経営統計学

EBNと疫学

Microsoft Word - å“Ÿåłžå¸°173.docx

スライド 1

第4回

Microsoft Word - Stattext12.doc

Microsoft PowerPoint ppt

ビジネス統計 統計基礎とエクセル分析 正誤表

因子分析

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

ワープロソフトウェア

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

Microsoft Word - apstattext04.docx

データ解析

データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

無党派層についての分析 芝井清久 神奈川大学人間科学部教務補助職員 統計数理研究所データ科学研究系特任研究員 注 ) 図表は 不明 無回答 を除外して作成した 設問によっては その他 の回答も除外した この分析では Q13 で と答えた有権者を無党派層と定義する Q13 と Q15-1, 2 のクロ

<4D F736F F F696E74202D B835E82CC8EED97DE B835E82CC834F BB F0955C82B793C190AB926C>

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

Microsoft Word - 保健医療統計学112817完成版.docx

経済データ分析A

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

< 目次 > 1. 練習ファイルのダウンロード 表計算ソフト Excel の基本 Excel でできること Excel の画面 セル 行 列の選択 セルにデータを入力する ( 半角英数字の場合 )

PowerPoint プレゼンテーション

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft Word - mstattext02.docx

MedicalStatisticsForAll.indd

基礎統計

Microsoft PowerPoint ppt

Excel2013 データベース1(テーブル機能と並べ替え)

講義「○○○○」

青焼 1章[15-52].indd

Microsoft PowerPoint - データ解析基礎2.ppt

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

スライド 1

目次 はじめに P.02 マクロの種類 ---

散布度

練習問題 1-1 1タイトルバー 2クイックアクセスツール 3リボン バー 4タブ 5 名前ボックス 6 数式バー 7 列番号 8 行番号 9アクティブセル 10マウスポインター 11シート見出し 12ステータスバー 練習問題 1-2 [1] セルの範囲選択始点から終点のセルをドラッグ 列の選択列番

問題 1 次の文章は Excel の作業環境について述べたものである 下線部の記述の正誤を判断し 解答群 { } の記号で答えよ ただし 下線部以外の記述に誤りはないものとする 設問 1. クイックアクセスツールバーには アプリケーション名やファイル名が表示される 設問 2. 数式バーのる ボタンを

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式

相関分析・偏相関分析

次の病院 薬局欄は 氏名 欄に入力された値によって入力すべき値が変わります 太郎の行く病院と花子の行く病院が必ずしも同じではないからです このような違いを 設定 シートで定義しておきましょう 太郎の行く病院のリストを 太郎 花子の行く病院のリストを 花子 として 2 つのリストが定義されています こ

Microsoft PowerPoint - Econometrics pptx

Microsoft Word - apstattext01b.docx

Microsoft Word - appendix_b

情報処理 基 礎

Microsoft Word - 【付録4】アンケート②結果.docx

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

年齢別人数計算ツールマニュアル

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

Microsoft Word - lec_student-chp3_1-representative

PowerPoint プレゼンテーション

目次 第 1 章はじめに 取扱いについて 記載内容について... 6 第 2 章基本操作 Excel Online を開く ファイル ( ブック ) を作成する ファイル ( ブック ) を開く..

講座内容 第 1 週 データサイエンスとは 第 2 週 分析の概念と事例ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )1 第 3 週 分析の具体的手法ビジネス課題解決のためのデータ分析基礎 ( 事例と手法 )2 第 4 週 ビジネスにおける予測と分析結果の報告ビジネス課題解決のためのデー

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

ドリルダウン棒グラフを右クリックすると ドリルダウン が選択でき ドリルダウンすることで更に細かな視点で構成比を確認できます 例えば グラフの出力値を 品種 にしてドリルダウンで メーカー を設定すると 選択された品種の中でどのメーカーが売上に貢献しているかを確認することが可能です 該当商品の確認棒

Microsoft Word - 操作マニュアル-Excel-2.doc

2 / 18 ページ 第 13 講データの活用とデータマップの作成 13-1 ホームページの保存 ホームページ (Web ページ ) に表示される様々な情報を ファイルとして保存することができます

講義資料 P2 文献の種類 著書論文 学会誌紀要報告書市販雑誌 その他学会発表 種類具体例注意すること出版社 保育学研究 ( 日本保育学会 ) 児童学研究 ( 聖徳大学 ) 児童心理 日本学術会議協力学術研究団体 / 査読付大学のレベル / 査読付 (2) 論文の書式 * 各研究科 指導教官によって

スライド 1

win版8日目

3章 度数分布とヒストグラム

PowerPoint プレゼンテーション

スプレッドシートについて

第2章 MS-Windowsって何だろう?

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

第 14 講複数ソフトの組み合わせ テキストファイルを Excel で開く 2 / 17 テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 13 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Off

Microsoft PowerPoint - データ解析演習 0520 廣橋

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

第7章

日向幹線新設工事に係る業務支援システム

§2-2 記述統計と推測統計

[12]SPSS_01.indd

簡易版メタデータ

スライド タイトルなし

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

スライド 1

A. 表の作成 はじめに 講座テキストページに保存されている表 1 の元データをエクセル 2010 にコピーします (No1) 講座テキスト (Web ページ ) に示した表 1 過去 12 年間の為替と外貨準備の推移 のデータ表を選択する この表 1 を選択した状態で WEB ページの 編集 コピ

おすすめページ

Transcription:

SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527

目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3 章グラフの作成... 11 3.1 はじめに... 11 3.2 棒グラフ... 11 3.3 グラフの編集方法... 12 3.4 円グラフ... 14 3.5 欠損値について... 15 4 章統計解析の基礎...17 4.1 はじめに... 17 4.2 基本統計量... 17 4.3 度数分布表... 19 4.4 ヒストグラム... 20 4.5 散布図と相関係数... 22 4.6. クロス集計 2 種類の質的データの分析 ( 独立性の検定 )!!... 24 4.7 回帰分析... 26 5 章おわりに...30 2

1 章 SPSS の基礎 基本 1.1 はじめにこのテキストは SPSS の基本操作の習得を目指して作成されたものである SPSS とは 統計解析ソフトウェアの製品群のことであり 現在では IBM 社の製品となっている 講習会では SPSS Statistic ver.21 を扱う 以下では 単に SPSS と表記してある場合 この SPSS Statistic ver.21 を指すこととする SPSS の特徴は 信頼が高いこと 簡便であることである SPSS の開発以来 統計処理ソフトの代表的存在であり GUI による操作で excel などよりも簡単に 高度な統計解析を行うことが可能となっている 本テキストでは 2 章で簡単なデータの編集 3 章でグラフの作成 4 章で統計解析の基礎の説明を行っている 1.2 基本操作方法 起動方法 スタート すべてのプログラム IBM SPSS Statistics IBM SPSS Statistics 21 図 1.1: 起動方法 3

図 1.2:SPSS の表示画面 ( データエディタ ) セルで区切られている 注意 :SPSS は データエディタ と ビューア で構成される データの入力方法 1 変数ビュー (V) で定義 2 データビュー (D) で入力 図 1.3: 変数ビューの入力例 図 1.4: データビューの入力例 3 excel などからデータを コピー 貼り付け することも可能 4

注意 : データビューと変数ビューについて データビュー : データの入力を行う 変数ビュー : 入力するデータの定義を行う 以下を設定する 名前 : 表示させる名前 型 : 数値型や文字列型などデータの型を定義 小数桁数 : 表示する小数点以下の桁数 ラベル : データの説明部分 グラフなどで表示される 値 : 指定することで表示を変換できる ( 例 :1 男 ) 尺度 : 名義データ 順序データ スケールデータに分類する ( 重要 ) 名義データ : 名前 性別などの順列をつけられない質的データ 順序データ : 年代などの順列をつけられる質的データ スケールデータ : 身長などの量的データ 注意 : 上記の例において身長 2 は以下の区分とした 表 1.1: 身長 2 の区分 身長 [cm] 区分 150 未満 1 150 以上 2 160 以上 3 170 以上 4 180 以上 5 ファイルの保存ファイル (F) 名前を付けて保存 (A) ファイルの場所 ファイル名の指定 保存注意 : データエディタ ( データビュー及び変数ビュー ) のデータに関しては拡張子.sav で保存される 一方 ビューアのデータに関しては.spv で保存される それぞれを保存することに注意してほしい ファイルを開く( データエディタの場合 ) ファイル (F) 開く (O) データ(A) ファイル名の指定 開く注意 :excel データなどを開くこともできる ファイル名を指定する際 ファイルの種類を すべてのファイル (*.*) などに変更すればよい ファイルを開く ( ビューアの場合 ) ファイル (F) 開く (O) 出力 (O) ファイル名の指定 開く 5

2 章データの編集 2.1 はじめにこの章では セルに入力されたデータに関しての簡単な編集 処理として 値ラベルの利用 や 値のグループ化 などを扱う 実際に SPSS 講習会例題.sav を例題として操作方法などを紹介していく なお SPSS 講習会例題.sav は付録 A のアンケートをコンピュータを使ってランダムに答えたものであり 何の信憑性ないことに注意されたい 2.2 値ラベルの利用 例 : 性別が 1(2) と表示されているのを 男性 ( 女性 ) と表示したい 操作方法 1 変数ビュー (V) において 性別 値 セルをクリック をクリック 2 値 (U) に <1> ラベル (L) に < 男性 > と入力 追加 (A) 3 値 (U) に <2> ラベル (L) に < 女性 > と入力 追加 (A) OK 4 データビュー (D) において 表示 (V) 値ラベル (V) にチェック 注意 :< > と入力する場合 記号 <> は入力しない ( 文中においては 入力する文字と文章とを区別するために記号 <> を使用している ) 図 2.1: 値ラベルの 設定画面 結果 略 6

2.3 計算結果に基づく新変数の作成 例 : 身長 [cm] を身長 [m] に変更したい 操作方法 1 変換 (T) 変数の計算 (C) 2 目標変数 (T) に< 身長 m>と入力する 3 数式 (E) に< 身長 cm>をドラッグ </100>と入力 ( 画面上のキーボードからも入力可 ) OK 4 変数ビュー (V) において 身長 m の尺度を スケール と変更する 図 2.2: 変数の計算 の設定画面 結果 略 7

2.4 値のグループ化 例 : 年齢を 10 歳毎 ( 年代 ) で区切りたい 操作方法 1 変換 (T) 他の変数への値の再割り当て (R) 2 入力変数 -> 出力変数 (V) に< 年齢 >をドラッグ 名前 (N) に< 年代 >と入力 変更 (H) 3 今までの値と新しい値 (O) 今までの値 / 範囲 (N) に<20>から (T)<29>と入力 新しい値 / 値 (L) に<20>と入力 追加 (A) 4 同様に 30 から 39 30 40 から 49 40 50 から 59 50 と入力 5 今までの値 / 範囲 : 下の値から最大値まで (E) に<60> 入力 新しい値 / 値 (L) に<60>と入力 追加 (A) 続行 OK 6 変数ビュー (V) において 年代 の尺度を 順序 に変更する 7 値ラベルを 20=20 代のように設定する 図 2.3: 他の変数への値の再割り当て の設定画面 8

図 2.4: 今までの値と新しい値 の設定画面 結果 略 9

2.5 値の昇順 降順 例 : テストの点数の良い順に並べ替えたい 操作方法 1 データ (D) ケースの並べ替え (O) 2 並べ替え (S) に < テスト > をドラッグ 降順 (D) にチェック OK 図 2.5: ケースの並び替え の設定画面 結果 略 10

3 章グラフの作成 3.1 はじめにこの章では 2 章で用いた SPSS 研修会例題.sav のデータに関して グラフを作成 編集方法について述べる 今回は 棒グラフ と 円グラフ を作成 編集する また 欠損値の処理 についても簡単に述べる 3.2 棒グラフ 例 : 県別の出身者数の棒グラフを描く 操作方法 1 1 グラフ (G) レガシーダイアログ (L) 棒 (B) ( 単純 グループごとの集計 (G) ) 定義 2 カテゴリ軸 (X) に < 出身地 > をドラッグ OK 図 3.1: 単純棒グラフ の設定画面 11

3.3 グラフの編集方法 操作方法 1 ビューアにおいて グラフをダブルクリック= 図表エディタが開く 2 図表エディタにおいて アイコンをクリック ( 編集 1) 3 図表エディタにおいて 変更したい部分をダブルクリック= 黄線で囲まれる プロパティが開く プロパティで変更する ( 編集 2) 4 図表エディタを閉じる 図 3.2: 図表エディタの例 グラフの編集例 編集 1 の例 タイトルの挿入 タイトルの挿入 をクリック タイトルを入力 適当な場所をクリック 編集 2の例 グラフの色の変更グラフ部分をダブルクリック= 黄線で囲まれる プロパティが開く 塗りつぶしと枠線において 好きな色を選択 適用 12

文字の編集方法 変更したい部分をダブルクリック = 黄線で囲まれる プロパティが開く もう一度クリック 文字を 入力する 適当な場所をクリック 図 3.3: グラフ例 13

3.4 円グラフ 例 : 携帯キャリアの割合を表す 操作方法 1 グラフ (G) レガシーダイアログ (L) 円 (E) ( グループごとの集計 (G) ) 定義 2 分割の定義 (B) に < 使用している携帯のキャリア [ アンケート 1]]> をドラッグ OK 図 3.4: 円グラフの定義 の設定画面 14

結果 図 3.5: 携帯キャリアの割合 ( 携帯を持っていない場合を含む ) 3.5 欠損値について欠損値とは 無回答 や 無効回答 などを集計から除去する値のことである 例えば上記 3.4 の例において 携帯電話を持っている人の中でのキャリアの割合を調べたい場合 携帯電話を 持っていない 人を 欠損値 として設定すれば良い 操作方法 1 変数ビュー (V) において アンケート 1 欠損値 セルをクリック をクリック 2 個別の欠損値 (D) にチェック <9> と入力 OK 3 上記と同様に円グラフを作成する 15

図 3.6: 欠損値 の設定画面 図 3.7: 携帯キャリアの割合 ( 携帯を持っていない場合を除く ) このように 欠損値を設定すると 欠損値を除いたデータで処理を行う 16

4 章統計解析の基礎 4.1 はじめにこの章では 統計解析の基礎として 基本統計量 ( 平均など ) 度数分布表 回帰分析 などを扱う それぞれに関しては統計学として扱うのではなく SPSS の操作方法を主として扱うことに注意されたい 4.2 基本統計量 例 : 身長の平均などを知りたい 操作手順 1: すべてのデータをまとめて扱うとき 1 分析 (A) 記述統計 (E) 記述統計 (D) 2 変数 (V) に身長をドラッグ 3 オプション (O) 平均値 (M) など 求める項目にチェック 続行 OK 図 4.1: 記述統計量 の設定画面 結果 1: 度数 最小値 最大値 平均値 標準偏差 分散 身長 cm 1000 141.0 188.2 165.947 8.2308 67.746 有効なケースの数 ( リストごと ) 1000 表 4.1: 記述統計量 17

操作方法 2: 男女別の身長 のような条件があるとき 1 分析 (A) 記述統計 (E) 探索的 (E) 2 従属変数 (D) に< 身長 cm> 因子(F) に< 性別 >をドラッグ 3 統計量 (S) 記述統計量 (D) 外れ値(O) にチェック 続行 4 作図 (T) 従属変数ごとの因子レベル (F) ヒストグラム(H) にチェック 続行 OK 図 4.2: 探索的 の設定画面 18

結果 2 表 4.2: 記述統計 性別 身長 cm 男性 平均値 女性 平均値の 95% 信頼区間 5% トリム平均 中央値 分散 標準偏差 最小値 最大値 範囲 4 分位範囲 歪度 尖度 平均値 平均値の 95% 信頼区間 5% トリム平均 中央値 分散 標準偏差 最小値 最大値 範囲 4 分位範囲 歪度 尖度 統計量 標準誤差 171.951.2325 下限 171.494 上限 172.408 171.992 171.900 28.381 5.3274 156.1 188.2 32.1 7.0 下限 158.840 上限 159.783 -.120.107.155.213 159.312.2400 159.332 159.200 27.355 5.2302 141.0 175.8 34.8 6.9 -.047.112.209.224 4.3 度数分布表 例 : 県別の出身者数を知りたい 操作方法 1: 度数分布表のみを作成する場合 1 分析 (A) 記述統計 (E) 度数分布表 (F) 2 変数 (V) に < 出身地 > をドラッグ OK 19

図 4.3: 度数分布表 の設定画面 操作方法 2: 棒グラフも同時に作成する場合 1 分析 (A) 記述統計 (E) 度数分布表 (F) 2 変数 (V) に出身者をドラッグ 3 図表 (C) 棒グラフ (B) にチェック 続行 OK 結果 有効 表 4.3: 出身地 度数 パーセント 有効パーセント 累積パーセント 東京 368 36.8 36.8 36.8 神奈川 243 24.3 24.3 61.1 埼玉 184 18.4 18.4 79.5 千葉 180 18.0 18.0 97.5 その他 25 2.5 2.5 100.0 合計 1000 100.0 100.0 棒グラフ : 略 4.4 ヒストグラム 例 : 男女別の身長の分布を知りたい 操作方法 1 グラフ (G) レガシーダイアログ (L) ヒストグラム (I) 2 変数 (V) に < 身長 cm> をドラッグ 行 (W) に < 性別 > をドラッグ OK 20

結果 図 4.4: ヒストグラム の設定画面 図 4.5: 男女別の身長の分布図 21

4.5 散布図と相関係数 例 : 身長と体重にはどんな関係があるのだろうか 散布図の作成方法 1 グラフ (G) レガシーダイアログ (L) 散布図 / ドット (S) 単純な散布図 定義 2 Y 軸 (Y) に < 体重 kg> X 軸 (X) に < 身長 cm> をドラッグ OK 図 4.6: 単純散布図 の設定画面 22

図 4.7: 身長と体重の散布図 相関係数の求め方 1 分析 (A) 相関 (C) 2 変量 (B) 2 変数 (U) に < 身長 cm> と < 体重 kg> をドラッグ OK 図 4.8: 2 変量の相関分析 の設定画面 23

結果 表 4.4: 相関係数 身長 cm 体重 kg 身長 cm Pearson の相関係数 1.580 ** 有意確率 ( 両側 ).000 N 1000 1000 体重 kg Pearson の相関係数.580 ** 1 有意確率 ( 両側 ).000 N 1000 1000 **. 相関係数は 1% 水準で有意 ( 両側 ) です 注意 : 相関係数について相関係数とは 2 変量にどの程度の関係性があるかを表す指標であり おおまかに以下のような関係となっている 表 4.5: 相関係数 相関係数 関係性 -1~-0.7 強い負の相関がある -0.7~-0.4 中程度の負の相関がある -0.4~-0.2 弱い負の相関がある -0.2~0.2 ほとんど相関がない 0.2~0.4 弱い正の相関がある 0.4~0.7 中程度の正の相関がある 0.7~1 強い正の相関がある よって 上記の身長と体重の例では 中程度の正の相関がある といえる 4.6. クロス集計 2 種類の質的データの分析 ( 独立性の検定 )!! 例 : 性別によってお酒の好き嫌いに違いはあるのか? 一般的な手順 1 性別によって違いがある( 関連性がある ) と仮定( 対立仮定 2 つの変数は独立ではない ) する 2 性別によって違いはない( 関連性はない ) と仮定( 帰無仮定 2 つの変数は独立である ) する 3 カイ二乗検定を行う=SPSS を用いる 4 有意確率が 0.05(0.01) 以下であるならば 5(1)% の有意水準で 2 つの変数は独立である という帰無仮説は棄却 = 対立仮説の採択 = 性別によって違いがある カイ二乗検定の操作方法 1 分析 (A) 記述統計 (E) クロス集計表(C) 2 行 (O) に< 性別 > 列(C) に<お酒が好きか?[ アンケート 2]>をドラッグ 3 統計量 (S) カイ 2 乗 (H) にチェック 続行 4 クラスタ棒グラフの表示 (B) にチェック OK 24

図 4.9: クロス集計表 の設定画面 棒グラフの編集方法 1 ビューアにおいて 棒グラフをダブルクリック= 図表エディタ プロパティが開く 2 図表エディタにおいて 棒の部分をダブルクリック= 棒の周りが黄線で囲まれる プロパティが変化 3 プロパティ ( 変数 ) において お酒が好きか? を <XCluster> < 積み上げ>に変更 適用 (A) 4 図表エディタにおいて 100% に尺度設定 (S) をクリック 閉じる 結果 漸近有意確率 値 自由度 ( 両側 ) Pearson のカイ 2 乗 80.652 a 1.000 b 連続修正 79.499 1.000 尤度比 81.636 1.000 正確有意確率 ( 両側 ) 正確有意確率 ( 片側 ) Fisher の直接法.000.000 線型と線型による連関 80.571 1.000 有効なケースの数 1000 表 4.6: カイ 2 乗検定 a. 0 セル (.0%) は期待度数が 5 未満です 最小期待度数は 194.28 です b. 2x2 表に対してのみ計算 25

図 4.10: 性別におけるお酒の好き嫌いの比較 Pearson のカイ 2 乗の漸近有意確率 ( 両側 ) が.000 なので 1% の有意水準で帰無仮説は棄却 すなわち 性別によってお酒の好き嫌いに違いがあるといえる 4.7 回帰分析 例 : 広告費から売上高を予測したい ( 広告費と売上高.sav を用いる ) 一般的な手順 1 広告費と売上高には関連性がある と仮定( 対立仮定 ) する 2 広告費と売上高には関連性はない と仮定( 帰無仮定 ) する 3 散布図 回帰直線を描く=SPSS を用いる 4 相関係数を求める=SPSS を用いる 5 回帰分析を行う=SPSS を用いる 6 モデル ( 広告費と売上高の関係 ) を評価する ( 寄与率 F 値など ) 26

散布図 回帰直線の描き方 1 グラフ (G) レガシーダイアログ(L) 散布図 / ドット (S) 単純な散布図 定義 2 Y 軸 (Y) に< 売上高 > X 軸 (X) に< 広告費 >をドラッグ OK 3 ビューアにおいて グラフをダブルクリック= 図表エディタが開く 4 図表エディタにおいて 合計での線の当てはめ をクリック 閉じる 相関係数の求め方 1 分析 (A) 相関 (C) 2 変量 (B) 2 変数 (U) に < 広告費 > と < 売上高 > をドラッグ OK 回帰分析の操作方法 1 分析 (A) 回帰 (R) 線型 (L) 2 従属変数 (D): 売上高 独立変数 (I): 広告費をドラッグ OK 図 4.11: 線型回帰 の設定画面 27

結果 広告費 売上高 図 4.12: 広告費と売上高の関係 表 4.7; 相関係数 広告費 売上高 Pearson の相関係数 1.942 ** 有意確率 ( 両側 ).000 N 100 100 Pearson の相関係数.942 ** 1 有意確率 ( 両側 ).000 N 100 100 **. 相関係数は 1% 水準で有意 ( 両側 ) です b 表 4.8: モデル集計 モデル R R2 乗 調整済み R2 乗 推定値の標準誤差 1.942 a.888.887 99.0787 a. 予測値 : ( 定数 ) 広告費 b. 従属変数売上高 b 表 4.9: 分散分析 モデル平方和 ( 分散成分 ) 自由度平均平方 F 値有意確率 1 回帰 7624191.367 1 7624191.367 776.664.000 a 残差 ( 分散分析 ) 962025.753 98 9816.589 合計 8586217.120 99 a. 予測値 : ( 定数 ) 広告費 b. 従属変数売上高 28

標準化係数 モデル B 標準誤差ベータ t 値有意確率 1 ( 定数 ) -21.046 22.290 -.944.347 広告費 2.083.075.942 27.869.000 a. 従属変数売上高 a 表 4.10: 係数 標準化されていない係数 広告費と売上高には強い正の相関があることがわかる また 分散分析における F 値の有意確率は 0.000 なので 5% の有意水準で帰無仮説を棄却する すなわち 寄与率 (R2 乗値 )88.8% 回帰直線 :( 売 上高 )=2.083 ( 広告費 )-21.046 で 広告費と売上高には関係があると言える 29

5 章おわりにこのテキストでは SPSS の講習として 基本的な操作方法に関しての説明を行った 特に データの編集 グラフの作成 統計解析の基礎を扱った SPSS は統計解析ソフトである 従って 特に4 章のように統計学の知識を要する場合があるが 講習会では時間の関係上 統計学の知識については割愛した 興味を持った箇所などに関しては 図書館などの書籍で調べたり インターネットを活用したりして欲しい 30