<4D F736F F D204A4D5082C982E682E991CE B A F2E646F63>

Similar documents
分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP によるオッズ比 リスク比 ( ハザード比 ) の算出方法と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月改定 1. はじめに本文書は JMP でオッズ比 リスク比 それぞれに対する信頼区間を求める算出方法と注意点を述べたものです この後

このデータは ダイアモンドの価格 ( 価格 ) に対する 評価の影響を調べるために収集されたものです 影響と考えられるものは カラット重量 カラー クラリティー 深さ テーブル径 カット 鑑定機関 の 7 つになります 特に カラット重量 カラー クラリティー カット は 4C と呼ばれ ダイヤモン

Medical3

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

Microsoft PowerPoint - データ解析演習 0520 廣橋

ANOVA

Medical3

また Excel 読み込みウィザードで Excel ファイルを読み込むと 指定した設定が JSL(JMP のスクリプト言語 ) に自動保存できるた め この JSL を実行することにより 簡単に Excel データの再読み込みを行うことができます 次の 2 章では これらの読み込みオプションのいくつ

Progress Notes for fm

目次 はじめに P.02 マクロの種類 ---

操作: グラフビルダー 1. [ グラフ ] > [ グラフビルダー ] を選択します 2. 州 をドラッグし シェープ ゾーンにドロップします 3. 全発生率 をドラッグし 色 ゾーンにドロップします アメリカの地図が表示され 全発生率 は連続変数のため 各州の犯罪発生率 ( の平均値 ) が色の

JUSE-StatWorks/V5 活用ガイドブック

I

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Microsoft Word - mstattext02.docx

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

1. 画面説明 ここでは普通にアプリケーションを開いた場合に表示される対話型画面の説明をしています パスワード ( 再入力 ) パスワード登録 パスワード消去 事前チェックの処理の際に必要になるパスワ

初めてのプログラミング

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 画面説明 ここでは普通にアプリケーションを開いた場合に表示される対話型画面の説明をしています パスワード ( 再入力 ) パスワード登録 パスワード消去 事前チェックの処理の際に必要になるパスワードを

Microsoft Word - 補論3.2

コンテンツ作成基本編

PowerPoint プレゼンテーション

Microsoft PowerPoint - KanriManual.ppt

Microsoft Word - apstattext04.docx

Microsoft Word MSExcel2010

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

年齢別人数計算ツールマニュアル

PowerPoint プレゼンテーション

モデル空間に読み込む場合 AutoCAD では 部分図および座標系の設定を 複合図形 ( ブロック ) にて行います 作図にあたっての流れは下記のとおりとなります (1) 発注図の読み込み (2) 発注図の確認 (3) 発注図の部分図の利用方法や座標設定が要領に従っていない場合の前準備 (4) 作図

第 14 講複数ソフトの組み合わせ テキストファイルを Excel で開く 2 / 17 テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 13 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Off

PowerPoint プレゼンテーション

PrimerArray® Analysis Tool Ver.2.2

統計的データ解析

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

OpRisk VaR3.2 Presentation

Microsoft Word - JMP_ExcelWizard.docx

コンテンツ作成基本編

EX-フォトビューアの起動方法と使い方

と 測定を繰り返した時のばらつき の和が 全体のばらつき () に対して どれくらいの割合となるかがわかり 測定システムを評価することができる MSA 第 4 版スタディガイド ジャパン プレクサス (010)p.104 では % GRR の値が10% 未満であれば 一般に受容れられる測定システムと

変更された状態 同様に価格のセルを書式設定する場合は 金額のセルをすべて選択し 書式 のプルダウンメニューか ら 会計 を選択する すると が追加され 金額としての書式が設定される 金額に と が追加 会計 を設定 2.2. テーブルの設定 ここでは 書式設定された表をテーブルとして Excel に

2 / 25 複数ソフトの組み合わせ テキストファイルを Excel で開く テキスト形式 (.txt) で保存したファイルを Excel で利用しましょう 第 14 講で保存した west.txt を Excel で開きます 1. Excel を起動します 2. [Office ボタ

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

(3) このファイルは 申込書の 5 枚複写分 ( 1 営業用 2 調査会社用 3 委託工事会社用 4 電気工事会社 ( 控 ) 5 お客さま ( 控 ) と 電気工事士 測定器 の計 7 シートから構成されています 申込書作成に関しては 1 営業用 のシートに入力することで 2~5 のシートにも反

比 例 ハザードモデル(リスク 比 ) データファイル: risk1.jmp 出 典 :JMP のサンプルデータ ラット.jmp に 対 して 一 部 の 変 数 を 抜 粋 修 正 データを 追 加 変 数 の 詳 細 変 数 名 ( 列 名 ) 尺 度 詳 細 生 存 日 数 連 続 イベントま

ご存知ですか? データ転送

Outlook2010 の メール 連絡先 に関連する内容を解説します 注意 :Outlook2007 と Outlook2010 では 基本操作 基本画面が違うため この資料では Outlook2010 のみで参考にしてください Outlook2010 の画面構成について... 2 メールについて

次に Excel のメニューから 挿入 タブをクリックし 表示されたメニュー内の グラフ にある 折れ 線グラフ のボタンをクリックする するとサブメニューが表示されるので 左上の 折れ線 を選択する 挿入 メニューの グラフ クリック後 シート上の折れ線が追加される ここで 2 本グラフ があるの

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

簡易版メタデータ

1 Word2007 を立ち上げて 表を作って内容を入力し 体裁を整える 1 時間の関係で あらかじめ下記のような簡単な文書を作成して デスクトップにファイル 旅行案内操作前 1 を置いてありますからこのファイルをダブルクリックして開いて下さい (* 時間のある方は末尾に表の挿入方法などを参考に書い

スーパー英語アカデミック版Ver.2

暮らしのパソコンいろは早稲田公民館 ICT サポートボランティア

●コンテンツ「FAQ」

数量的アプローチ 年 6 月 11 日 イントロダクション データ分析をマスターする 12 のレッスン ウェブサポートページ ( 有斐閣 ) 水落研究室 R http:

Oracle BI Dashboad を利用したダッシュボードの作成

UMLプロファイル 機能ガイド

サポート Q. リモートにある JMP のヘルプファイル (jmp.chm) を表示できないのはなぜですか? JMP をクライアント / サーバ形式でご利用し Window Update を行うとリモートの jmp.chm ファイルを HTML ヘルプで表示できなくなることがあります 原因と対応方法

回帰分析の用途・実験計画法の意義・グラフィカルモデリングの活用 | 永田 靖教授(早稲田大学)

弥生18シリーズ インストラクター更新用テキスト(給与)

Microsoft Word - プリンター登録_Windows XP Professional.doc

Microsoft Word - 道路設計要領.doc

2. 起動時の画面 初期設定が終ると 教務アシスト 教育課程 が起動し メインメニューが表示されます 初期設定を修正する場合は このボタンを使います 各操作は 以下のメニューから行います 基本的には 左から右へ作業を進めます 3. 独自教科などの設定 < 教科設定 >をクリックして画面

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 ( その)(IE0 IEの場合 ) 7 6 ( その)(IE0 IEの場合 ) 8 7 (IE9

Ⅰ. はじめに今回の改訂版では 以下の新規機能が追加されました 1) 経営改善計画書入力期間の延長 (10 年 ) 2) 計画審査シート 3) 印刷用紙サイズ設定 4) 計画書印刷プレビュー 5) 負債要因などの記入欄の拡大 6) 検算シート 7) 借受者の経営者年齢の自動更新化 8) 数式バー (

コレスポンデンス分Ⅵコレスポンデンス分析とは コレスポンデンス分析は, 多変量解析の 数量化 Ⅲ 類 と同様の手法です 行の要素と列の要素を使って数量化するとするという点で, 数量化 Ⅲ 類と基本的に同じなのですが, 数量化理論の場合は集計前のオリジナルデータから処理していくのに対し, コレスポンデ

1. 基本操作 メールを使用するためにサインインします (1) サインインして利用する 1 ブラウザ (InternetExploler など ) を開きます 2 以下の URL へアクセスします ( 情報メディアセンターのトップページからも移動で

棚POWER操作テキスト 帳票作成編

Moodleアンケートの質問一括変換ツール


データの作成方法のイメージ ( キーワードで結合の場合 ) 地図太郎 キーワードの値は文字列です キーワードの値は重複しないようにします 同じ値にする Excel データ (CSV) 注意キーワードの値は文字列です キーワードの値は重複しないようにします 1 ツールバーの 編集レイヤの選択 から 編

C#の基本

MedicalStatisticsForAll.indd

Microsoft Word - å“Ÿåłžå¸°173.docx

インテル(R) Visual Fortran コンパイラ 10.0

目次 No. 内容 メニュー名 ページ番号 事前準備 IEバージョン情報確認 互換表示設定 (IE9 IE0 IEの場合 ) 信頼済みサイトへの登録 (IE0 IEの場合 ) 4 受注データを (IE0 IEの場合 ) 6 5 リストを出力する為の設定 (IE0 IEの場合 ) 7 6 ( その)(

TBA シリーズ操作説明書 TBA シリーズの機種別操作 測定項目管理 <TBA-200FR NEO の場合 > <TBA-120FR の場合 > <TBA-2000FR の場合 > <TBA-40FR ACCUTE の場合 > <TBA-C4000 C8000 C16000 の場合

LOG分析シート(1000)_DOC_ xls

1.マニュアル JMP をインストールすると JMP のマニュアル(PDF 形 式 )を 確 認 することができます JMP を 起 動 した 後 に 画 面 上 のメニューの [ヘルプ] > [ドキュメンテーション] から 該 当 のマニュアルを 選 択 します 以 下 のマニュアルが 用 意 さ

Rの基本操作

1セル範囲 A13:E196 を選択し メニューの データ - 並べ替え をクリック 並べ替え ダイアログボックスで 最優先されるキー から 年代 を選択し OK をクリック ( セル範囲 A13:E196 のデータが 年代 で並び替えられたことを確認する ) 2セル範囲 A13:E196 を選択し

厚生労働省版ストレスチェック実施プログラム 設置 設定マニュアル Ver.3.0 目次 1. プログラム概要 設置手順 注意事項 動作環境 初期設定 ( 環境設定 ) 初期設定 ( パスワード変更 ) 初

<4D F736F F D FC89BF E342E DEC837D836A B2E646F63>

編集する ファイルを開く マイクロデータの設定を行うファイルまたはファイルを開きます 開かれたファイルは編集画面に表示されて ブラウザ表示した時のプレビューも同時に表示されます HTML ファイルの選択 編集する ファイルを開くためにメインメニューから ファイル 開く を選びます ファイル選択ダイア

サイボウズ Office「リンク集」

Excel2013 ピボットテーブル基礎

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

(2) 起動 起動は通常の Windows アプリケーションと同じです Windows の版にもよりますが 最初の起動時は警告画面が出ますので ブロックを解除してください 詳細情報 をクリックすると画面が次のように変わるので 実行 を選びます これで Shogi3 の画面が表示されます

経済統計分析1 イントロダクション

基礎統計

目 次 1. 顔写真を一覧で見る ーーーーーーーー P02 2. 個人の詳細情報を見る ーーーーーーー P02 3. 検索する ーーーーーーーーーーーーー P04 4. 社員をリストアップする ーーーーーー P04 5. 顔写真を自由に並べ替える ーーーーー P05 6. アンケートを取る ーーーー

図 1 アドインに登録する メニューバーに [BAYONET] が追加されます 登録 : Excel 2007, 2010, 2013 の場合 1 Excel ブックを開きます Excel2007 の場合 左上の Office マークをクリックします 図 2 Office マーク (Excel 20

Microsoft Word - Word1.doc

Microsoft Word - WindowsVista活用

Microsoft PowerPoint _Part 2_scopus_training2018

Transcription:

JMP による対話的パーティショニング SAS Institute Japan 株式会社 JMP ジャパン事業部 2009 年 5 月 1. はじめに JMP では メニュー パーティション により 決定木の分析を行うことができます 本文書は このパーティションのメニューに関 する技術的事項を述べます 2. パーティションに関する Q&A この章では JMP のパーティションについての疑問を Q&A 形式で回答します Q1. パーティションという名前の由来はなんですか 通常は決定木と呼ばれていますが A1. Chi-squared Automatic Interaction Detector(CHAID) の先駆的な文献である Kass and Hawkins 1 の一部分には 決定木分析のことを "Recursive Partitioning" と呼んでいます これを短くして JMP では Partition( パーティション ) というメニュー名にしています パーティション という言葉は 探偵が何かを発見するために 手がかりを使って捜索範囲を狭くするような感覚を受けますので 2 Q2. JMP のパーティションの特徴は? A2. 次のような点が特徴として挙げられます 目的変数 ( 応答 ) は 連続でもカテゴリカルでも構いません また 説明変数は 連続 カテゴリカルの変数を混在させることができます グラフ機能が充実しており 対話的なパーティションをビジュアル的にサポートします 分岐したくない列をロックする ( 分岐をさせないようにする ) ことができます 通常の多変量解析とは違い 欠測値があるデータでも ランダムに分岐することにより データの情報を生かすことができます Q3. パーティションは CART や CHAID C4.5 C5.0 のような分類アルゴリズムを用いているのでしょうか A3. 類似する点はいくつかありますが JMP のパーティションでは CART や CHAID のような分類アルゴリズムそのものを用いて いるわけではありません Q4. 停止基準などにより 自動的に分岐を行う方法はありますか A4. JMP 8 では レポートの赤い三角ボタンより [K 分割交差検証 ] を選択する または あらかじめ ( 検証データ用に ) 行を除外したときに パーティションのレポート画面に [ 実行 ] ボタンが追加されます [ 実行 ] ボタンを押すと 交差検証の R2 乗または除外した行に対する R2 乗が改善されなくなるまで分岐を自動的に行います ( 図 1) JMP 8 以前のバージョンでは 上記のような機能はありません 1 Hawkins, D.M. and Kass, G.V.(1982), Automatic InteractionDetection, in Hawkins, D.M., ed., Topics in Applied Multivariate Analysis,267-302, Cambridge Univ Press:Cambridge. 2 JMPer Cable Spring 2005 Issue 17 http://www.jmp.com/about/newsletters/jmpercable/backissues.shtml 1

図 1 (JMP 全体の特徴でもありますが ) パーティションは 対話的に分析を行えることが特徴になります そのため [ 実行 ] ボタンを用いない限り 分岐は対話的に行われます 昨今のデータマイニングでは 決定木分析というと モデルを作成し 予測をすることに重点をおくことが多いですが JMP のパーティションでは 予測だけではなく 目的変数に影響する要因を見つける 要因分析 として用いることにも重点を置いています 要因をあれこれ見つける際 この対話的な分析が効力を発揮します 3. パーティションの分岐基準 JMP のパーティションメニューでは 次の 2 種類の分岐方法があります [ 分岐統計量を最大化 ] 連続変数の場合は平方和の値 カテゴリの変数の場合は G^2 の値に基づいて分岐を行います [ 有意度を最大化 ] ( デフォルトの分岐方法 ) 各分岐候補の有意度を計算して最適な分岐を決定します 分岐基準の変更は パーティションのレポートの左上にある赤い三角ボタンをクリックし [ 基準 ] から変更できます 以下 それぞ れの分岐基準の詳細を示します 分岐統計量を最大化 2 つの応答の差が最大になるように分岐候補を探します 応答が連続変数のとき 平方和 (SS) が基準となります レポートの 候補 の欄には " 候補 SS" と表示されます 候補 SS は JMP で分散分析を行った際に表示される 分散分析表の要因の平方和に相当します 応答がカテゴリ変数のとき尤度比カイ 2 乗 (G^2) が基準となります レポートの 候補 の欄には " 候補 G^2" と表示されます 候補 G^2 は JMP でモザイク図 ( 二変量の関係で X,Y にカテゴリ変数を選択した場合 ) を描いたとき 検定 の欄に表示される尤度比のカイ 2 乗が該当します 応答が連続変数の場合は " 候補 SS" が 応答がカテゴリ変数の場合は " 候補 G^2" が一番大きい項目で分岐されます 2

有意度を最大化 [ 分岐統計量を最大化 ] を基準とした場合に 水準数の多い変数が分岐候補になる傾向があり これらを調整したのが [ 有意度を最大化 ] という基準です 各分岐候補の有意度を計算して最適な分岐を決定します 候補のレポートには 対数価値 という列があり この列の値が一番大きい項目で分岐されます 対数価値は 調整済み p 値を用いて 次のように計算されます 対数価値 = -log 10 ( 調整済み p 値 ) (1) 調整済み p 値は 考えられる分岐候補の組み合わせ数を考慮した複雑な方法で算出され 水準数の多い X に有利になってしまう 未調整の p 値に比べ 公正な分析になります この手法については 下記のホワイトペーパーで検証されています ( 英語 ) Monte Carlo Calibration of Distributions of Partition Statistics http://www.jmp.com/software/whitepapers/pdfs/montecarlocal.pdf 4. パーティションの分岐基準に対する具体例 この章では 3 章で説明したパーティションの分岐基準について サンプルデータを用いた具体例を示します 応答がカテゴリ変数のとき 使用する JMP のサンプルデータ : 車の調査.jmp パーティションでの列の指定 : [Y, 目的変数 ]: 生産国 [X, 説明変数 ]: 性別 年齢 タイプ 基準は 分岐統計量を最大化 を選択します すべての行 に対する 候補 を表示させたときのパーティションのレポートは 図 2 のようになります 図 2 図 2 に表示されているそれぞれの項目に対する 候補 G^2 は次の要領で算出されます 3

性別 に対して 性別 は 男性 女性 の 2 つのカテゴリを持ちます そのため 性別を 2 つのグループで分岐するのであれば 男性 のグループと 女性 のグループに分かれます メニュー [ 二変量の関係 ] を用いて [Y, 目的変数 ] に 生産国 [X, 説明変数 ] に 性別 を選択して分析を行うと 図 3 の検定表が表示されます ここに表示される尤度比カイ 2 乗 ( または (-1)* 対数尤度 (=0.1559) の 2 倍 ) が 候補に表示されている性別の候補 G^2(=0.312) になります 図 3 タイプ に対して タイプ は スポーツ, ファミリー, ワーク の 3 つのカテゴリを持ちます 3 つのカテゴリを 2 つのグループに分岐する方法は 次の 3 通りが考えられます a. ( スポーツ ファミリー ) と ( ワーク ) b. ( スポーツ ) と ( ファミリー ワーク ) c. ( スポーツ ワーク ) と ( ファミリー ) そのため タイプ を上記 a,b,c のようにデータを 2 つのグループに分け 性別 と同じ要領で二変量の関係の分析を実行します 図 4 は 左から右へ a,b,c の分析を行ったときの検定結果になります この 3 つの中で 最も尤度比カイ 2 乗が大きいのは b のときです そのため タイプ を ( スポーツ ) と ( ファミリー ワーク ) の 2 つのグループに分けたときの尤度比カイ 2 乗が 候補に表示されているタイプの候補 G^2(=17.556) になります 図 4 年齢 に対して 年齢 は連続尺度で 18 から 60 までの値をとります この範囲をある値を境にして 2 つにグループ分けし 同じ要領で尤度比カイ 2 乗を参照します 境界値を次々と変えていき 尤度比カイ 2 乗が最大になる境界値を見つけます この例では 36 歳以上 / 未満 4

が境界値になり このときの尤度比カイ 2 乗を求めると 図 5 のようになります この値が 年齢 の候補 G^2(=13.537) になりま す 図 5 図 2 を参照しますと 候補 G^2 の値が最も大きいのは タイプ です そのため [ 分岐 ] ボタンを押すと タイプ ( スポーツ ) と タ イプ ( ワーク ファミリー ) で分岐します ( 図 6) 図 6 同じ要領で タイプ ( スポーツ ) に属するデータについての候補 G^2 タイプ( ワーク ファミリー ) に属するデータについての候補 G^2 が表示されます タイプ ( スポーツ ) は年齢の候補 G^2 (=7.1854) タイプ( ワーク ファミリー ) は年齢の候補の G^2(=7.4533) です 候補 G^2 の値を比較すると タイプ ( ワーク ファミリー ) の値の方が大きいので 次は タイプ( ワーク ファミリー ) の 年齢 で分岐します ( 図 7) 図 7 5

分岐基準として [ 有意度を最大化 ] を選択した場合は 候補 の欄に 対数価値 が表示されます この値は 尤度比検定の p 値 を調整した調整済みの p 値に対し 3 章で紹介した式 (1) のように 負の対数をとったものになります ( 図 8) 図 8 注意 : 最適な分岐点にはアスタリスク (*) がつきますが 候補 G^2( 連続の場合は 候補 SS) と対数価値の最適な分岐点が異なる 場合は < ( 候補 G^2 または候補 SS) が最大の項 > ( 対数価値が最大の項 ) というように 別々に表示されます アスタ リスクは 候補 G^2( または候補 SS) が最大の項と対数価値が最大の項が一致するときに表示されます 応答が連続変数のとき 使用する JMP のサンプルデータ : ボストンの住宅.jmp パーティションでの列の指定 : [Y, 目的変数 ]: 持ち家の価格 [X, 説明変数 ]: 犯罪率 区画 低所得者 基準は 分岐統計量を最大化 を選択します すべての行 に対する 候補 を表示させた最初のパーティションのレポートは 図 9 のようになります 図 9 6

候補 の欄を参照しますと 部屋数 にアスタリスク (*) がついていることがわかります そのため ここでの最適な分岐は 部 屋数 になり 候補 SS は 19339.55 です 候補 SS は 説明変数のとりうる範囲を その中でデータがとりうる値を境にして 2 つに グループ分けしたとき 各グループの平均をあてはめたときの平方和のうち最大のものを示します この例で 部屋数 は 連続尺度で 3.561 から 8.78 までの値をとります この範囲 (3.561,8.78) をデータがとりうる値を境に 2 つにグループ分けします 仮に 2 つのグループ分けを識別する新しい列 ( 名義尺度 ) をつくったとします このとき [ 二変量の関係 ] で 持ち家の価格 を [Y, 目的変数 ] 2 つにグループ分けした列を [X, 説明変数 ] にして一元配置分散分析を行い 要因 X の平方和を参照します それぞれの境界値に対して この平方和が計算できますが その中で一番大きい平方和が候補 SS(=19399.55) になります この内容を確かめるには すべての行 の赤い三角ボタンをクリックし [ 詳細の表示 ] を選択します このとき どの項の詳細? というタイトルのウィンドウが表示されますので 列 部屋数 を選択して[OK] ボタンをクリックすると 新しいデータテーブルが出力されます このテーブルは 列 部屋数 が境界値を示し この境界を基準にして 2 つのグループに分けたときの平方和が 基準 の列に表示されます ここで 基準の値が最も大きい行は 375 行目の基準 =19339.55 のときで このときの部屋数は 6.943 となります また データテーブル左上のスクリプト 重ね合わせプロット を実行しますと データをグラフ表示することができ 部屋数の値に対する基準の値を視覚的に確認することができます ( 図 10) 図 10 図 11 は 部屋数 を 6.943 未満 /6.943 以上の 2 つのカテゴリに分け ( 列名 : 部屋数カテゴリ ) 上記のとおり 一元配置分散分 析を行った結果になります 図 11 7

部屋数カテゴリ の平方和は 19339.55 と表示され これは 候補 SS に表示される値と一致します 図 12 は 1 回分岐したとき の図で 確かに 部屋数 <6.943 と 部屋数 >=6.943 で分岐しています 図 12 次は 応答がカテゴリのときと同様に 葉の中で候補 SS が最大になる値がアスタリスク表示されますので すべての葉の中で アスタリスクの行に表示される候補 SS が最大になる箇所で分岐します 図 11 より 部屋数 <6.943 の葉での候補 SS の最大値は 低所得者 の 7311.85 で 一方 部屋数 >=6.943 の葉での候補 SS の最大値は 部屋数 の 3060.95 です これより 次は 部屋数 <6.943 の変数 低所得者 で分岐します ( 図 13) 図 13 分岐基準として [ 有意度を最大化 ] を選択した場合は 候補 の欄に 対数価値 が表示されます この値は 分散分析における F 検定の p 値を調整した調整済みの p 値に対し 3 章で紹介した式 (1) のように 負の対数をとったものになります 8