IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

Similar documents
IBM Software Business Analytics IBM SPSS Custom Tables IBM SPSS Custom Tables カスタムテーブルを即時に作成 ハイライト 分析結果を簡単に要約して共有 ドラッグ アンド ドロップ機能を使用して すばやく簡単にテーブルを作成

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Medical3

Medical3

IBM Presentations: Smart Planet Template

日心TWS

リスク分析・シミュレーション

ANOVA

Microsoft PowerPoint - 資料04 重回帰分析.ppt

ACL Analytics Leaflet

Microsoft Word - SPSS2007s5.doc

IBM Presentations: Smart Planet Template

機能紹介:コンテキスト分析エンジン

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

Data Security and Privacy Principles

PowerPoint Presentation

なぜIDSIPSは必要なのか?(v1.1).ppt

第1回

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

DumpsKing Latest exam dumps & reliable dumps VCE & valid certification king

IBM Rational Software Delivery Platform v7.0 What's

どのような便益があり得るか? より重要な ( ハイリスクの ) プロセス及びそれらのアウトプットに焦点が当たる 相互に依存するプロセスについての理解 定義及び統合が改善される プロセス及びマネジメントシステム全体の計画策定 実施 確認及び改善の体系的なマネジメント 資源の有効利用及び説明責任の強化

Copyrig ht 著作権所有 2015 Colasoft LLC. すべての権利を留保する 本書の内容は 予告なしに変更されることがあります 本書の全ての内容は Colasoft の書面による明確な許可無しに いずれの目的のためにも 複写を含む電子または機械によるいかなる形式または手段によっても

Client Management Solutions および Mobile Printing Solutions ユーザガイド

Microsoft Visual Studio 2010 Professional Data Sheet

ビジネス統計 統計基礎とエクセル分析 正誤表

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Microsoft Word - lec_student-chp3_1-representative

狭山デポ様IBM移設予定機器 _ppt [Compatibility Mode]

統計的データ解析

BIP Smart FAQ

講義「○○○○」

MedicalStatisticsForAll.indd

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

PSQL v12 新機能のご紹介 ~ 認証要件変更に伴う運用の見直し ~ 株式会社エージーテック 2015 年 1 月 13 日

IBM SPSS Statistics - Essentials for Python: のインストール手順 Mac OS

第1回

プロジェクトを成功させる見積りモデルの構築と維持・改善 ~CoBRA法による見積りモデル構築とその活用方法について~

富士通Interstage Application Server V10でのOracle Business Intelligence の動作検証

Silk Central Connect 15.5 リリースノート

因子分析

目次 はじめに... 3 仮想化環境上の仮想マシン保護方法... 4 ( 参考 )Agent for Virtual Machines での仮想マシンのバックアップ... 8 まとめ 改訂履歴 2011/04 初版リリース 2012/10 第 2 版リリース このドキュメントに含まれる特

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

Oracle SQL Developerの移行機能を使用したOracle Databaseへの移行

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Microsoft PowerPoint ppt

untitled

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

untitled

(Microsoft PowerPoint - WQ21JDEadapter\215\\\220\254\216\350\217\207\217\221_ ppt)

Oracle Un お問合せ : Oracle Data Integrator 11g: データ統合設定と管理 期間 ( 標準日数 ):5 コースの概要 Oracle Data Integratorは すべてのデータ統合要件 ( 大量の高パフォーマンス バッチ ローブンの統合プロセスおよ

Microsoft Office Visioによる 施設管理について

Oracle Enterprise Manager 10g System Monitoring Plug-In for IBM WebSphere Application Server

Oracle Enterprise Linux 5における認証

Base_and_Additive_Client_Access_Licenses_JP (Jun 2017)

Microsoft Word - 【付録4】アンケート②結果.docx

回答者のうち 68% がこの一年間にクラウドソーシングを利用したと回答しており クラウドソーシングがかなり普及していることがわかる ( 表 2) また 利用したと回答した人(34 人 ) のうち 59%(20 人 ) が前年に比べて発注件数を増やすとともに 利用したことのない人 (11 人 ) のう

iStorage NSシリーズ 管理者ガイド

CONTENTS マニュアルの表記... S01-13_01 1.DataNature Smart 全体概要図... S01-13_11 2. 基本操作... S01-13_ Web レポートの表示... S01-13_ 画面構成... S01-13_ 集計表 /

untitled

スライド 1

Symantec Endpoint Protection 12.1 の管理練習問題 例題 1. 管理外検出でネットワーク上のシステムを識別するとき 次のどのプロトコルが使用されますか a. ICMP b. TCP c. ARP a. UDP 2. ある管理者が Symantec Endpoint P

OpRisk VaR3.2 Presentation

Microsoft Word - mstattext02.docx

新しい 自律型データ ウェアハウス

Oracle Cloud Adapter for Oracle RightNow Cloud Service

カイ二乗フィット検定、パラメータの誤差

Windows VDA の権利を取得する方法 Windows VDA の権利は 3 つのライセンス形態を通じて取得できます これらの使用権により ライセンスを取得したデバイスは 使用するライセンス形態に応じてリモートまたはローカルで仮想 Windows デスクトップにアクセスすることができます Wi

<4D F736F F F696E74202D ED089EF959F8E838A7789EF C835B BB82CC A332090DD92758EE591CC8F4390B38CE3205

Oracle Warehouse Builder: 製品ロードマップ

— OpenRulesモジュール 2017 Summer リリースノート   初版  

Oracle Business Intelligence Suite

Visual Studio 2017 RC インストール & ファーストステップガイド 2016 年 11 月 16 日 (V1.0)

基礎統計

EBNと疫学

Trend Micro Safe Lock 2.0 Patch1 管理コンソールのシステム要件 OS Windows XP (SP2/SP3) [Professional] Windows 7 (SP なし /SP1) [Professional / Enterprise / Ultimate] W

<4D F736F F D FC8E448FEE95F1837C815B835E838B C8F92E88B608F912E646F63>

IBM Cognos 10 Upgrade FAQ

BraindumpsVCE Best vce braindumps-exam vce pdf free download

QNAP vsphere Client 用プラグイン : ユーザーガイド 2012 年 12 月更新 QNAP Systems, Inc. All Rights Reserved. 1

作成日 :2017/03/29 ******************************************************************************* ** ** ** FUJITSU Cloud Service K5 ** ** ** ** ソフトウェアカフ

マニュアルの表記 呼称について本マニュアルでは以下の呼称を使用しています DataNature Smart 管理ツール :DN 管理ツール DataNature Smart クライアント :DN クライアント 画面に表示されるコマンド名などの文字コマンド名やダイアログボックス名など 画面上の固有の文

無党派層についての分析 芝井清久 神奈川大学人間科学部教務補助職員 統計数理研究所データ科学研究系特任研究員 注 ) 図表は 不明 無回答 を除外して作成した 設問によっては その他 の回答も除外した この分析では Q13 で と答えた有権者を無党派層と定義する Q13 と Q15-1, 2 のクロ


<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

システム要件 Trend Micro Safe Lock 2.0 SP1 Trend Micro Safe Lock 2.0 SP1 エージェントのシステム要件 OS Client OS Server OS Windows 2000 (SP4) [Professional] (32bit) Wind

intra-mart EX申請システム version.7.2 事前チェック

Polycom RealConnect for Microsoft Office 365

RDX へのバックアップ 3 ベアメタル復旧手順書 2014 年 11 月

Slide 1

Microsoft PowerPoint - e-stat(OLS).pptx

スライド 1

Excelによる統計分析検定_知識編_小塚明_1_4章.indd

TimeTracker FX セットアップガイド 補足資料 2/14 0. はじめに 本資料は [TimeTracker FX セットアップガイド ] では説明していない Microsoft SQL Server 2005 ( 以下 SQL Server 2005) の設定や操作方法を補足するための

OpenLAB Data Store Release Notes

— OpenRulesモジュール 2017 Summer リリースノート   第2版  

Transcription:

空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に置き換える 欠損データ タイプおよび極値を表示する 隠れたバイアスを除去する アンケート調査や市場調査 社会科学 データ マイニングなどの多くの専門家が 調査データの検証に を使用しています 欠損データを無視したり 除外したりすると 偏った無意味な結果につながる危険性があります SPSS Missing Values を使用して 欠損データを補完し より有効な結論を引き出すことができます SPSS Missing Values は データの妥当性を考慮する際の重要なツールです データを容易に検証して 欠損データのパターンを明らかにすることができ その後 要約統計量を推定し 統計アルゴリズムを使用して欠損値を補完できます 例えば 観察された欠損データのパターンに基づいて 分かりにくい質問を特定することで アンケートの質問を改善できます それだけでなく パターンの不一致のパーセントを示すテーブルを使用することで ある変数の欠損値が 別の変数の欠損値と関連しているかどうかを判断できます 例えば 収入に関する質問に答えなかった回答者は 学歴に関する質問にも答えない などです この情報を使用して 将来の調査内容の質を高めることができます

迅速かつ容易に欠損データを診断する欠損値の全体的な要約レポートを使用して 欠損データが重大な問題になるかどうか素早く診断できます 欠損値パターンのレポートは データの概要をケースごとに示します 欠損値の各タイプのスナップショットや 各ケースの極値が表示されます 柔軟性の高い個別分散 t 検定およびカテゴリー変数テーブルのクロス集計を使用して 回答者と非回答者の間に有意差が存在するかどうかを検出します これらのレポートは 分析において欠損データが問題となりうるかどうかを判断する際に役立ちます 多重代入法を使用して 欠損値を補完 SPSS Missing Values では データ セット内の 欠損 のパターンを理解するのに役立ち 欠損値を妥当な推定値に置き換えることができる 多重代入手法が使用されています 完全自動代入モードでは データの特性に基づいて最適な代入方法を選択します また 代入モデルをカスタマイズすることもできます 表形式のパターン レポートでは 欠損データのパターンの要約を示し パターンを構成する変数セットを強調表示します 2

まず 複数の完全なデータ セットが生成され ( 通常 3 から 5 個 ) それぞれは異なる値に置き換えられます 次に 線形回帰などの通常の手法を使用して個々のデータ セットをモデル化し データ セットごとにパラメーター推定値を生成できます そして 最終的なパラメーター推定値を得ます これは ステップ 2 で得られたパラメーター推定値の個々のパラメーター セットをプールし 代入内および各代入間の変動量を考慮する推測統計を算出することによって行われます 個々のデータ セットの分析および結果のプールは 回帰など既存の SPSS Statistics の手法を選択することによりサポートされます 代入値を含むデータ セットで作業する場合 既存の手法により プールされたパラメーター推定値が自動的に生成されます より有意な結果を得る欠損値を推定値に置き換えて 統計的に有意な結果を得るようにします 欠損値を推定値で置き換え 回答が少ないものも含めて すべてのグループを分析に含めることにより 隠れたバイアスをデータから除去します SPSS Missing Values は IBM SPSS Statistics ソフトウェア スイートの一部です この製品は 単独でご利用いただけますが 次の 3 つのエディションでもご利用いただけます それは IBM SPSS Statistics Standard IBM SPSS Statistics Professional および IBM SPSS Statistics Premium です これらのエディションは 重要な機能を結集することにより チームまたは部署全体が 組織の成功に寄与する分析の実行に必要なフィーチャーおよび機能を確保するための効果的な方法を提供します SPSS Missing Values は クライアント専用ソフトウェアとしてインストールできますが より高度なパフォーマンスと拡張性が必要な場合は サーバー版をご利用いただけます より高い価値を創出するコラボレーション IBM SPSS Collaboration and Deployment Services と統合して使用することで 分析資産の共有および分散を効率的に行い 社内外のコンプライアンス要件を満たす方法で保護し 分析結果を公開して より多くのビジネス ユーザーが閲覧および利用することが可能です それらの有益な機能の詳細については 次の Web サイトでご覧になれます ibm.com/spss/cds 3

機能 パターンの分析 データ パターン テーブルを使用して すべてのケースおよびすべての変数について 欠損データおよび極端なケースを表示 システム欠損値および 3 つのタイプのユーザー定義の欠損値を表示 昇順または降順でソート 指定した変数の実際の値を表示 欠損パターン テーブルを使用して 少なくとも 1 つの欠損値があるすべてのケースについて 欠損値のパターンを表示 類似した欠損値パターンをグループにまとめる 欠損パターンおよび変数によりソート 指定した変数の実際の値を表示 個別分散の t 検定テーブルを使用して 関連する変数について 欠損グループと非欠損グループの間の差を判別 t 検定 自由度 平均値 p 値 および度数 カテゴリー変数テーブルの分布を使用して カテゴリー変数の存在データと欠損データの差を表示 ある変数と他の変数の組み合わせによるカテゴリーごとに 結果と欠損データを示すクロス集計を作成 パターンの不一致のパーセントを示すテーブルを使用して ある変数の欠損データが別の変数の欠損データにどの程度関連しているかを評価 行列を欠損値パターンまたは変数でソート パターンを表形式で表示して すべての固有パターンを特定 この表で欠損データのパターンを要約し 各パターンの度数を表示 また各変数の平均値と度数を表示 欠損値パターンの要約テーブルを使用して 各欠損値パターンの度数および平均値を表示 統計量 1 変量 : 欠損値を含むケースを除いたすべてのケースの度数 平均値 標準偏差 平均値の標準誤差 すべての変数の欠損値の度数とパーセント および極値を計算 リストごと : 欠損値を除外したケースについて すべての量的変数の平均値 共分散行列 および相関行例を計算 ペアごと : 度数 平均値 分散 共分散行列 および相関行列を計算 4

多重代入法 どの変数に代入するかを指定し 代入値の制約 ( 最小値や最大値など ) を指定 また 他の変数の欠損値に代入する場合に予測子として使用される変数を指定することも可能 カテゴリー変数および連続変数に値を代入 カテゴリー変数にはロジスティック回帰を使用し 連続変数には線形回帰を使用 予測平均値マッチングは 連続的な結果のオプションであり 代入値の妥当性 ( オリジナル データの範囲内 ) を確保 欠損データのパターンの検出により 使用する代入方式の決定を支援 次の 3 つの代入法を提供 単調 : 欠損パターンが単調な場合のデータに効果的な方法 完全条件指定 (FCS): 不定な欠損パターン ( 単調または非単調 ) の場合に適切な反復のマルコフ連鎖モンテカルロ (MCMC) 法 自動 : データをスキャンして最適な代入法を決定 ( 単調またはFCS) 以下を指定 : 代入数 代入値の範囲 代入時に交互作用効果が使われるかどうか 高い確率で欠損値がある変数の代入を任意でやめる 特異性を調べるための許容レベル 分析 ( 回帰 ) の重みが含まれた変数も指定可能 この手法には 欠損値の代入に使用された回帰や分類モデルの分析の重みが組み込まれる また 分析の重みは代入値の要約にも使用される ( 例 : 平均 標準偏差 標準誤差 ) データ内の欠損値の全体的な要約と代入の要約 および値が代入された各変数の代入モデルを表示 変数による欠損値の分析と表形式の欠損値パターンを取得 また 代入値の記述統計量も取得 ケース 変数 個々のデータ ( セル ) 値の欠損をグラフ形式で要約 代入値と FCS 反復履歴が含まれる IBM SPSS Statistics データ ファイルを要求 多重代入データ セットは対応している分析手法を用いて分析でき いくつかの代入値に内在する不確実性を考慮した最終的な ( 結合した ) パラメーター推定値を取得 5

分析 多重代入に対応する分析手法 ( 注 : 該当する手法が搭載されている適切なモジュールを購入する必要があります ) 記述的手法 : 度数 記述統計 クロス集計 相関 * ノンパラメトリック相関 部分相関 * 平均の比較 : 平均 t 検定 ノンパラメトリック検定 一元配置分散分析 1 変量分散分析 モデル : 一般線形モデル 一般化線形モデル 線形回帰 * 多項ロジスティック回帰 * 二項ロジスティック回帰 判別分析 * 順序回帰 線形混合モデル 生存分析手法 :Cox 回帰 プーリング 出力のプーリング : プーリングが生成するプールされたパラメーターの 2 つのレベルのうちの 1 つを使用して 出力はプールされる プーリング診断 : 分散の相対的増加 : 代入全体のパラメーター推定値の相対的変動性の測度 欠損情報の割合 : 分散の比率の相対的増加 無回答による不確実性の測度 相対的効率 : 無限の代入数に相対する多重代入の推定の効率 プールされたパラメーター推定値のために PMML モデルを取得 : 線形回帰 一般化線形モデル 多項ロジスティック回帰 二項ロジスティック回帰 判別分析 Cox 回帰 システム要件要件はプラットフォームによって異なります 6

I B M ビジネス アナリティクスについて IBM ソフトウェアは 業績改善に取り組む意思決定者に対し 実践的な洞察を提供します IBM は ビジネス インテリジェンス 予測分析と高度な分析 財務パフォーマンスと戦略の管理 ガバナンス リスクおよびコンプライアンス (GRC) そしてアナリティック アプリケーションからなる包括的なポートフォリオを用意しています IBM ソフトウェアは ビジネスの傾向やパターンあるいは異常の発見 仮定に基づくシナリオの比較 潜在的な脅威や機会の予測 重要なビジネス リスクの特定および管理 さらには経営資源に関する計画 予算および予測を実現します IBM の世界中のお客様は この充実したアナリティクスを使うことで 業績への理解を深める一方 成果への予測を高め 目標への確かな道筋をつけることができます 7

日本アイ ビー エム株式会社 103-8510 東京都中央区日本橋箱崎町 19-21 IBM のホーム ページはこちらからご覧になれます ibm.com IBM IBM ロゴ ibm.com および SPSS は 世界の多くの国で登録された International Business Machines Corporation の商標です 他の製品名およびサービス名等は それぞれ IBM または各社の商標である場合があります 現時点での IBM の商標リストについては 次の Web サイトをご覧ください ibm.com/legal/copytrade.shtml 本書の情報は最初の発行日の時点で得られるものであり 予告なしに変更される場合があります すべての製品が IBM が営業を行っているすべての国において利用可能なのではありません 本書に掲載されている情報は特定物として現存するままの状態で提供され 第三者の権利の不侵害の保証 商品性の保証 特定目的適合性の保証および法律上の瑕疵担保責任を含むすべての明示もしくは黙示の保証責任なしで提供されています IBM 製品は IBM 所定の契約書の条項に基づき保証されます Copyright IBM Corporation 2012 Please Recycle YTD03017-JPJA-04