JMP Pro 高度な分析を行うための洗練された手法 JMP Pro は JMP にさらに高度な分析 機能を追加したソフトウェアです 高度なモデリング手法を必要とするパワーユーザーも JMP Pro があれば より精度の高い予測を行い 今後の計画を立てることができます SAS が提供する統計解析ソフトウェア JMP Pro は 科学者やエンジニアを対象に設計され インタラクティブなデータの視覚化 探索 分析 および共有といった JMP が持つ全ての優れた機能を備えています さらに JMP Pro は 多数の異なる手法を使用した検証機能を備えた予測モデリング 最新のモデリング手法 モデルの比較 モデルの平均化 高度な多変量分析 信頼性ブロック図 被覆配列 混合モデル アップリフトモデル 高度な計算機を駆使した統計手法など 多数の高度なツールを提供しています JMP Pro は SAS による統計的発見ソフトウェアで 高度な分析を行うパワーユーザー向けです JMP Pro なら 高度でさまざまな分析が可能になるため 統計的発見を阻む障害物を取り除き データに潜む手掛かりを見つけだす手助けをしてくれます その結果 より迅速に問題の突破口を開き 先を見越して 将来を制御できるようになります 主な機能 予測モデリングデータマイニングには オーバーフィッティングを避けたモデルを作成できる高度なツールが必要です JMP Pro には 手持ちのデータを使ってより適切 なモデルを構築するためのアルゴリズムが豊富に揃っています 予測モデリングの中でも最も便利な手法は ディシジョンツリーとニューラルネットワークです JMP Pro の パーティション プラットフォームは 最新の方法でツリーの構築プロセスを自動化します ブートストラップ森は ランダム森の方法で データや候補の変数からランダムに抽出したサブセットデータを使って多数のディシジョンツリーを作成し それらのツリーを平均化する手法です ブースティングツリーは 前のツリーの残差にツ リーを次々にあてはめ 多数のシンプルなツリーを構築します JMP Pro の パーティション プラットフォームは K 近傍法 (K-NN) モデルにも対応しています これらの手法を使用することで 単純なディシジョンツリーモデルよりも予測精度の高いモデルを構築できます 拡張された ニューラル プラットフォームでは 選択可能な 3 つの活性化関数で 1 層または 2 層のニューラルネットワークを構築でき 勾配ブースティングを使用して自動モデル作成をすることもできます このプラットフォームは 自
信頼性ブロック図により 複雑な複数の要素から構成されるシステムの信頼性を定義し 理解できます 動的に 連続尺度の X 変数の変換や欠測値の処理を行います これにより時間と労力が軽減されます さらに ロバストなあてはめオプションも用意されています JMP Pro の パーティション および ニューラル プラットフォームでは データ分割による検証を利用できます 検証の目的は 次のセクションで説明します さらに JMP Pro ではステップワイズ回帰 ロジスティック回帰 ( 名義尺度と順序尺度 ) および判別分析で検証列の使用をサポートしています モデルの検証効果的な予測モデルを作成するには モデルを検証するための実質的な手段が必要です また 複雑なモデルを扱うときにはオーバーフィットの問題に陥りがちで モデルの検証が必要になりますが JMP Pro ではデータ分割や保留により検証を行えます データを学習 検証 テストの各データセットに分割する方法は オーバーフィットを防ぐ手段として長く用いられてきました この方法であれば 作成するモデルが 使用した特定の標本の属性に依存しないからです JMP Pro のモデルの検証における一般的なアプローチでは 検証列を使用します 検証列の作成の機能を使用することで データを目的の異なる別々のセットに簡単に分割できます ( 単純無作為抽出または層化無作為抽出 ) 学習セットはモデルを構築するために使用されます 検証セットは モデル構築プロセスにおいて モデルの複雑度を選択するために使用されます 最後に モデル構築プロセスではまったく使用しなかったテストセットを用いて モデルの質を評価します 小規模なデータセットでは 一部のプラットフォームで K 分割交差検証も使用できます モデルの検証により 将来のデータ ( 新しい顧客 新しいプロセス または新しいリスク ) を適切に一般化するモデルを構築できます つまり データに基づく推論を行うことができるのです 複数のモデリング手法の比較現実の世界では特定の状況でうまくあてはまるモデルも 別の状況ではあてはまりが悪くなることがあります JMP Pro にはモデリングの手法が多数あるため 特定の状況に最も適したモデルがどれかを見極める必要があります モデル構築の典型的なアプローチは モデルの複雑度 特定の因子 / 予測変数がある / ないモデル 異なる種類の モデリング手法を使用して構築されたモデル さらに複数モデルの平均 ( アンサンブルモデル ) など 異なるモデルを多数試行するというものです これらのモデルそれぞれには共通する品質の指標があり これをモデルの評価に使用できます (R 2 誤分類率 ROC 曲線 AUC リフトチャートなど ) モデルの比較機能を使用して さまざまなモデリングの手法で得た予測式を比較すれば 適合度 モデルのシンプルさ 検証結果などの観点から複数のモデルを比較できます JMP Pro では こうした比較を自動的に行います 同時に ユーザーはモデルを視覚的に表すプロファイルを対話的に操作しながら それぞれのモデルで選択された重要な因子を確認できます JMP Pro におけるモデルの比較では 同時に複数のモデルを簡単に比較できます また 必要に応じてモデルの平均化も行えます 最新のモデリング一般化回帰は新しいモデリング手法で さまざまなデータに対して 優れたモデルを構築できます 一般化線形モデルを 正則化回帰または罰則付き回帰の手法を使用してあてはめます
変数間に強い相関関係がある場合 変数がオブザベーション数より多いと 通常の回帰分析は役に立ちません 高い相関性がある説明変数が多くある場合 ( 観測データでよく見られる ) ステップワイズ回帰やその他の標準的な手法から満足のいく結果を得ることはできません これらのモデルはオーバーフィットになる傾向があり 新しいデータにはうまくあてはまりません しかし モデル構築前に変数選択を行うことは難しい場合もあります それに 手作業で変数を選び出すのは時間もかかり 大変な作業になってしまいます 一般化回帰は 優れたモデリングのフレームワークです モデル診断から多重比較 逆推定およびプロファイルなどが用意されています これは JMP Pro だけに搭載された機能です 一般化回帰で使用できる正規化手法にはリッジ Lasso 適応型 Lasso 弾性ネット 適応型弾性ネットがあり 影響力があると思われる X 変数を識別する のに役立ちます これらの手法は モデルのあてはめ プラットフォームの他のモデリング手法と同様に 簡単に利用できます 変数と手法を選択して 検証法など適切な設定を行うだけです JMP は モデルのあてはめを自動的に行います 適切な変数選択を行い 新しいデータに対して一般化できる予測モデルを構築します 変数増加法を使用したり 分位点回帰または単純な最尤法によるあてはめを実行することもできます さらに 一般化回帰では 応答の分布を選択できます これにより カウントデータや外れ値の多いデータ 歪んだデータなど 幅広いデータに対してモデリングが行えます 高度な多変量分析多変量分析を必要とするデータの問題にぶつかった場合でも JMP Pro には より良いモデルを構築するための高度な手法が複数用意されています PLS 回帰データの数よりも変数の数が多いデータをモデル化しようとしていませんか? このような場合 従来の手法は機能しませんが PLS 回帰は機能します PLS 回帰はパワフルなモデリング手法で 特に X 変数の数がオブザベーション数より多い X 変数に強い相関関係がある 多数の X 変数がある またはいくつかの Y 変数と多くの X 変数があるような場合にその威力を発揮します こうした状況では 通常の最小 2 乗法を使って満足のいく結果を得ることができません PLS 回帰は線形モデルであり 説明変数 (X 変数 ) の線形結合から構成されます スコアは X 変数と応答 (Y 変数 ) 間の共分散を最大にするように計算されます JMP Pro では 連続値またはカテゴリカルな応答 (PLS-DA) で べき乗項または交互作用項を指定し 欠側値の補完を行うよう PLS モデルを構築できます ブートストラップ森 ( 右 ) は さらなる調査のために ( たとえば実験計画法を利用した実験 ) 応答に影響する可能性がある変数すべてを識別します 標準的なディシジョンツリーモデル ( 左 ) は 必ずしも応答に影響する可能性がある変数すべてを特定できるわけではありません
変数クラスター結果を予測するための変数が多数あるとき 何らかの方法で変数の数を削減し より簡単に予測問題に取り組めるようにしたい場合があります 次元削減の手法としてよく知られているものに主成分分析 (PCA) がありますが PCA から得られた変数は解釈しにくいことがあります 別の方法として挙げられるのが JMP Pro の変数クラスターです この機能を使用すれば 応答をクラスターに分けることができるかどうか また分けられる場合にはいくつのクラスターが応答に含まれているかを判断できます レポート内のクラスター選択では データテーブルの最も代表的な列が自動的に選択されるため より簡単にモデル項を指定したり 変数選択を行ったりできます データ分割による検証法を使用し 多層ニューラルネットワークモデルを構築します また SAS スコアコードを生成することもできます 信頼性ブロック図複数のハードドライブを備えた RAID ストレージや 4 台のエンジンを積んだ航空機など より複雑なシステムの信頼性を分析しなければならないことがあります JMP があれば さまざまなツールを使用してシステム内の単一コンポーネントの信頼性を分析できます さらに JMP Pro であれば 信頼性ブロック図 プラットフォームを使って 単一コンポーネントの信頼性を基に複数のコンポーネントから成る複雑なシステムを定義し システム全体の信頼性を分析できます このプラットフォームを使用すると システム全体の信頼性を適切に予測でき 個々のコンポーネントの現在のパフォーマンスに基づいて 全体のパフォーマンスを予測できます また プロットで複数のシステム設計を比較し what-if 分析も簡単に実行できます そして 冗長性を持たせる最適な箇所を見極め システム障害の発生確率を下げます 信頼性ブロック図を使用すると システムを簡単に設計でき その弱点を修正できます また システム障害を回避するための情報を得ることができます 被覆配列因子間の交互作用によって不具合が発生することがあるアプリケーションのテストにおいて 被覆配列が使用できます 実験には費用がかかるため 不具合を見つける確率を最大化する一方でコストと時間を最小化する実験を計画する必要があります 被覆配列が まさにこれを実現します JMP Pro では 決定論的システムをテストし あらゆる可能な因子の組み合わせを特定の次元までカバーする実験を計画できます テストする意味がない因子の組み合わせがある場合 対話式の 許可しない組み合わせ フィルタを使用して これらの組み合わせを計画から自動的に排除できます JMP Pro の被覆配列の大きな利点のひとつに 被覆配列を計画できるだけではなく 統計分析の手法も備えていることが挙げられます JMP Pro ではあらゆる種類の統計分析を行えます 一般化回帰と被覆配列の計画が可能なソフトウェアは JMP Pro の他にはありません また JMP Pro では 任意のソフトウェアで作成された被覆配列計画を読み込み さらに最適化して 結果を分析できます 実験計画の構築を他者に頼る必要なしに 配列を独自で計画できます JMP Pro では 被覆配列でテストをより効率的に行えます JMP Pro には驚かされるばかりです 常に新しいモデリング手法やツールで データ分析者としての仕事を楽なものにしてくれています 特に 一般化回帰プラットフォームは使いやすく 高速です そして テスト / 検証変数を即座に作成できるので助かっています Dick De Veaux C. Carlisle Margaret Tippit ウィリアムズ大学統計学教授
得られたデータが理想的でない場合には JMP Pro の正則化回帰を使用すれば より優れたモデルを構築できます 混合モデル混合モデルは 経時データや空間データを分析できます たとえば 新薬開発の臨床試験で複数の被験者が反復測定されるような試験デザインや 製薬 製造 または化学業界におけるクロスオーバー試験などに使用します JMP Pro であれば データに混合モデルをあてはめられるため 固定効果や変量効果 反復効果を指定したり 被験者内における誤差の相関構造を指定できます また ランダム係数モデルも指定できます これらの操作はすべてドラッグ & ドロップで簡単に行うことができます さらに 以下のような場面で さまざまな相関構造を指定できるようになりました 一例として 実験対象のデータがクラスターにまとめられ クラスター内でデータに相関関係がある場合が挙げられます 別の例としては 実験対象が反復測定され これらの測定値に相関関係がある場合や 変化が見られる場合が挙げられます また JMP Pro の混合モデルを構築する際に モデルの指定に使用するのにどの空間相関構造が最適かを視覚的に決定する場合に便利です アップリフトモデル限られたマーケティング予算の効果を最大化するため 広告などを好意的に反応すると思われる人だけに送付したい場合があります しかし データセットが大きく 顧客背景や行動に関して多くの変数がある場合には その作業も困難になります このような場合は JMP Pro のアップリフトモデルが有効です この方法は増分モデル 実質リストモデル または正味モデルとも呼ばれ マーケティングに関する決定の最適化やパーソナライズされた治療計画の決定 あるいは より一般的な用途として ある行動に反応すると予測される個人の特徴の識別を目的として開発されました JMP Pro のアップリフトモデルでは パーティションモデルをあてはめ 処置の差を最大にする分岐を見つけます モデルにより ある行動に好意的に反応すると思われる個人のグループを識別します リソースの割り当てや個人に対する影響を最適化するための 効率的かつ目標化された決定を下すのに役立ちます 計算機を駆使した高度な手法 JMP Pro には 分割表の正確確率検定および一元配置 ANOVA のノンパラメトリックな正確確率検定が含まれています また JMP のレポートの大部分で ブートストラップ法による分析が行えます ブートストラップ法は 統計量の標本分布を近似する手法です JMP Pro では プログラムを書かずにブートストラップ標本を作成できます JMP のレポート上に表示されているさまざまな統計量をマウスで操作するだけで その統計量のブートストラップ標本が生成されます
ブートストラップ法は 統計学の教科書に書かれている仮定が成り立っていない場合や 確信が持てない場合に役立ちます たとえば 非線形回帰モデルのパラメータに対する信頼区間を求めたいときに役立つでしょう 既存の方法で求められた信頼区間や標準誤差と ブートストラップ法で求められた値を比較しても良いでしょう ブートストラップ法は 特定の分布を仮定せずに 推定量に対する推測を行います JMP Pro では こうした推定も マウス操作だけで簡単に実行できます SAS への接続 JMP Pro は SAS に簡単に接続し さまざまなオプションを使用したり 優れた SAS Analytics の機能やデータ統 合の機能にアクセスすることができます さらに JMP Pro では アクティブな SAS 接続がない場合でも JMP で作成したモデルを使ってすばやく簡単に新しいデータをスコアリングする SAS プログラムを生成できます 結果の共有 JMP は 発見の方法 そして発見を組織内で効率的に伝達する方法を追求してきました JMP Pro には JMP の視覚的かつ対話的な機能がすべて含まれており ユーザーはそれらの機能を使用して 今まで経験したことがないような方法でデータを分析することができます JMP Pro では データ グラフ 統計量がダイナミックにリンクされていることにより データ分析を生き生きと したものにします 3 次元のグラフやアニメーションでデータを検討することで 時間の経過に伴う変化や モデルの作成と説明のプロセスに関する貴重な洞察が得られます システム必要条件 JMP Pro は Microsoft Windows と Mac OS 上で実行でき 32 ビットと 64 ビットの両方に対応しています システム必要条件の詳細については jmp.com/japan/system をご参照ください データの数より多くの因子がある場合 ( 横長のデータ ) には PLS モデルが便利です
JMP Pro の主な機能 JMP Pro には JMP のすべての機能に加えて 以下の高度な分析機能が含まれています 詳細については jmp.com/japan/pro をご参照ください 予測モデリング分類ツリーと回帰ツリー ( パーティションモデリング )* ブートストラップ森 ランダム森ブースティングツリー K 近傍法 (K-NN) データ分割による検証法 ニューラルネットワークモデリング 欠測値のコード変換勾配ブースティングを使用したニューラルネットワークのあてはめ 1 層または 2 層のニューラルネットワークのあてはめ説明変数の変換 3 種類の活性化関数 ( 双曲正接 線形 Gauss) ランダムに生成された交差検証列の保存変換した共変量の保存データ分割による検証法 モデルの比較 JMP Pro を使用して構築されたモデルの自動比較 プロファイル 適合度統計量 (R 2 誤分類率 ROC 曲線 AUC リフトチャート ) モデル平均化 最新のモデリング 一般化回帰 ( 罰則付き推定による回帰分析 ) 正規化手法 : リッジ Lasso 適応型 Lasso 弾性ネット 適応型弾性ネット変数増加法分位点回帰正規分布 Cauchy 分布 指数分布 ガンマ分布 ベータ分布 二項分布 ベータ二項分布 Poisson 分布 負の二項分布ゼロ強調二項分布 ゼロ強調ベータ二項分布 ゼロ強調 Poisson 分布 ゼロ強調負の二項分布 ゼロ強調ガンマ分布検証手法の選択 : 検証列 K 分割 保留 一つ取って置き法 BIC AICc ステップワイズ回帰データ分割による検証法 ロジスティック回帰 ( 名義尺度と順序尺度 ) データ分割による検証法 判別解析データ分割による検証法 標準最小 2 乗法データ分割による検証法 モデルの検証モデリングプラットフォームの起動ダイアログで検証列を指定可能 検証列ユーティリティデータを学習用 検証用 テスト用へ分割 検証列の作成単純無作為抽出または層化無作為抽出のいずれかの手法による データセットの分割プラットフォームの起動ダイアログからの検証列の作成 高度な多変量分析 PLS モデリング モデルのあてはめ で PLS 回帰の手法を選択することで 連続量またはカテゴリカルな応答の指定 連続量またはカテゴリカルな因子の指定 交互作用 べき乗項の指定が可能 NIPALS モデルに沿った EM 法による欠測値補完ランダムに生成されたモデルの検証列の保存中心化や尺度化のオプションを適用する前に 交互作用やべき乗項に含まれている個々の変数を標準化検証手法の選択 : 検証列 K 分割 保留 一つ取って置き法 主成分分析 (PCA) 変数のクラスタリング 信頼性ブロック図複雑なシステムの信頼性のモデル化直列系 並列系 直並列系 / 並直列系 k-out-of-n 系などのシステムの信頼性の評価ライブラリから既存のデザインを選択し それらを組み合わせてデザインすることが可能 次ページに続く
前ページからの続き 被覆配列 被覆配列の計画および分析作成後の計画を 実験回数を低減するために最適化 許可しない組み合わせ フィルタを使用した 実行不可能な実験領域を指定他のソフトウェアで作成された被覆配列を読み込み さらに最適化 混合モデル固定効果だけではなく 変量効果 および誤差における相関構造を指定可能被験者内における誤差の相関構造や ランダム係数モデル ( 変量係数モデル ) を指定可能誤差間の相関構造を選択可能どの空間的相関構造が最適かを決定するバリオグラムが利用可能 アップリフトモデルディシジョンツリーの手法により 提案または処置に好意的に反応する可能性が最も高い消費者セグメントを識別増分モデル (incremental model) 実質リフトモデル (true-lift model) 正味モデル(net model) とも呼ばれている手法データ分割による検証法 オンライン情報 評価版さらに高度な統計的発見を体験したい方に 評価版をご用意しています jmp.com/japan/trial ユーザー事例 JMP が実際に活用されている事例をご紹介します jmp.com/japan/success 適用分野実験計画や探索的なデータ分析 統計モデリングなど JMP 製品のさまざまな応用分野をご紹介します jmp.com/japan/applications 計算機を駆使した高度な手法一元配置分析一元配置分散分析における正確確率検定 分割表分析正確確率検定 一般的なブートストラップ多くのレポートに対して マウス操作でブートストラップ法を実行 * SAS Model Manager で 使用可能な SAS コードを生成する SAS Institute Japan 株式会社 JMP ジャパン事業部 www.jmp.com/japan jmpjapan@jmp.com 106-6111 東京都港区六本木 6-10-1 六本木ヒルズ森タワー 11F Tel: 03 6434 3780 Fax: 03 6434 3781 SAS SAS ロゴ その他の SAS Institute Inc. の製品名 サービス名は 米国およびその他の国における SAS Institute Inc. の登録商標または商標です は 米国の連邦登録を受けていることを意味します その他記載のブランド名および製品名は それぞれの会社の商標です Copyright 2015, SAS Institute Inc. All rights reserved. 105667_130030.0315