PLS/PCR/OLS 回帰 1 つまたは複数の量的説明変数および / または質的説明変数の線形組み合わせを用いて,1 つまた は複数の量的従属変数の値をモデルして予測するには, このモジュールを使用します. 説明 このモジュールで利用可能な 3 つの回帰手法は, 説明変数の線形組み合わせによるモデ

Size: px
Start display at page:

Download "PLS/PCR/OLS 回帰 1 つまたは複数の量的説明変数および / または質的説明変数の線形組み合わせを用いて,1 つまた は複数の量的従属変数の値をモデルして予測するには, このモジュールを使用します. 説明 このモジュールで利用可能な 3 つの回帰手法は, 説明変数の線形組み合わせによるモデ"

Transcription

1 PLS/PCR/OLS 回帰 1 つまたは複数の量的説明変数および / または質的説明変数の線形組み合わせを用いて,1 つまた は複数の量的従属変数の値をモデルして予測するには, このモジュールを使用します. 説明 このモジュールで利用可能な 3 つの回帰手法は, 説明変数の線形組み合わせによるモデルを生成 するという共通の特性を持ちます.3 つの手法の間の違いは, 取り扱われる変数間の相関構造の 方法にあります. OLS 回帰 3 つの手法の中で最も古典的な手法. 通常の最小 2 乗法回帰 (OLS:Ordinary Least Squares regression) は, より一般的には線形回帰と呼ばれます ( 説明変数に単一または複合的に従属 ). p 個の説明変数によるモデルの場合,OLS 回帰は次式で表されます. Y 0 p X j1 j j ここで Y は従属変数, 0, はモデルの切片, X j はモデルの j 番目の説明変数に対応 (j= 1 から p), そして, は, 期待値 0 と分散 ² を持つ確率的誤差. n 個のオブザベーションがある場合,i 番目のオブザベーションに関する従属変数 Y の予測値の推定は, 次式で表されます. yˆ i x 0 p j1 j ij OLS 法は, 観測値と予測値の間の 2 乗誤差の合計の最小化である. この最小化は, 下記のモデルのパラメータの推定量を導きます. X DX 1 ˆ ' X ' Dy n 1 ˆ ² w ( ˆ i yi yi ) W p i1 2 1

2 ここで ˆ は i パラメータの推定量のベクトル,X は 1 のベクトルが先行する説明変数の行列, y は n 個の従属変数の観測された値のベクトル,p* は説明変数の数 ( 切片が一定でなければ 1 を 加える ),w i は i 番目のオブザベーションの重み,W は重み w i の合計, そして D はその対角 上に重み w i を持つ行列です. 予測値のべクトルは次式で表されます. 1 yˆ X X ' DX X ' Dy OLS 回帰の限界は, 行列 X X の転置の制約に起因する. それは, 行列の階数 ( ランク ) が p+1 であることが必要で, 行列がうまく振舞わない場合, いくつかの数値的な問題が生じます. XLSTAT は, これらの 2 つの問題を迂回できる Dempster (1969) のアルゴリズムを使用します. 行列の階数が q に等しい ( ただし, q は p+1 よりも小さい ) とき, いくつかの変数は, 一定であるか, または共線的な変数のブロックに属するので, それらをモデルから取り除きます. さらに, もしユーザーがオブザベーションの数と比較して, 多すぎる数の変数を選択した場合, 変数の自動選択が実行されます. これの理論的な限界は n-1 で, それより値が大きいと行列 X X が不可逆となります. しかしながら, いくつかの変数を削除するのは最適ではないかもしれません. 場合によれば, 他の変数または変数のブロックにほとんど共線的なため, ある変数をモデルに追加しないかもしれないが, すでにモデル中に存在する変数を消去することが, 新しい変数を追加するよりも意味があるかもしれません. その理由から, そしてたくさん説明変数を持つケースを取り扱うためにも, 他の手法が開発されています. PCR 回帰 主成分回帰 (PCR:Principal Components Regression) は,3 つのステップに分けられます. まず, 説明変数の表で主成分分析 (PCA:Principal Components Analysis) を実行し, そして, 選択された成分で OLS 回帰を実行し, 入力変数に対応するモデルのパラメータを計算します. PCA は, 変数によって記述される n 個のオブザベーションを持つ X の表を,q 個の成分で記述される n 個のスコアを持つ S の表に変換することができます. ここで q は,p 以下であり, そのような (S S) は不可逆です.OLS 回帰のステップのために変数 Y と最も相関する成分 r のみを保持するように追加の選択が成分に適用されます. 2

3 OLS 回帰が,Y と R の表で実行される. 回帰から得られたパラメータによる解釈の問題を迂回 するために,XLSTAT は, 結果をもとの空間に変換し戻して, 入力変数に対応するパラメータと 信頼区間を得ます. PLS 回帰 この手法は速く, 効率的で, 共分散に基づく基準に最適である. 変数の数が多い場合, そして説明変数が相関していそうな場合に推奨されます. PLS 回帰のアイデアは,p 個の変数で記述される n 個のオブザベーションを持つ表から開始して, h<p である h 個の成分の集合を作成することです. この手法は,PCA とは異なる成分を構築するために用いられ, 欠損値の取扱いの利点を提供します. 保持するべき成分の数の決定は, 通常, クロス バリデーションに関係する基準に基づきます. ユーザーは, 使用する成分の数を設定することもできます. 一部のプログラムでは,PLS1 と PLS2 を区別しています. PLS1 は, 従属変数が 1 つだけの場合に対応します.PLS2 は, 複数の従属変数がある場合に対応します.XLSTAT で使用するアルゴリズムでは, PLS1 を PLS2 の特殊なケースとして扱います. OLS や PCR 法の場合では, モデルが複数の従属変数を計算する必要がある場合, モデルの計算は, 従属変数の表 Y の列での単純なループです.PLS 回帰の場合では,Y の共分散構造も計算に反映されます. PLS 回帰の式は次式のように表されます. Y T C E ' h h h XW C ' h h h E 1 ' ' h h h h h XW PW C E ここで Y は従属変数の行列で,X は説明変数の行列です.T h, C h, W* h, W h および P h, は PLS アルゴリズムで生成される行列で,E h は残差の行列です. X に基づく Y の回帰係数の行列 B は,PLS 回帰アルゴリズムで生成される h 個の成分を持ち, 次式で表されます. ' 1 B W PW C ' h h h h 注意 : PLS 回帰は,OLS や PCR が行うのと同様に線形のモデルを導きます. 3

4 注意 : もし (PCR での )PCA から得られる成分の数, または PLS 回帰から得られる成分の数が, 説明変数の数と等しい場合, これらの 3 つの手法は同じ結果になります. PLS 回帰から得られる成分は, それらが Yを可能な限り説明するように構築されるが, 一方,PCR の成分は,X を可能な限り説明するように構築されます.XLSTAT は,Y と最も相関する成分の選択を可能にすることによって,PCR の欠点を部分的に補償することができます. ダイアログ ボックス ダイアログ ボックスは, データ選択から結果の表示まで, さまざまなオプションに対応する複 数のタブに分かれています. 下記は, ダイアログ ボックスのさまざまな成分の説明です. : 計算を開始するには, このボタンをクリックします. : 計算をしないでダイアログ ボックスを閉じます. : ヘルプを表示するには, このボタンをクリックします. : デフォルト オプションを再読み込みするには, このボタンをクリックします. : データ選択を削除するには, このボタンをクリックします. : XLSTA がデータを取り扱う方法を変更するには, これらのボタンをクリックします. 下向きの矢印は,XLSTAT が行をオブザベーション, 列を変数とみなします. 右向きの矢印は, XLSTAT が行を変数, 列をオブザベーションとみなします. 4

5 一般タブ : Y / 従属変数 : 量的 : 従属変数 ( 単一または複数 ) を選択してください. データは数値でなければなりません. 変 数ラベル オプションが有効の場合, 変数のヘッダも選択されていることを確認してください. X / 説明変数 : 量的 : 1つまたは複数の量的説明変数を含みたい場合は, このオプションを有効にしてください. そして, 対応するデータを選択してください. データは数値でなければなりません. 変数ラベル オプションが有効の場合, 変数のヘッダも選択されていることを確認してください. 質的 : 1つまたは複数の質的説明変数を含みたい場合は, このオプションを有効にしてください. それらの Excel の形式が何であろうと, データはカテゴリカルとみなされます. 変数ラベル オプションが有効の場合, 変数のヘッダも選択されていることを確認してください. 手法 : 使用したい回帰手法を選んでください. PLS: 部分最小 2 乗回帰を計算するには, このオプションを有効にします. PCR: 主成分回帰を計算するには, このオプションを有効にします. OLS: 通常の最小 2 乗回帰を計算するには, このオプションを有効にします. 範囲 : 既存のワークシート内のセルから開始して, 結果を表示はしたい場合は, このオプションを有効にしてください. そして, 対応するセルを選択してください. シート : 有効なワークブックの新規のワークシートに結果を表示するには, このオプションを有効にしてください. ワークブック : 新規のワークブックに結果を表示するには, このオプションを有効にしてください. 変数ラベル : データ選択 ( 従属変数, 説明変数, 重み, オブザベーション ラベル ) の最初の行 がヘッダを含む場合は, このオプションを有効にしてください. 5

6 オブザベーション ラベル : オブザベーション ラベルが利用可能な場合は, このオプションを有効にしてください. そして, 対応するデータを選択してください. 変数ラベル オプションが有効の場合, ヘッダを選択内に含める必要があります. このオプションが有効でない場合, XLSTAT によってオブザベーション ラベル (Obs1, Obs2 ) が自動的に生成されます. オブザベーション重み : オブザベーションに重み付けするには, このオプションを有効にしてください. このオプションを有効にしない場合は, 重みは 1 に等しいとみなされます. 重みは 0 以上でなければならず, 整数の値でなければなりません. あるケースの重みを 2 に設定すると, 同じオブザベーションが 2 回繰り返されることに相当します." 変数ラベル " オプションが有効なら, 選択のヘッダも選択されていることを確認してください. 回帰重み : このオプションは,PCR および OLS 回帰でのみ有効です. 重みつき最小 2 乗回帰を実行したい場合は, このオプションを有効にしてください. このオプションを有効にしない場合は, 回帰重みは 1 に等しいとみなされます. 重みは 0 以上でなければなりません. " 変数ラベル " オプションが有効の場合, 選択のヘッダも選択されていることを確認してください. オプションタブ : 共通オプション : 信頼区間 (%): さまざまな検定, パラメータ及び予測で用いる信頼区間の % でのサイズを入力し てください. デフォルト : 95. PLS 回帰のオプション : 停止条件 : 自動 : XLSTAT が保持する成分の数を自動で決定するようにするには, このオプションを有効にしてください. Qi² しきい値 : 成分の寄与率が有意であるか否かを決定するために用いる Qi² 基準のしきい値を設定するには, このオプションを有効にしてください ² に対応するデフォルト値は Qi² 改善 : 成分の寄与率が有意であるか否かを決定するために用いる Qi² 改善基準のしきい値を設定するには, このオプションを有効にしてください.5% 改善に対応するデフォルト値は この値は下記のように計算されます. 6

7 h Q² h1 Q² h Q² h 1 Q² Imp 最小 Press: モデル中で使用する成分の数が最小の Press 統計量を持つモデルに対応するようにするには, このオプションを有効にしてください. 最大成分数 : モデル中で考慮する成分の最大数を設定するには, このオプションを有効にしてください. PCR 回帰のオプション : 標準化 PCA: 相関行列で PCA を実行するには, このオプションを有効にしてください. 共分散行列 ( 非標準化 PCA) で PCA を実行するには, このオプションを無効にしてください. 成分をフィルタリング : モデルで使用する成分の数を削減するために, 下記の 2 つのオプションの 1 つを有効にできます. 最小 %: このオプションを有効にして, 選択された成分が表現する合計変動のパーセンテ ージを入力してください. 最大数 : 考慮する成分の最大数を設定するには, このオプションを有効にしてください. 成分の並べ替え : 最小 % または 最大数 に基づいて成分を選択するために, どの基準を用いる かを決定するために下記のオプションの 1 つを選びます. Y との相関係数 : 成分の選択が, 従属変数 Y と成分の間の R² 決定係数の大きさの順序に基 づくようにするには, このオプションを有効にしてください. このオプションが推奨です. 固有値 : 成分の選択が, 成分に対応する固有値の大きさの順序に基づくようにするには, このオプションを有効にしてください. PCR 及び OLS 回帰のオプション : 固定切片 : モデルの切片 ( または定数 ) を与えられた値に設定するには, このオプションを有効にしてください. そして, 対応するフィールド内で値を入力してください ( デフォルトでは 0). 許容 : OLS アルゴリズムが, 一定の値を持つ変数, または他の変数あるいは変数のグループと強く相関する変数を自動的に削除できるようにするには, このオプションを有効にします ( デフォルト値は最小の 最大値は 1 まで可能 ). 許容値が高いほど, 変数間の共線性をより許容するモデルになります. 7

8 OLS 回帰のオプション : 制約 : 質的説明変数を選択した場合のみ, このオプションが有効になります. 制約の種類を選んでください. a1 = 0: 各質的変数について, 変数の最初のカテゴリに対応するモデルのパラメータが 0 に設定されます. この制約の種類は, 最初のカテゴリを標準として, あるいは効果なしとしてみなす場合に役立ちます. Sum(ai) = 0: 各質的変数について, さまざまなカテゴリに対応するパラメータの合計が 0 に等しくなります. Sum(ni.ai) = 0: 各質的変数について, 度数で重み付けされたさまざまなカテゴリに対応す るパラメータの合計が 0 に等しくなります. モデル選択 : 下記のモデル選択方法の 1 つを使用したい場合, このオプションを有効にしてくだ さい. 最良モデル (Best model): この手法は, 最小の変数 と 最大の変数 で挟まれた多数の変 数に基づくすべてのモデルの中から最良のモデルを選ぶことができます. モデルの品質は 選択の 基準 に依存します. 基準 : 次の一覧から基準を選択してください. 修正済み R2 乗, MSE( 平均 2 乗誤差 ), Mallows の Cp, 赤池情報量基準 (AIC), Schwarz の SBC, 雨宮予測基準. 最小の変数 : モデルで考慮する変数の最小の数を入力してください. 最大の変数 : モデルで考慮する変数の最大の数を入力してください.. 注意 : この手法は, 探索されるモデルの数の合計が, Cn,k の合計 ( ただし k は 最小の変数 と最大の変数 の間の値をとり, Cn,k は n!/[(n-k)!k!] である ) なので, たいへんに長い計算になるかもしれません. したがって, 最大の変数 の値を段階的に増やしていくことを強く推奨します. ステップワイズ : この選択プロセスは, モデルに最も寄与する変数の追加から開始します ( ここで使用される基準は Student の統計量 ).2 番目の変数の確率が しきい値水準 よりも低い場合は, その変数がモデルに追加されます. この手順は,3 番目の変数についても同じです. そして,3 番目の変数から開始して, アルゴリズムは変数の 1 つの除去がモデルにどう影響するかを評価します. 変数のうちの 1 つの Studen 統計量に対応する確率が しきい値水準 よりも大きい場合は, その変数を除去されます. この手順は, モデルに追加あるいは除去する変数がなくなるまで続けられます. 8

9 フォワード : この手順は, 除去ステップがないことを除いては, ステップワイズとまったく同じです. バックワード : この手順は, すべての可能な変数の選択から開始します. そして, ステップワイズ選択と同様な方法を用いて, 変数を1つずつモデルから除去します. しきい値水準 : 選択プロセスの間の Student の統計量のしきい値確率の値を入力してください. 検証タブ : 検証 : モデルを検証するためのデータのサブ標本を使用したい場合は, このオプションを有効にしてください. 検証集合 : 検証に使用するオブザベーションをどのように獲得するかを決定するには, 下記のオプションの 1 つを選んでください. ランダム : オブザベーションがランダムに選択されます. したがって オブザベーションの数 N を指定してください. 最後の N 行 : 最後の N 個のオブザベーションが選択されます. したがって オブザベーションの数 N を指定してください. 最初の N 行 : 最初の N 個のオブザベーションが選択されます. したがって オブザベーションの数 N を指定してください. グループ変数 : このオプションを選択した場合,0 か 1 の値だけを持つバイナリ変数を選択する必要があります.1 の値は, そのオブザベーションが検証に使用されることを意味します. 予測タブ : 予測 : 予測モードで使用するデータを選択したい場合は, このオプションを有効にしてください. このオプションを有効にすると, 予測データ集合が推定データ集合と同じ変数が同じ順序で構造化されていることを確認する必要があります. 一方, 変数ラベルは選択してはいけません. 以下に一覧される選択の最初の行は, データに対応しなければなりません. 量的変数 : 量的説明変数を選択するには, このオプションを有効にしてください. 最初の行が変数ラベルを含んではいけません. 9

10 質的変数 : 質的説明変数を選択するには, このオプションを有効にしてください. 最初の行が変数ラベルを含んではいけません. オブザベーション ラベル : オブザベーション ラベルがある場合は, このオプションを有効にしてください. そして, 対応するデータを選択してください. このオプションが有効になっていないと, オブザベーション ラベルは XLSTAT によって自動的に生成されます (PredObs1, PredObs2 ). 欠損値タブ : これらのオプションは,PCR および OLS 回帰でのみ利用できます.PLS 回帰では, 欠損値がアルゴリズムによって自動的に取り扱われます. オブザベーションの消去 : 欠損値を持つオブザベーションを消去するには, このオプションを有効にしてください. 欠損値の推定 : 計算を開始する前に折損値を推定するには, このオプションを有効にしてください. 平均または最頻値 : 対応する変数の平均 ( 量的変数 ) または最頻値 ( 質的変数 ) を用いて, 欠損値を推定するには, このオプションを有効にしてください. 最近接近傍 : オブザベーションの最近接近傍を探索して, オブザベーションの欠損値を推 定するには, このオプションを有効にしてください. 出力タブ : 3 つの手法に共通なオプション : 記述統計 : 選択したすべての変数の記述統計量を表示するには, このオプションを有効にしてください. 相関係数 : 量的変数 ( 従属および説明 ) の相関行列を表示するには, このオプションを有効にしてください. 標準化係数 : モデルの標準化パラメータ ( ベータ係数とも呼ばれる ) を表示するには, このオプションを有効にしてください. 方程式 : モデルの方程式をはっきりと表示するには, このオプションを有効にしてください. 10

11 予測値および残差 : 予測値と残差の表を表示するには, このオプションを有効にしてください. PLS 回帰のオプション : t, u および u~ 成分 : 成分に対応する表を表示するには, このオプションを有効にしてください. このオプションが有効でない場合, 対応するグラフは表示されません. c, w, w* および p ベクトル : PLS アルゴリズムから得られるベクトルに対応する表を表示するには, このオプションを有効にしてください. このオプションが有効でない場合, 対応するグラフは表示されません. VIP: 投影のための変数の重要度の表とグラフを表示するには, このオプションを有効にしてください. 信頼区間 : 標準化係数の信頼区間を計算するには, このオプションを有効にしてください. この計算は, ジャックナイフ法を含みます. はずれ値分析 : はずれ値分析の表とグラフを表示するには, このオプションを有効にしてください. PCR 回帰のオプション : 因子負荷量 : 因子負荷量を表示するには, このオプションを有効にしてください.PCA が相関係数行列に基づく場合 ( 標準化 PCA), 因子負荷量は主成分と入力変数の間の相関係数に等しくなります. 因子 / 変数の相関 : 主成分と入力変数の間の相関を表示するには, このオプションを有効にしてください. 因子得点 : PCA によって生成された因子得点 ( 新しい空間でのオブザベーションの座標 ) を表示するには, このオプションを有効にしてください. この得点は,PCR の回帰ステップで使用されます. PCR および OLS 回帰のオプション : 分散分析 : 分散分析の表を表示するには, このオプションを有効にしてください. 修正済み予測値 : 予測値と残差の表で修正済み予測値を計算して表示するには, このオプション を有効にしてください. 11

12 Cook の D: 予測値と残差の表で Cook の距離を計算して表示するには, このオプションを有効に してください. Press: Press 統計量を計算して表示するには, このオプションを有効にしてください. グラフタブ : 3 つの手法に共通なオプション : 回帰グラフ : 回帰グラフを表示するには, このオプションを有効にしてください. 標準化係数 : モデルの標準化係数および対応する信頼区間によってグラフを表示するには, このオプションを有効にしてください. 予測値と残差 : 下記のグラフを表示するには, このオプションを有効にしてください. (1) 回帰直線 : 説明変数が 1 つだけで, その変数が量的変数の場合に限り, このグラフが表示されます. (2) 説明変数対標準化残差 : 説明変数が 1 つだけで, その変数が量的変数の場合に限り, このグラフが表示されます. (3) 従属変数対標準化残差 (4) 予測値対観測値 (5) 標準化残差の棒グラフ 信頼区間 : グラフ (1) と (4) で信頼区間を表示するには, このオプションを有効にしてくだ さい. PLS 回帰と PCR のオプション : 相関グラフ : 成分と入力変数の間の相関に関するグラフを表示するには, このオプションを有効 にしてください.PCR の場合, 相関円を表示するには, この変数を有効にしてください. ベクトル : 入力変数をベクトルで表示するには, このオプションを有効にしてください. オブザベーション グラフ : オブザベーションを新しい空間で可視化できるグラフを表示するに は, このオプションを有効にしてください. 12

13 ラベル : グラフ上でオブザベーションのラベルを表示するには, このオプションを有効に してください. ラベルの数は, フィルタリング オプションを用いて調整できます. バイプロット : 入力変数とオブザベーションを同時に表示するグラフを表示するには, このオプ ションを有効にしてください. ベクトル : 入力変数をベクトルで表示するには, このオプションを有効にしてください. ラベル : バイプロット上にオブザベーションのラベルを表示するには, このオプションを 有効にしてください. ラベルの数は, フィルタリング オプションを用いて調整できます. 色づけラベル : 対応するポイントと同じ色でラベルを表示するには. このオプションを有効にしてください. ラベルが黒で表示されている場合, このオプションを有効になりません. フィルタ : 表示するオブザベーションの数を調整するには, このオプションを有効にしてください. ランダム : 表示するオブザベーションをランダムに選択します. 表示する オブザベーションの数 N を指定しなければなりません. 最初の N 行 : 最初の N 個のオブザベーションが, グラフ上に表示されます. 表示する オブザベーションの数 N を指定しなければなりません. 最後の N 行 : 最後の N 個のオブザベーションが, グラフ上に表示されます. 表示する オブザベーションの数 N を指定しなければなりません. グループ変数 : このオプションを選択すると,0 と 1 の値を持つバイナリ変数を選択する必要があります.1 は, 表示するオブザベーションとして識別されます. 結果 記述統計 : 記述統計の表は, 選択されたすべての変数についての基本統計量を表示します. 従属変数 ( 青で色づけ ), および量的説明変数について,XLSTAT は, オブザベーションの数, 欠損値を持つオブザベーションの数, 欠損値のないオブザベーションの数, 平均値, 不偏標準偏差を表示します. 質的説明変数について,XLSTAT は, その名前とカテゴリの度数を表示します. 相関行列 : この表は, 説明変数間, 従属変数間, および両者のグループ間の相関の可視化を可能にするために表示されます. 13

14 PLS 回帰の結果 : 最初の表は, モデル品質指標を表示します. この品質は, 指標への成分の累積寄与率に対応しま す. Q²cum 指標は, モデル ( および複数の従属変数がある場合はサブ モデル ) の予測品質 への最初の h 個の成分の全体的な寄与率を測定します.Q²cum(h) 指標は次式で表されま す. Q² cum( h) 1 q h k 1 q j1 k 1 PRESS SCE kj k j1 この指標は,PRESS 統計量 ( クロスバリデーションが必要 ) および 1 つ成分の尐ないモデルの誤差の 2 乗和 (SSE) を含みます.Q²cum 指標の最大値の探索は, 最も安定したモデルを発見することに相当します. R²Ycum 指標は, 従属変数と最初の h 個の成分の間の決定係数の合計です. したがって, これは, モデルの従属変数についての最初の h 個の成分の説明力を測定します. R²Xcum 指標は, 説明変数と最初の h 個の成分の間の決定係数の合計です. したがって, これは, モデルの説明変数についての最初の h 個の成分の説明力を測定します. 成分の数が増えるに伴う, この 3 つの指標の進展展の可視化を可能にするため, 棒グラフが表示されます.R²Ycum と R²Xcum 指標は, 成分の数によって必然的に増大しますが,Q²cum はそうではありません. 次の表は, 説明変数および従属変数と t および ũ 成分の相関行列です. グラフは,t 成分との相関を示します. 次の表は w ベクトルで, 続いて w* ベクトルおよび c ベクトルとなっており, 説明 部に示されるように, それはモデルに直接含まれます.h=2 までが有効なモデルに対応する場合,w*/c 軸上の変数チャートでの y ベクトルへの x ベクトルの射影によって, モデル中の対応する係数の符号と相対重みがわかります. 次の表は,t 成分の空間でのオブザベーションの得点を示します. 対応するグラフが表示されています. いくつかのオブザベーションが検証のために選択された場合, それらがグラフ上に表示されます. 次の表は,t 成分の空間中でのオブザベーションの標準化得点を示します. これらの得点は,( 指標変数で表される ) 各オブザベーションと成分との相関を計算することに相当します. これは, 14

15 Xs,Ys およびオブザベーションを同時に表示する相関マップにオブザベーションを表示することを可能にします. このマップの解釈のための事例は, Tenenhaus (2003) で示されています. 次の表は, u とそれから u~ 成分の空間でのオブザベーションの得点です.u~ に基づくグラフが示されています. 検証のためにいくつかのオブザベーションが選択された場合, それらがグラフに表示されます. Q² 品質指標の表は, 成分が従属変数の説明にどれぐらい寄与しているかを可視化できます. 累積 Q² 品質指標の表は, 空間の次元数の増大に伴う品質を測定することができます. 入力変数 ( 従属変数および説明変数 ) と成分 t および u~ の間の R² および冗長性の表は,t および u~ の説明力を評価することを可能にします. X の表 (n 行と p 個の変数 ) と c 成分の間の冗長性は,c で説明される X の分散の一部です. 我々は, これを変数と成分の間の相関係数の 2 乗の平均として定義します. p 1 2 Rd X, c R ( x j, c) p j 1 冗長性から,t 成分の構築のための説明変数の重要度を測定する VIP(Variable Importance for the Projection) を導くことができます. 説明変数 J と成分 h の VIP は, 次式で表されます. h p VIP Rd Y t w 2, hj h i ij i1 Rd Y, ti i1 VIP チャート ( 成分ごとの棒グラフ ) 上で,0.8 より大きい VIP を識別するための境界線がプトッロされています. このしきい値は, Wold (1995) が提案したもので, モデルに有意に寄与している変数を識別することができます. 次の表は, はずれ値分析を示します.DModX(X 変数の空間での各オブザベーションからモデルへの距離 :distances from each observation to the model in the space of the X variables) は, 説明変数についてのはずれ値を識別することができ, 一方, DModY(Y 変数の空間での各オブザベーションからモデルへの距離 :distances from each observation to the model in the space of the Y variables) は, 従属変数についてのはずれ値を識別することができます. 対応するグラフ上にしきい値 DCrit も, はずれ値を識別するのを助けるために表示されます.DCrit しきい値より上にある DMod 値がはずれ値に対応します. DCrit は, 伝統的に箱ひげ図で使用されているしきい値を用いて計算されます.i 番目のオブザベーションの DModX の値は次式で表されます. 15

16 DModX i e( X, t) n j1 n h 1 p h p 2 ij ここで,e(X,t) ij (i = 1 n) は,j 番目の成分での X の回帰の残差です.I 番目のオブザベーション の DModY の値は, 次式で表されます. DModY i q j1 e( Y, t) q h 2 ij ここで,q は従属変数の数で,e(Y,t) ij (i = 1 n) は j 番目の成分での Y の回帰の残差です. 次の表は, 複数の従属変数に対応するモデルのパラメータを示します. 説明変数の数が 20 を超 えない場合は, それに続いて, 各モデルに対応する方程式があります. 従属変数のそれぞれについて, 一連の表とグラフが示されます. 適合度統計 : この表は, 各従属変数についての PLS 回帰の適合度統計量を示します. この統計量の定義は, 下記のとおりです. 標準化係数 ( ベータ係数ともいう ) の表は, モデル中の変数の相対重みを比較することができます. 信頼区間を計算するために, PLS 回帰の場合,OLS 回帰で使用される正規性仮説に基づく伝統的な式は適用しません.Tenenhaus ら (2004) が提案したブートストラップ法が, 信頼区間を推定できます. 係数の絶対値が大きいほど, モデル中のその変数の重みがより大きくなります. 標準化係数のまわりの信頼区間が 0 を含む ( それはグラフ上で簡単に観察できます ) 場合, モデル中のその変数の重みは, 有意ではありません. 予測値と残差の表で, 重み, 従属変数の観測値, 対応する予測値, 残差, および信頼区間が, 各オブザベーションについて表示されます.2 種類の信頼区間が表示されます. 平均周辺の区間 ( これは, 与えられた説明変数の値の集合によって無限数のオブザベーションについて予測がなされる場合に対応 ) と個々の予測値周辺の区間 ( これはたった 1 つのオブザベーションについて予測がなされる場合に対応 ) とがあります.2 つ目の区間は, もちろん, 確からしさがより高いので, 通常 1 つ目のよりも広くなります. 検証のためにいくつかのオブザベーションが選択された場合, それらがこの表に示されます. あとで表示される 3 つのグラフが可視化を可能にします. 16

17 残差対従属変数, 予測値と観測値の間の距離 ( 理想的なモデルでは, すべての点が基準線上にある ), 残差の棒グラフ. 予測モードで使用するデータを選択した場合, 表は新しいオブザベーションでの予測とそれに対 応する信頼区間を示します. PCR 回帰の結果 : PCR 回帰は, 主成分分析のステップを必要とします. 先の結果が後に関係します. 固有値 : 固有値の表とそれに対応するスクリーン プロットが表示されます. 表示される固有値の数は, 空値でない固有値の数に等しくなります. 成分フィルタリング オプションが選択された場合, それは回帰ステップの前にのみ適用されます. 対応する出力オプションが有効化された場合,XLSTAT は因子負荷量 ( 新しい空間での入力変数の座標 ) を表示して, それから入力変数と成分との相関を表示します. PCA が相関行列で実行された場合, 相関は因子負荷量と等しくなります. 次の表は, 因子得点 ( 新しい空間でのオブザベーションの座標 ) を表示し, これはあとの回帰ステップで使用されます. 検証のためにいくつかのオブザベーションが選択された場合, それらがこの表に示されます. バイプロットに対応するオプションを選択して, バイプロットを表示することができます. 従属変数との相関に基づくフィルタ オプションが選択された場合, 回帰ステップで使用される成分は, 従属変数との最も大きな決定係数 (R²) を持つそれです. 成分と従属変数との間の相関係数の行列が表示されます. 保持される成分の数は, 固有値の数と選択されたオプション ( 最小 % または 最大成分数 ) によります. 固有値に基づくフィルタ オプションが選択された場合, 回帰ステップで使用される成分は, 最も大きな固有値を持つそれです. 保持される成分の数は, 固有値の数と選択されたオプション ( 最小 % または 最大成分数 ) によります. PCR および OLS 回帰に共通の結果 : 適合度統計 : この表は, 回帰モデルの適合度に関係する統計量を示します. オブザベーション : 計算のために考慮に入れられるオブザベーションの数. 下記の数式で, n はオブザベーションの数. 重みの合計 : オブザベーションの重みの総計が考慮に入れられます. 下記の数式で, W は 重みの総計. 17

18 DF: 選択されたモデルの自由度の数 ( 分散分析表の誤差 DF). R²: モデルの決定係数. 0 と 1 の間の値を持つこの係数は, モデルの切片がユーザーによ って固定されなかった場合にのみ表示されます. この係数の値は, 次式で計算されます. R² 1 n i1 n i1 ˆ 2 w y y i i i w ( y y) i i 2, with y 1 n wiyi n i 1 R² は, モデルによって説明される従属変数のバラツキの比率であると解釈されます. R² が 1 に近いほど, よく適合したモデルです. R² の主要な欠点は, モデルを適合させるた めに使用する変数の数を考慮に入れていないことです. 修正済み R²: モデルの修正された決定係数.R² がゼロに近いとき, 修正済み R² は負にな るかもしれません. この係数は, モデルの切片がユーザーによって固定されなかった場合 にのみ表示されます. この係数の値は次式で計算されます. W 1 ˆR² 1 1 R² W p 1 修正済み R² は, モデルに使用する変数の数を考慮できるように R² を補正するものです. MSE: 平均 2 乗誤差 (MSE) は, 次式で定義されます. n 1 MSE wi yi yi W p* i1 ˆ 2 RMSE: 平均 2 乗平方根誤差 (RMSE) は,MSE の平方根です.. MAPE: 絶対平均比誤差 (MAPE) は, 次式で計算されます. MAPE y yˆ 100 n i i wi W i1 yi DW: Durbin-Watson 統計量は次式で定義されます. DW n i2 y yˆ y yˆ i i i1 i1 n i1 w y yˆ i i i

19 この係数は 1 次の自己相関係数で, 残差が自己相関していないことを検証することができます. 残差の独立性は, 線形回帰の仮定の 1 つです. 残差の間の独立性の仮説が採択されるか棄却さ れるかを知るために, ユーザーは Durbin-Watson 表を見ることが必要になるでしょう. Cp: Mallows の Cp は次式で定義されます.: SCE Cp 2 p * W ˆ ここで SSE は, モデルと説明変数の 2 乗誤差の総計で, ˆ はすべての説明変数を含むモデ ルの残差の分散の推定量です. Cp 係数が p* に近いほど, モデルの偏りが尐なくなります.. AIC: 赤池情報量基準 (AIC) は次式で定義されます. SCE AIC W ln 2 p * W 赤池 (1973) が提案したこの基準は, 情報理論から導かれ,derives from the information theory Kullback と Leibler の測度 (1951) に基づきます. これは, 新しい説明変数の追加が十分な情報 をもたらさないようなモデルにはペナルティを科すモデル選択基準です.AIC が低いほど, よ いモデルです.. SBC: Schwarz のベイジアン基準は次式で表されます. SCE SBC W ln ln W p * W Schwarz (1978) が提案したこの基準は, AIC に近く, それを最小化することが目的です. PC: 雨宮予測基準基準は次式表されます. PC 1 R² W p * W p* 雨宮 (1980) が提案したこの基準は, 修正済み R² のように, モデルの節約原理を考慮することができます. Press RMCE: Press RMSE 統計量は, ダイアログ ボックス内の対応するオプションが 有効になっている場合のみ表示されます.Press 統計量は次式で定義されます. Press n i1 ˆ 2 ( ) w y y i i i i 19

20 ここで yˆi ( i ) は,i 番目のオブザベーションがモデルのパラメータの推定に使用され たデータ集合に含まれない場合の, そのオブザベーションの予測です. 次式が得られ る場合 : Press RMCE Press W - p* したがって,Press RMSE は RMSE と比較できます. 両者の差が大きいことは, モデ ルが, いくつかのオブザベーションの有無に敏感であることを示します. 分散分析表は, 説明変数がモデルにどれだけの情報量をもたらすかを評価できます. モデルの切片がユーザーによって固定されていない場合, 選択されたモデルの適合と従属変数がその平均に等しい基本モデルの適合を比較することによって, その説明力が測定されます. 切片が与えられた値に固定されている場合, 選択されたモデルは, 従属変数が固定切片に等しい基本モデルと比較されます. PCR 回帰の場合, モデル パラメータの最初の表は, 選択された成分に基づくモデルのパラメータです. この表は, 解釈が容易ではありません. 入力変数に対応してモデルのパラメータを得るために変換が実行されるからです. 後の表は,OLS 回帰の場合, 直接得られます. この表の中で, 対応する標準誤差,Student の t, 対応する確率, 信頼区間などのパラメータの推定を見ることができます. そして, モデルの方程式が, モデルの可視化や再利用を助けるために表示されます. 標準化係数 ( ベータとも呼ばれる ) の表は, モデル中の変数の相対重みを比較することを可能にします. この係数の絶対値が大きいほど, モデル中のその変数の重みが大きくなります. 標準化係数の周辺の信頼区間が 0 を含む ( それはグラフで簡単に観察できる ) 場合, その変数の重みは有意ではありません. 予測値と残差の表では, 重み, 説明変数の値 ( もしそれが 1 つだけの場合 ), 従属変数の観測値, 対応する予測値, 残差, 信頼区間, 修正済み予測値,Cook の D が各オブザベーションについて表示されます.2 種類の信頼区間が表示されます. 平均値周辺の区間 ( これは与えられた説明変数の値の集合によって, 無限の数のオブザベーションについて予測がなされる場合に対応 ) および個々の予測値の周辺の区間 ( これはたった 1 つオブザベーションについて予測がなされる場合に対応 ).2 つ目の区間は, 不確実性がもちろん高いので, 通常, 最初のものよりも広くなります. いくつかのオブザベーションが検証のために選択された場合, それらがこの表に表示されます. 20

21 続くグラフは上記に一覧された結果を可視化することができます. モデル中にたった 1 つの説明変数がある場合, 最初のグラフは, オブザベーション, 回帰直線, 予測値周辺の信頼区間を可視化できます.2つ目のグラフは, 標準化残差対説明変数を表示します. 残差は, 横軸周辺にランダムに分布するはずです. トレンド ( 傾向 ) が観察される場合, それはモデルに問題があることを意味します.. あとで表示さえっる 3 つのグラフは, 標準化残差対従属変数, 予測値と観測値の間に距離 ( 理想的なモデルでは, すべての点が 2 分線上にある ), 標準化残差の棒グラフを別々に可視化することができます.3 つ目のグラフは, 予期しない数の高い残差があるかどうかを素早く見ることを可能にします : 残差の正規性の仮定は, 標準化残差の 5% だけが ]-2, 2[ 区間の外にあるべきです. 予測モードで使用するデータを選択した場合, 表は新しいオブザベーションでの予測値と対応する信頼区間を表示します. OLS 回帰の結果 : Type I SS および Type III SS (SS: 2 乗和 ) オプションが有効になっている場合, 対応する表が表示されます. Type I SS の表は, 新しい説明変数の漸進的な追加のモデルへの影響を可視化できます. この影響度は, 合計 2 乗誤差 (SSE), 平均 2 乗誤差 (MSE),Fisher の F 統計量, Fisher の F に対応する確率によって与えられます. より小さな確率は, 変数がモデルにより多くの情報をもたらすことを示します. 注意 : 変数の選択の順序がここで得られる結果に影響します. Type III SS の表は, 説明変数の除去の ( その他のすべての変数が含まれる ) モデルの適合度での影響を可視化できます. 影響度は, 合計 2 乗誤差 (SSE), 平均 2 乗誤差 (MSE), Fisher の F 統計量,Fisher の F に対応する確率で測定されます. より小さな確率は, 変数がモデルにより多くの情報をもたらすことを示します. 注意 : 選択における変数の順序は, この表の結果には影響しません. 事例 PLS 回帰の使用法のチュートリアルは, Addinsoft 社 web サイトの下記のページ. 21

22 参考文献 Akaike H. (1973). Information Theory and the Extension of the Maximum Likelihood Principle. In: Second International Symposium on Information Theory. (Eds: V.N. Petrov and F. Csaki). Academiai Kiadó, Budapest Anemiya T. (1980). Selection of regressors. International Economic Review, 21, Bastien P., Esposito Vinzi V. and Tenenhaus M. (2005). PLS Generalised Regression. Computational Statistics and Data Analysis, 48, Dempster A.P. (1969). Elements of Continuous Multivariate Analysis. Addison-Wesley, Reading, MA. Kullback S. and Leibler R. A. (1951). On information and sufficiency. Annals of Mathematical Statistics, 22, Schwarz G. (1978). Estimating the dimension of a model. Annals of Statistics, 6, Tenenhaus M. (1998). La Régression PLS, Théorie et Pratique. Technip, Paris. Tenenhaus M., Pagès J., Ambroisine L. and Guinot C. (2005). PLS methodology for studying relationships between hedonic judgements and product characteristics. Food Quality and Preference. 16, 4, Wold, S., Martens H. and Wold H. (1983). The Multivariate Calibration Problem in Chemistry solved by the PLS Method. In: Ruhe A.and Kågström B. (eds.), Proceedings of the Conference on Matrix Pencils. Springer Verlag, Heidelberg Wold S. (1995). PLS for multivariate linear modelling. In: van de Waterbeemd H. (ed.), QSAR: Chemometric Methods in Molecular Design. Vol 2. Wiley-VCH, Weinheim, Germany

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 0 部分的最小二乗回帰 Parial Leas Squares Regressio PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌 部分的最小二乗回帰 (PLS) とは? 部分的最小二乗回帰 (Parial Leas Squares Regressio, PLS) 線形の回帰分析手法の つ 説明変数 ( 記述 ) の数がサンプルの数より多くても計算可能 回帰式を作るときにノイズの影響を受けにくい

More information

Microsoft PowerPoint - 資料04 重回帰分析.ppt

Microsoft PowerPoint - 資料04 重回帰分析.ppt 04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit manabu@cheme.koto-u.ac.jp http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline

More information

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - e-stat(OLS).pptx 経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数

More information

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め

More information

スライド 1

スライド 1 データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小

More information

スライド 1

スライド 1 データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える

More information

ビジネス統計 統計基礎とエクセル分析 正誤表

ビジネス統計 統計基礎とエクセル分析 正誤表 ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります

More information

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt 重回帰分析 残差分析 変数選択 1 内容 重回帰分析 残差分析 歯の咬耗度データの分析 R で変数選択 ~ step 関数 ~ 2 重回帰分析と単回帰分析 体重を予測する問題 分析 1 身長 のみから体重を予測 分析 2 身長 と ウエスト の両方を用いて体重を予測 分析 1 と比べて大きな改善 体重 に関する推測では 身長 だけでは不十分 重回帰分析における問題 ~ モデルの構築 ~ 適切なモデルで分析しているか?

More information

Microsoft Word - å“Ÿåłžå¸°173.docx

Microsoft Word - å“Ÿåłžå¸°173.docx 回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw

More information

Microsoft Word - 補論3.2

Microsoft Word - 補論3.2 補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は

More information

1.民営化

1.民営化 参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方

More information

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手 14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を

More information

因子分析

因子分析 因子分析 心理データ解析演習 M1 枡田恵 2013.6.5. 1 因子分析とは 因子分析とは ある観測された変数 ( 質問項目への回答など ) が どのような潜在的な変数 ( 観測されない 仮定された変数 ) から影響を受けているかを探る手法 多変量解析の手法の一つ 複数の変数の関係性をもとにした構造を探る際によく用いられる 2 因子分析とは 探索的因子分析 - 多くの観測変数間に見られる複雑な相関関係が

More information

Microsoft PowerPoint - 三次元座標測定 ppt

Microsoft PowerPoint - 三次元座標測定 ppt 冗長座標測定機 ()( 三次元座標計測 ( 第 9 回 ) 5 年度大学院講義 6 年 月 7 日 冗長性を持つ 次元座標測定機 次元 辺測量 : 冗長性を出すために つのレーザトラッカを配置し, キャッツアイまでの距離から座標を測定する つのカメラ ( 次元的なカメラ ) とレーザスキャナ : つの角度測定システムによる座標測定 つの回転関節による 次元 自由度多関節機構 高増潔東京大学工学系研究科精密機械工学専攻

More information

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ カスタムテーブル入門 1 カスタムテーブル入門 カスタムテーブル Custom Tables は IBM SPSS Statisticsのオプション機能の1つです カスタムテーブルを追加することで 基本的な度数集計テーブルやクロス集計テーブルの作成はもちろん 複数の変数を積み重ねた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑で柔軟な集計表を作成することができます この章では

More information

Microsoft PowerPoint - H17-5時限(パターン認識).ppt

Microsoft PowerPoint - H17-5時限(パターン認識).ppt パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を

More information

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ] JMP を用いた ARIMA モデルのあてはめ SAS Institute Japan 株式会社 JMP ジャパン事業部 2013 年 2 月作成 1. はじめに JMP の時系列分析では 一変量の時系列データに対する分析や予測を行うことができ 時系列データに対するグラフ表示 時系列モデルのあてはめ モデルの評価 予測まで 対話的に分析を実行することができます 時系列データにあてはめるモデルとしては

More information

講義「○○○○」

講義「○○○○」 講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数

More information

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順

目次 1 章 SPSS の基礎 基本 はじめに 基本操作方法 章データの編集 はじめに 値ラベルの利用 計算結果に基づく新変数の作成 値のグループ化 値の昇順 SPSS 講習会テキスト 明治大学教育の情報化推進本部 IZM20140527 目次 1 章 SPSS の基礎 基本... 3 1.1 はじめに... 3 1.2 基本操作方法... 3 2 章データの編集... 6 2.1 はじめに... 6 2.2 値ラベルの利用... 6 2.3 計算結果に基づく新変数の作成... 7 2.4 値のグループ化... 8 2.5 値の昇順 降順... 10 3

More information

Microsoft Word - mstattext02.docx

Microsoft Word - mstattext02.docx 章重回帰分析 複数の変数で 1つの変数を予測するような手法を 重回帰分析 といいます 前の巻でところで述べた回帰分析は 1つの説明変数で目的変数を予測 ( 説明 ) する手法でしたが この説明変数が複数個になったと考えればよいでしょう 重回帰分析はこの予測式を与える分析手法です 以下の例を見て下さい 例 以下のデータ (Samples 重回帰分析 1.txt) をもとに体重を身長と胸囲の1 次関数で

More information

Medical3

Medical3 Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー

More information

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft Word - Time Series Basic - Modeling.doc 時系列解析入門 モデリング. 確率分布と統計的モデル が確率変数 (radom varable のとき すべての実数 R に対して となる確 率 Prob( が定められる これを の関数とみなして G( Prob ( とあらわすとき G( を確率変数 の分布関数 (probablt dstrbuto ucto と呼 ぶ 時系列解析で用いられる確率変数は通常連続型と呼ばれるもので その分布関数は (

More information

<4D F736F F F696E74202D2091E63989F1837D815B F A B836093C1985F D816A2E >

<4D F736F F F696E74202D2091E63989F1837D815B F A B836093C1985F D816A2E > 共分散構造分析 マーケティング リサーチ特論 2018.6.11 補助資料 ~ 共分散構造分析 (SEM)~ 2018 年度 1 学期 : 月曜 2 限 担当教員 : 石垣司 共分散構造分析とは? SEM: Structural Equation Modeling 複数の構成概念 ( ) 間の影響を実証 因子分析ではは直交の仮定 演繹的な仮説検証や理論実証に利用 探索的アプローチには不向き CB-SEM

More information

Medical3

Medical3 1.4.1 クロス集計表の作成 -l m 分割表 - 3つ以上のカテゴリを含む変数を用いて l mのクロス集計表による分析を行います この例では race( 人種 ) によってlow( 低体重出生 ) に差が認められるかどうかを分析します 人種には3つのカテゴリ 低体重出生には2つのカテゴリが含まれています 2つの変数はともにカテゴリ変数であるため クロス集計表によって分析します 1. 分析メニュー

More information

スライド 1

スライド 1 データ解析特論第 5 回 ( 全 15 回 ) 2012 年 10 月 30 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 をもっとやります 2 第 2 回 3 データマイニングの分野ではマクロ ( 巨視的 ) な視点で全体を捉える能力が求められる 1. コンピュータは数値の集合として全体を把握していますので 意味ある情報として全体を見ることが不得意 2. 逆に人間には もともと空間的に全体像を捉える能力が得意

More information

統計的データ解析

統計的データ解析 統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c

More information

基礎統計

基礎統計 基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t

More information

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt 主成分分析 1 内容 主成分分析 主成分分析について 成績データの解析 R で主成分分析 相関行列による主成分分析 寄与率 累積寄与率 因子負荷量 主成分得点 2 主成分分析 3 次元の縮小と主成分分析 主成分分析 次元の縮小に関する手法 次元の縮小 国語 数学 理科 社会 英語の総合点 5 次元データから1 次元データへの縮約 体形評価 : BMI (Body Mass Index) 判定肥満度の判定方法の1つで

More information

memo

memo 数理情報工学特論第一 機械学習とデータマイニング 4 章 : 教師なし学習 3 かしまひさし 鹿島久嗣 ( 数理 6 研 ) kashima@mist.i.~ DEPARTMENT OF MATHEMATICAL INFORMATICS 1 グラフィカルモデルについて学びます グラフィカルモデル グラフィカルラッソ グラフィカルラッソの推定アルゴリズム 2 グラフィカルモデル 3 教師なし学習の主要タスクは

More information

Microsoft PowerPoint - 測量学.ppt [互換モード]

Microsoft PowerPoint - 測量学.ppt [互換モード] 8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,

More information

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 治 医 の 観 症 例 治 医 の 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のない要約知識 直感 知識 直感 総合的評価 考察 総合的評価 考察 単変量解析の場合 多変量解析の場合 < 表 1.1 脂質異常症患者の TC と TG と重症度 > 症例 No. TC

More information

Microsoft Word doc

Microsoft Word doc . 正規線形モデルのベイズ推定翠川 大竹距離減衰式 (PGA(Midorikawa, S., and Ohtake, Y. (, Attenuation relationships of peak ground acceleration and velocity considering attenuation characteristics for shallow and deeper earthquakes,

More information

Microsoft Word - SPSS2007s5.doc

Microsoft Word - SPSS2007s5.doc 第 5 部 SPSS によるデータ解析 : 追加編ここでは 卒論など利用されることの多いデータ処理と解析について 3つの追加をおこなう SPSS で可能なデータ解析のさまざま方法については 紹介した文献などを参照してほしい 15. 被験者の再グループ化名義尺度の反応頻度の少ない複数の反応カテゴリーをまとめて1つに置き換えることがある たとえば 調査データの出身県という変数があったとして 初期の処理の段階では

More information

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49

要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49 要旨 1. 始めに PCA 2. 不偏分散, 分散, 共分散 N N 49 N N Web x x y x x x y x y x y N 三井信宏 : 統計の落とし穴と蜘蛛の糸,https://www.yodosha.co.jp/jikkenigaku/statistics_pitfall/pitfall_.html 50 標本分散 不偏分散 図 1: 不偏分散のほうが母集団の分散に近付くことを示すシミュレーション

More information

13章 回帰分析

13章 回帰分析 単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える

More information

経営統計学

経営統計学 5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており

More information

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている

More information

ANOVA

ANOVA 3 つ z のグループの平均を比べる ( 分散分析 : ANOVA: analysis of variance) 分散分析は 全体として 3 つ以上のグループの平均に差があるか ということしかわからないために, どのグループの間に差があったかを確かめるには 多重比較 という方法を用います これは Excel だと自分で計算しなければならないので, 分散分析には統計ソフトを使った方がよいでしょう 1.

More information

景気指標の新しい動向

景気指標の新しい動向 内閣府経済社会総合研究所 経済分析 22 年第 166 号 4 時系列因子分析モデル 4.1 時系列因子分析モデル (Stock-Watson モデル の理論的解説 4.1.1 景気循環の状態空間表現 Stock and Watson (1989,1991 は観測される景気指標を状態空間表現と呼ば れるモデルで表し, 景気の状態を示す指標を開発した. 状態空間表現とは, わ れわれの目に見える実際に観測される変数は,

More information

Probit , Mixed logit

Probit , Mixed logit Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,

More information

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書の 1 つです カイ二乗検定 概要 実際には 連続データの収集が不可能な場合や難しい場合 品質の専門家は工程を評価するためのカテゴリデータの収集が必要となることがあります たとえば 製品は不良

More information

Microsoft PowerPoint - Econometrics pptx

Microsoft PowerPoint - Econometrics pptx 計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: kkarato@eco.u-toyama.ac.p webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます

More information

Microsoft PowerPoint - ch04j

Microsoft PowerPoint - ch04j Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数

More information

データ解析

データ解析 データ解析 ( 前期 ) 最小二乗法 向井厚志 005 年度テキスト 0 データ解析 - 最小二乗法 - 目次 第 回 Σ の計算 第 回ヒストグラム 第 3 回平均と標準偏差 6 第 回誤差の伝播 8 第 5 回正規分布 0 第 6 回最尤性原理 第 7 回正規分布の 分布の幅 第 8 回最小二乗法 6 第 9 回最小二乗法の練習 8 第 0 回最小二乗法の推定誤差 0 第 回推定誤差の計算 第

More information

Microsoft Word - reg2.doc

Microsoft Word - reg2.doc 回帰分析 重回帰 麻生良文. 前提 個の説明変数からなるモデルを考える 重回帰モデル : multple regresso model α β β β u : 被説明変数 epled vrle, 従属変数 depedet vrle, regressd :,,.., 説明変数 epltor vrle, 独立変数 depedet vrle, regressor u: 誤差項 error term, 撹乱項

More information

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな RSS Higher Certiicate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question (i) 帰無仮説 : 00C と 50C において鉄鋼の破壊応力の母平均には違いはない. 対立仮説 : 破壊応力の母平均には違いがあり, 50C の方ときの方が大きい. n 8, n 7, x 59.6,

More information

Microsoft Word - apstattext04.docx

Microsoft Word - apstattext04.docx 4 章母集団と指定値との量的データの検定 4.1 検定手順今までは質的データの検定の方法を学んで来ましたが これからは量的データについてよく利用される方法を説明します 量的データでは データの分布が正規分布か否かで検定の方法が著しく異なります この章ではまずデータの分布の正規性を調べる方法を述べ 次にデータの平均値または中央値がある指定された値と違うかどうかの検定方法を説明します 以下の図 4.1.1

More information

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生 0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生まれ, コンピューテーショナルフォトグラフィ ( 計算フォトグラフィ ) と呼ばれている.3 次元画像認識技術の計算フォトグラフィへの応用として,

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 非線形カルマンフィルタ ~a. 問題設定 ~ 離散時間非線形状態空間表現 x k + 1 = f x k y k = h x k + bv k + w k f : ベクトル値をとるx k の非線形関数 h : スカラ値をとるx k の非線形関数 v k システム雑音 ( 平均値 0, 分散 σ v 2 k ) x k + 1 = f x k,v k w k 観測雑音 ( 平均値 0, 分散 σ w

More information

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発

当し 図 6. のように 2 分類 ( 疾患の有無 ) のデータを直線の代わりにシグモイド曲線 (S 字状曲線 ) で回帰する手法である ちなみに 直線で回帰する手法はコクラン アーミテージの傾向検定 疾患の確率 x : リスクファクター 図 6. ロジスティック曲線と回帰直線 疾患が発 6.. ロジスティック回帰分析 6. ロジスティック回帰分析の原理 ロジスティック回帰分析は判別分析を前向きデータ用にした手法 () ロジスティックモデル 疾患が発症するかどうかをリスクファクターから予想したいまたは疾患のリスクファクターを検討したい 判別分析は後ろ向きデータ用だから前向きデータ用にする必要がある ロジスティック回帰分析を適用ロジスティック回帰分析 ( ロジット回帰分析 ) は 判別分析をロジスティック曲線によって前向き研究から得られたデータ用にした手法

More information

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成

講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する fig. ヒストグラムの作成 fig. ヒストグラムの出力例 度数分布表の作成 データの度数を把握する 入力間違いが無いかの確認にも便利 fig. 度数分布表の作成 講義ノート p.1 前回の復習 尺度について数字には情報量に応じて 4 段階の種類がある名義尺度順序尺度 : 質的データ間隔尺度比例尺度 : 量的データ 尺度によって利用できる分析方法に差異がある SPSS での入力の練習と簡単な操作の説明 変数ビューで変数を設定 ( 型や尺度に注意 ) fig. 変数ビュー データビューでデータを入力 fig. データビュー 講義ノート p.2 データの視覚化ヒストグラムの作成直感的な把握のために重要入力間違いがないか確認するデータの分布を把握する

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 復習 ) 時系列のモデリング ~a. 離散時間モデル ~ y k + a 1 z 1 y k + + a na z n ay k = b 0 u k + b 1 z 1 u k + + b nb z n bu k y k = G z 1 u k = B(z 1 ) A(z 1 u k ) ARMA モデル A z 1 B z 1 = 1 + a 1 z 1 + + a na z n a = b 0

More information

untitled

untitled KLT はエネルギを集約する カルーネンレーベ変換 (KLT) で 情報を集約する 要点 分散 7. 9. 8.3 3.7 4.5 4.0 KLT 前 集約 分散 0.3 0.4 4.5 7.4 3.4 00.7 KLT 後 分散 = エネルギ密度 エネルギ と表現 最大を 55, 最小を 0 に正規化して表示した 情報圧縮に応用できないか? エネルギ集約 データ圧縮 分散 ( 平均 ) KLT 前

More information

最小二乗法とロバスト推定

最小二乗法とロバスト推定 はじめに 最小二乗法とロバスト推定 (M 推定 ) Maplesoft / サイバネットシステム ( 株 ) 最小二乗法は データフィッティングをはじめとしてデータ解析ではもっともよく用いられる手法のひとつです Maple では CurveFitting パッケージの LeastSquares コマンドや Statistics パッケージの Fit コマンド NonlinearFit コマンドなどを用いてデータに適合する数式モデルを求めることが可能です

More information

目次 はじめに P.02 マクロの種類 ---

目次 はじめに P.02 マクロの種類 --- ステップワイズ法による重回帰分析の 予測マクロについて 2016/12/20 目次 はじめに ------------------------------------------------------------------------------------------------------------------------------ P.02 マクロの種類 -----------------------------------------------------------------------------------------------------------------------

More information

Microsoft Word - lec_student-chp3_1-representative

Microsoft Word - lec_student-chp3_1-representative 1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )

More information

カイ二乗フィット検定、パラメータの誤差

カイ二乗フィット検定、パラメータの誤差 統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,

More information

Microsoft PowerPoint - sc7.ppt [互換モード]

Microsoft PowerPoint - sc7.ppt [互換モード] / 社会調査論 本章の概要 本章では クロス集計表を用いた独立性の検定を中心に方法を学ぶ 1) 立命館大学経済学部 寺脇 拓 2 11 1.1 比率の推定 ベルヌーイ分布 (Bernoulli distribution) 浄水器の所有率を推定したいとする 浄水器の所有の有無を表す変数をxで表し 浄水器をもっている を 1 浄水器をもっていない を 0 で表す 母集団の浄水器を持っている人の割合をpで表すとすると

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定

More information

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション

314 図 10.1 分析ツールの起動 図 10.2 データ分析ウィンドウ [ データ ] タブに [ 分析 ] がないときは 以下の手順で表示させる 1. Office ボタン をクリックし Excel のオプション をクリックする ( 図 10.3) 図 10.3 Excel のオプション 313 第 10 章 Excel を用いた統計処理 10.1 Excel の統計処理レポートや卒業研究などでは 大量のデータを処理 分析し 報告しなければならない場面が数多く登場する このような場合 手計算では多くの時間を要するため現在では計算機を用いて一括処理することが一般的である これにより 時間短縮だけでなく手軽に詳細な分析を行うことができる Excel ではこのような大量のデータに対する分析を容易に行えるよう

More information

Microsoft Word - 保健医療統計学112817完成版.docx

Microsoft Word - 保健医療統計学112817完成版.docx 講義で使用するので テキスト ( 地域診断のすすめ方 ) を必ず持参すること 5 4 統計処理のすすめ方 ( テキスト P. 134 136) 1. 6つのステップ 分布を知る ( 度数分布表 ヒストグラム ) 基礎統計量を求める Ø 代表値 Ø バラツキ : 範囲 ( 最大値 最小値 四分位偏位 ) 分散 標準偏差 標準誤差 集計する ( 単純集計 クロス集計 ) 母集団の情報を推定する ( 母平均

More information

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に

IBM Software Business Analytics IBM SPSS Missing Values IBM SPSS Missing Values 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に 空白を埋める際の適切なモデルを構築 ハイライト データをさまざまな角度から容易に検証する 欠損データの問題を素早く診断する 欠損値を推定値に置き換える 欠損データ タイプおよび極値を表示する 隠れたバイアスを除去する アンケート調査や市場調査 社会科学 データ マイニングなどの多くの専門家が 調査データの検証に を使用しています 欠損データを無視したり 除外したりすると 偏った無意味な結果につながる危険性があります

More information

多次元レーザー分光で探る凝縮分子系の超高速動力学

多次元レーザー分光で探る凝縮分子系の超高速動力学 波動方程式と量子力学 谷村吉隆 京都大学理学研究科化学専攻 http:theochem.kuchem.kyoto-u.ac.jp TA: 岩元佑樹 iwamoto.y@kuchem.kyoto-u.ac.jp ベクトルと行列の作法 A 列ベクトル c = c c 行ベクトル A = [ c c c ] 転置ベクトル T A = [ c c c ] AA 内積 c AA = [ c c c ] c =

More information

ベイズ統計入門

ベイズ統計入門 ベイズ統計入門 条件付確率 事象 F が起こったことが既知であるという条件の下で E が起こる確率を条件付確率 (codtoal probablt) という P ( E F ) P ( E F ) P( F ) 定義式を変形すると 確率の乗法公式となる ( E F ) P( F ) P( E F ) P( E) P( F E) P 事象の独立 ある事象の生起する確率が 他のある事象が生起するかどうかによって変化しないとき

More information

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5

Dependent Variable: LOG(GDP00/(E*HOUR)) Date: 02/27/06 Time: 16:39 Sample (adjusted): 1994Q1 2005Q3 Included observations: 47 after adjustments C -1.5 第 4 章 この章では 最小二乗法をベースにして 推計上のさまざまなテクニックを検討する 変数のバリエーション 係数の制約係数にあらかじめ制約がある場合がある たとえばマクロの生産関数は 次のように表すことができる 生産要素は資本と労働である 稼動資本は資本ストックに稼働率をかけることで計算でき 労働投入量は 就業者数に総労働時間をかけることで計算できる 制約を掛けずに 推計すると次の結果が得られる

More information

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69

<4D F736F F F696E74202D2091E6824F82538FCD8CEB82E88C9F8F6F814592F990B382CC8CB4979D82BB82CC82505F D E95848D8682CC90B69 第 章 誤り検出 訂正の原理 その ブロック符号とその復号 安達文幸 目次 誤り訂正符号化を用いる伝送系誤り検出符号誤り検出 訂正符号 7, ハミング符号, ハミング符号生成行列, パリティ検査行列の一般形符号の生成行列符号の生成行列とパリティ検査行列の関係符号の訂正能力符号多項式 安達 : コミュニケーション符号理論 安達 : コミュニケーション符号理論 誤り訂正符号化を用いる伝送系 伝送システム

More information

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による

発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 <R による演習 1> 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 <R による R で学ぶ 単回帰分析と重回帰分析 M2 新屋裕太 2013/05/29 発表の流れ 1. 回帰分析とは? 2. 単回帰分析単回帰分析とは? / 単回帰式の算出 / 単回帰式の予測精度 3. 重回帰分析重回帰分析とは? / 重回帰式の算出 / 重回帰式の予測精度 質的変数を含む場合の回帰分析 / 多重共線性の問題 変数選択の基準と方法 回帰分析とは?

More information

EBNと疫学

EBNと疫学 推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定

More information

Microsoft PowerPoint ppt

Microsoft PowerPoint ppt 情報科学第 07 回データ解析と統計代表値 平均 分散 度数分布表 1 本日の内容 データ解析とは 統計の基礎的な値 平均と分散 度数分布表とヒストグラム 講義のページ 第 7 回のその他の欄に 本日使用する教材があります 171025.xls というファイルがありますので ダウンロードして デスクトップに保存してください 2/45 はじめに データ解析とは この世の中には多くのデータが溢れています

More information

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ

タイトルを修正 軸ラベルを挿入グラフツール デザイン グラフ要素を追加 軸ラベル 第 1 横 ( 縦 ) 軸 凡例は削除 横軸は, 軸の目盛範囲の最小値 最 大値を手動で設定して調整 図 2 散布図の仕上げ見本 相関係数の計算 散布図を見ると, 因果関係はともかく, 人口と輸送量の間には相関関係があ Excel を使った相関係数の計算 回帰分析 準備データは授業のホームページ上に Excel ブックの状態 ( ファイル名 pop_traffic.xlsx) で用意してあるので, これをダウンロードして保存しておく ダウンロードされたファイルを開いたら,DATA シート中の空欄 (POP,TK の列 ) をそれぞれの合計値 (POP の場合は,POP1~POP3) で埋めるように,SUM 関数あるいは和の式を使って処理しておく

More information

航空機の運動方程式

航空機の運動方程式 可制御性 可観測性. 可制御性システムの状態を, 適切な操作によって, 有限時間内に, 任意の状態から別の任意の状態に移動させることができるか否かという特性を可制御性という. 可制御性を有するシステムに対し, システムは可制御である, 可制御なシステム という言い方をする. 状態方程式, 出力方程式が以下で表されるn 次元 m 入力 r 出力線形時不変システム x Ax u y x Du () に対し,

More information

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード]

Microsoft PowerPoint - S11_1 2010Econometrics [互換モード] S11_1 計量経済学 一般化古典的回帰モデル -3 1 図 7-3 不均一分散の検定と想定の誤り 想定の誤りと不均一分散均一分散を棄却 3つの可能性 1. 不均一分散がある. 不均一分散はないがモデルの想定に誤り 3. 両者が同時に起きている 想定に誤り不均一分散を 検出 したら散布図に戻り関数形の想定や説明変数の選択を再検討 残差 残差 Y 真の関係 e e 線形回帰 X X 1 実行可能な一般化最小二乗法

More information

横浜市環境科学研究所

横浜市環境科学研究所 周期時系列の統計解析 単回帰分析 io 8 年 3 日 周期時系列に季節調整を行わないで単回帰分析を適用すると, 回帰係数には周期成分の影響が加わる. ここでは, 周期時系列をコサイン関数モデルで近似し単回帰分析によりモデルの回帰係数を求め, 周期成分の影響を検討した. また, その結果を気温時系列に当てはめ, 課題等について考察した. 気温時系列とコサイン関数モデル第 報の結果を利用するので, その一部を再掲する.

More information

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好 . 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :

More information

JUSE-StatWorks/V5 活用ガイドブック

JUSE-StatWorks/V5 活用ガイドブック 4.6 薄膜金属材料の表面加工 ( 直積法 ) 直積法では, 内側に直交配列表または要因配置計画の M 個の実験, 外側に直交配列表または要因配置計画の N 個の実験をわりつけ, その組み合わせの M N のデータを解析します. 直積法を用いることにより, 内側計画の各列と全ての外側因子との交互作用を求めることができます. よって, 環境条件や使用条件のように制御が難しい ( 水準を指定できない )

More information

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかというお問い合わせがよくあります そこで本文書では これらについて の回答を 例題を用いて説明します 1.

More information

Excelにおける回帰分析(最小二乗法)の手順と出力

Excelにおける回帰分析(最小二乗法)の手順と出力 Microsoft Excel Excel 1 1 x y x y y = a + bx a b a x 1 3 x 0 1 30 31 y b log x α x α x β 4 version.01 008 3 30 Website:http://keijisaito.info, E-mail:master@keijisaito.info 1 Excel Excel.1 Excel Excel

More information

経済統計分析1 イントロダクション

経済統計分析1 イントロダクション 1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,

More information

Microsoft Word - eviews6_

Microsoft Word - eviews6_ 6 章 : 共和分と誤差修正モデル 2017/11/22 新谷元嗣 藪友良 石原卓弥 教科書 6 章 5 節のデータを用いて エングル = グレンジャーの方法 誤差修正モデル ヨハンセンの方法を学んでいこう 1. データの読み込みと単位根検定 COINT6.XLS のデータを Workfile に読み込む このファイルは教科書の表 6.1 の式から 生成された人工的なデータである ( 下表参照 )

More information

Microsoft Word - Stattext12.doc

Microsoft Word - Stattext12.doc 章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ

More information

第1回

第1回 やすだ社会学研究法 a( 2016 年度春学期担当 : 保田 ) 基礎分析 ( 1): 一変量 / 二変量の分析 SPSSの基礎 テキスト pp.1-29 pp.255-257 データの入力 [ データビュー ] で Excelのように直接入力できる [ 変数ビュー ] で変数の情報を入力できる 名前 変数の形式的なアルファベット名例 )q12 ラベル 変数の内容を表現例 ) 婚姻状態値 各値の定義例

More information

回帰分析 重回帰(1)

回帰分析 重回帰(1) 回帰分析 重回帰 (1) 項目 重回帰モデルの前提 最小二乗推定量の性質 仮説検定 ( 単一の制約 ) 決定係数 Eviews での回帰分析の実際 非線形効果 ダミー変数 定数項ダミー 傾きのダミー 3 つ以上のカテゴリー 重回帰モデル multiple regression model 説明変数が 個以上 y 1 x 1 x k x k u i y x i 他の説明変数を一定に保っておいて,x i

More information

Microsoft Word - appendix_b

Microsoft Word - appendix_b 付録 B エクセルの使い方 藪友良 (2019/04/05) 統計学を勉強しても やはり実際に自分で使ってみないと理解は十分ではあ りません ここでは 実際に統計分析を使う方法のひとつとして Microsoft Office のエクセルの使い方を解説します B.1 分析ツールエクセルについている分析ツールという機能を使えば さまざまな統計分析が可能です まず この機能を使えるように設定をします もし

More information

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推

7. フィリップス曲線 経済統計分析 (2014 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推 7. フィリップス曲線 経済統計分析 ( 年度秋学期 ) フィリップス曲線の推定 ( 経済理論との関連 ) フィリップス曲線とは何か? 物価と失業の関係 トレード オフ 政策運営 ( 財政 金融政策 ) への含意 ( 計量分析の手法 ) 関数形の選択 ( 関係が直線的でない場合の推定 ) 推定結果に基づく予測シミュレーション 物価と失業の関係......... -. -. -........ 失業率

More information

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. (

切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 統計学ダミー変数による分析 担当 : 長倉大輔 ( ながくらだいすけ ) 1 切片 ( 定数項 ) ダミー 以下の単回帰モデルを考えよう これは賃金と就業年数の関係を分析している : ( 賃金関数 ) ここで Y i = α + β X i + u i, i =1,, n, u i ~ i.i.d. N(0, σ 2 ) Y i : 賃金の対数値, X i : 就業年数. ( 実際は賃金を就業年数だけで説明するのは現実的はない

More information

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074>

<4D F736F F F696E74202D20352D335F8D5C90AC CF909482CC90B690AC82C695D28F572E707074> RD_301 構成要素一覧と検索 から構成要素の編集辞書 ( 削除 ) を作る 作成 ( 編集 ) する削除辞書を開きます 構成要素を検索します ドラック & ドロップでも OK 範囲を選択して右クリック 右クリック 削除辞書に登録 ( 追加 ) したい構成要素を選択しコピーします 削除辞書に追加 ( 貼りつけ ) ます Step5. 削除辞書に構成要素が登録 ( 追加 ) されます 構成要素一覧と検索

More information

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の

分析のステップ Step 1: Y( 目的変数 ) に対する値の順序を確認 Step 2: モデルのあてはめ を実行 適切なモデルの指定 Step 3: オプションを指定し オッズ比とその信頼区間を表示 以下 このステップに沿って JMP の操作をご説明します Step 1: Y( 目的変数 ) の JMP によるオッズ比 リスク比 ( ハザード比 ) の算出と注意点 SAS Institute Japan 株式会社 JMP ジャパン事業部 2011 年 10 月改定 1. はじめに 本文書は JMP でロジスティック回帰モデルによるオッズ比 比例ハザードモデルによるリスク比 それぞれに対する信頼区間を求める操作方法と注意点を述べたものです 本文書は JMP 7 以降のバージョンに対応しております

More information

航空機の運動方程式

航空機の運動方程式 オブザーバ 状態フィードバックにはすべての状態変数の値が必要であった. しかしながら, システムの外部から観測できるのは出力だけであり, すべての状態変数が観測できるとは限らない. そこで, 制御対象システムの状態変数を, システムのモデルに基づいてその入出力信号から推定する方法を考える.. オブザーバとは 次元 m 入力 r 出力線形時不変システム x Ax Bu y Cx () の状態変数ベクトル

More information

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan

計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN , Ryuichi Tanaka, Printed in Japan 計量経済学の第一歩 田中隆一 ( 著 ) gretl で例題と実証分析問題を 再現する方法 発行所株式会社有斐閣 2015 年 12 月 20 日初版第 1 刷発行 ISBN 978-4-641-15028-7, Printed in Japan 第 5 章単回帰分析 本文例例 5. 1: 学歴と年収の関係 まず 5_income.csv を読み込み, メニューの モデル (M) 最小 2 乗法 (O)

More information

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1>

<4D F736F F D E4F8E9F82C982A882AF82E98D7397F1> 3 三次における行列 要旨高校では ほとんど 2 2 の正方行列しか扱ってなく 三次の正方行列について考えてみたかったため 数 C で学んだ定理を三次の正方行列に応用して 自分たちで仮説を立てて求めていったら 空間における回転移動を表す行列 三次のケーリー ハミルトンの定理 三次における逆行列を求めたり 仮説をたてることができた. 目的 数 C で学んだ定理を三次の正方行列に応用する 2. 概要目的の到達点として

More information

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション 学位論文作成のための疫学 統計解析の実際 徳島大学大学院 医歯薬学研究部 社会医学系 予防医学分野 有澤孝吉 (e-mail: karisawa@tokushima-u.ac.jp) 本日の講義の内容 (SPSS を用いて ) 記述統計 ( データのまとめ方 ) 代表値 ばらつき正規確率プロット 正規性の検定標準偏差 不偏標準偏差 標準誤差の区別中心極限定理母平均の区間推定 ( 母集団の標準偏差が既知の場合

More information

Microsoft PowerPoint - stat-2014-[9] pptx

Microsoft PowerPoint - stat-2014-[9] pptx 統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: kkarato@eco.u-toyama.ac.j website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を

More information

Rの基本操作

Rの基本操作 Microsoft Azure 高校生のための Azure Machine Learning By M. Takezawa 機械学習 (Machine Learning) とは 機械学習とは 機械にデータを学習させ データに潜むパターンや特性を発見し予測させることです Microsoft Azure Machine Learning とは Microsoft 社が提供する Azure の機能の一つであり

More information

日心TWS

日心TWS 2017.09.22 (15:40~17:10) 日本心理学会第 81 回大会 TWS ベイジアンデータ解析入門 回帰分析を例に ベイジアンデータ解析 を体験してみる 広島大学大学院教育学研究科平川真 ベイジアン分析のステップ (p.24) 1) データの特定 2) モデルの定義 ( 解釈可能な ) モデルの作成 3) パラメタの事前分布の設定 4) ベイズ推論を用いて パラメタの値に確信度を再配分ベイズ推定

More information

情報工学概論

情報工学概論 確率と統計 中山クラス 第 11 週 0 本日の内容 第 3 回レポート解説 第 5 章 5.6 独立性の検定 ( カイ二乗検定 ) 5.7 サンプルサイズの検定結果への影響練習問題 (4),(5) 第 4 回レポート課題の説明 1 演習問題 ( 前回 ) の解説 勉強時間と定期試験の得点の関係を無相関検定により調べる. データ入力 > aa

More information

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード] R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ

More information

Microsoft Word - SDA2012kadai07.doc

Microsoft Word - SDA2012kadai07.doc 都市データ分析第 7 回課題書 年 5 月 3 日重回帰モデルによる地価推定担当鈴木勉 システム情報系 TA 高森賢司 システム情報工学研究科 茨城県の公示地価を重回帰モデルによって説明し 地価に影響を及ぼすと考えられる要因との関係を定量的に記述する.. 重回帰分析重回帰分析では一つの従属変数 被説明変数 を 複数の独立変数 説明変数 で説明することを考える. これによって どの独立変数が どの程度従属変数に影響を与えているかを知ることができる...

More information

様々なミクロ計量モデル†

様々なミクロ計量モデル† 担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル

More information

Microsoft PowerPoint - 10.pptx

Microsoft PowerPoint - 10.pptx m u. 固有値とその応用 8/7/( 水 ). 固有値とその応用 固有値と固有ベクトル 行列による写像から固有ベクトルへ m m 行列 によって線形写像 f : R R が表せることを見てきた ここでは 次元平面の行列による写像を調べる とし 写像 f : を考える R R まず 単位ベクトルの像 u y y f : R R u u, u この事から 線形写像の性質を用いると 次の格子上の点全ての写像先が求まる

More information

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田

消費 統計学基礎実習資料 2017/11/27 < 回帰分析 > 1. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 19 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 手順 1 検索エンジンで 河田研究室 と入力し検索すると 河田 消費 統計学基礎実習資料 07//7 < 回帰分析 >. 準備 今回の実習では あらかじめ河田が作成した所得と消費のファイルを用いる 課題 9 統計学基礎の講義用 HP から 所得と消費のファイルをダウンロードしてみよう 検索エンジンで 河田研究室 と入力し検索すると 河田研究室 のページにジャンプする ( ここまでの手順は http://www.tokuyama-u.ac.jp/kawada とアドレスを直接入力してもよい

More information