Microsoft PowerPoint - Ⅱ(リスク計量化入門).ppt
|
|
|
- ふじよし たけはな
- 9 years ago
- Views:
Transcription
1 Ⅱ. 統計 確率の基礎知識 リスク計量化の前提となる統計 確率の基礎知識について整理 復習します 図解中心の説明ですので 統計 確率は苦手だと感じている方も理解度アップに繋がります 1
2 目 次 1. 基本統計量 (1 変量 ) 2. 基本統計量 (2 変量 ) 3. 確率変数と確率分布 4. 推定と検定 2
3 1. 基本統計量 (1 変量 ) (1) 平均 (2) 分散 (3) 標準偏差 (4) パーセント点 3
4 講義の中では 以下の観測データを使います ( 例 ) 東証 TOPIX 日次変化率 250 個 東証 TOPIX 10 日間変化率 250 東証指個 日次変化 10 日変化 200X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/
5 12 東証 TOPIX 日次変化率の推移 東証 TOPIX10 日間変化率の推移
6 基本統計 Excel 関数 日次変化率 10 日間変化率 データ COUNT 平 AVERAGE 分 VARA 標準偏 STDEVA ( 設問 ) グラフと基本統計量をみて どんなことに気付きましたか? ( ヒント ) 気付いて欲しいことは4つあります 答えは 講義の中で 6
7 (1) 平均 平均は 観測データセットの 中心の位置 を示す指標の 1 つ X = データの和 データの数 = X 1 +X 2 + +X N N Excel では 関数 AVERAGE( データ範囲 ) を使って求める 7
8 (2 ⅰ) 分散 ( 記述統計の立場で定義 ) 分散は 観測データセットの バラツキ を示す指標の 1 つ - データの 偏差平方和 ( 平均との差を2 乗して合計 ) を求めて データの数 で割る - 分散の 単位 は データの持つ 単位 の2 乗 Vp=σ 2 = = データの偏差平方和データの (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N Excel では 関数 VARP( データ範囲 ) を使って求める 8
9 記述統計 : 中学 高校で学習する平均と分散 ( 例 ) 観測データ 平均 : 中心の位 偏差 ( 平均との差 ) 合計するとゼロ 偏差平方 (-2) 2 (-1) 合計すると 偏差平方和 10 観測データがバラつく ( 平均から離れる ) と偏差平方和は増える しかし 観測データ数が増えても偏差平方和は増えてしまう 分散 偏差平方和 10 観測データ数 5 9
10 ( 参考 ) 記述統計の考え方 観測データを母集団全体と考えて 統計量の算定を行い 観測データが持つ特性を分析 記述する ( 例 ) ある特定の集団 (N 人 ) の身長の平均と分散を計算する 平均 X 分散 Vp = = X 1 +X 2 + +X N N (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N 10
11 母集団 = 標本の特性値を調べる 平均 μ 分散 V 標準偏差 σ VaR など. 計測可 母集団 = 標本 11
12 (2 ⅱ) 分散 ( 推測統計の立場で定義 ) 分散は 観測データセットの バラツキ を示す指標の1つ - データの 偏差平方和 ( 平均との差を2 乗して合計 ) を求めて データの数-1 で割る - 分散の 単位 は データの持つ 単位 の2 乗 Va=σ 2 = = データの偏差平方和データ数 -1 (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N-1 Excel では 関数 VARA( データ範囲 ) を使って求める 12
13 ( 参考 ) 推測統計の考え方 観測データを 母集団から抽出した標本 ( サンプル ) と考えて 統計量の算定を行い 母集団の特性を推測 し 検証する ( 例 ) 任意に抽出した N 人 ( 標本 ) の身長を計測して 日本人全体 ( 母集団 ) の身長の平均と分散を推定する 平均 X = 分散 ( 不偏標本分散 ) X 1 +X 2 + +X N N Va = (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N-1 13
14 母集団 母集団の特性値 ( 真の値 ) は分からない 平均 μ 分散 V 標準偏差 σ VaR など. 推定 標本 標本の特性値平均 μ * 分散 V * 標準偏差 σ * VaR * など 14
15 N-1 で割った 標本分散 の特徴 母集団の 真の分散 を 統計的手法で 推定 するときに N-1で割った 標本分散 を使うのは 以下のような特徴があるため ( 一致性 ) 標本分散 は Nが大きくなると 母集団の 真の分散 に限りなく近づく ( 不偏性 ) 標本分散 は 母集団の 真の分散 の偏りのない推定値となることが知られている 15
16 標本分散 (V * ) を 標本を変えて繰り返し計算すると 真の分散を中心にして偏りなく分布する ( 不偏性 ) 標本分散 V * (1) 標本分散 V * (7) 標本分散 V * (3) 標本分散 V * (5) 母集団の真の分散 V ( 誰も知らない ) 標本分散 V * (4) 標本分散 V * (6) 標本分散 V * (2) 16
17 講義の中で VaR を計測する際に使う 分散 標準偏差は 推測統計の立場 から定義したもの (N-1 で割ったもの ) です 17
18 (3) 標準偏差 ( 推測統計の立場で記載 ) 標準偏差は 観測データセットの バラツキ を示す指標の 1 つ 分散の平方根 ( ルート ) をとって定義する - 標準偏差の 単位 は データの持つ 単位 と同じ σ = データの偏差平方和 データ数 -1 (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 = N-1 Excel では 関数 STDEVA( データ範囲 ) を使って求める 18
19 平均 サンプル 標準偏差 標準偏差 サンプル 標準偏差 標準偏差
20 東証 TOPIX 日次変化率の推移 日次変化率標準偏差 - 標準偏差 東証 TOPIX10 日間変化率の推移 日間変化率 標準偏差 - 標準偏差
21 基本統計 Excel 関 日次変化 10 日変化 データ COUN 平 AVERAG 分 VAR 標準偏 STDEV 平均をみると 日次変化率 10 日間変化率とも概ねゼロとなっている 分散をみると 10 日間変化率の分散は 日次変化率の分散の概ね10 倍となっている 標準偏差をみると 10 日間変化率の標準偏差は 日次変化率の標準偏差の概ね 10 倍 (=3.162 倍 ) となっている 21
22 株価 金利 為替等の変化率に関して 1 その平均をゼロと仮定したり 2 T 日間変化率の標準偏差は 日次変化率の標準偏差の T 倍と仮定して市場 VaRを計測することがある 22
23 (4) パーセント点 パーセント点とは 観測データを小さい順に並べたときに その値よりも小さな値の割合が指定された割合 ( 百分率 ) になるデータの値として定義される 例えば 99 パーセント点というのは その値より小さなデータの割合が 99% となるデータの値のことを指す - 50 パーセント点のことを中央値 ( メジアン ) と呼ぶ - 25 パーセント点を第 1 四分位点 75 パーセント点 を第 3 四分位点と呼ぶ Excelでは 関数 PERCENTILE( データ範囲, 率 ) を使って求める 23
24 ( 例 ) 1000 個の損失データが観測されている場合 99% 点というのは 損失額を小さい順に並べて 990 番目になるデータ値のこと 順位 百分位 損失額 985 番目 98.5% 番目 98.6% 番目 98.7% 番目 98.8% 番目 98.9% 番目 99.0% 番目 99.1% 番目 99.2% 番目 99.3% 番目 99.4% 番目 99.5% 番目 99.6% 番目 99.7% 番目 99.8% 番目 99.9% 番目 100.0% % 24
25 99%VaR は 文字通り 99 パーセント点 のことです 99% 小 大 99 パーセント点 損失額 25
26 2. 基本統計量 (2 変量 ) (1) 散布図 (2) 共分散 (3) 相関係数 (4) 相関行列 26
27 以下のような 2 変量の関係を調べるためには 散布図を書くのが直感的に理解しやすい 東証 TOPIX 10 年割引国債 10 日間変化率 10 日間変化率 (X) (Y) 200X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ X/9/ (1) 散布図 27
28 株価変化率と国債価格変化率との関係 Ⅱ Ⅳ のエリアに分布が多い 株価変化率がプラス ( マイナス ) のとき 国債価格変化率はマイナス ( プラス ) となる傾向がある Ⅱ Ⅰ 国債 10 日間変化率 Ⅲ 東証 TOPIX 10 日間変化率 Ⅳ 28
29 (2) 共分散 ( 推測統計の立場で記載 ) 共分散は 2 つの変量 (X Y) の間の 直線的な比例 関係の強さ を示す指標 - データの 偏差積和 を求めて データ数 -1 で割る - 共分散の 単位 は Xの持つ 単位 掛ける Yの持つ 単位 データの偏差積和 COV(X Y) = = データ数 -1 (X 1 -X)(Y 1 -Y)+(X 2 -X)(Y 2 -Y)+ +(X N -X)(Y N -Y) N-1 Excel では 関数 COVAR( データ範囲 (X) データ範囲 (Y)) を使って求める ( 注 )Excel では データの偏差積和を N-1 ではなく N で割って共分散を定義して いる ( 記述統計の立場で定義している ) ため 別途 調整を行う必要がある 29
30 偏差積和 = (X 1 -X)(Y 1 -Y)+ (X 2 -X)(Y 2 -Y)+ +(X N -X)(Y N -Y) Ⅰ Ⅲ のエリアに多く分布 偏差積和 > 0 : 正の相関 Ⅱ Ⅳ のエリアに多く分布 偏差積和 < 0 : 負の相関 (X i -X)(Y i -Y)<0 Ⅱ Ⅰ (X i -X)(Y i -Y)>0 Y Y i X i (X i -X)(Y i -Y)>0 Ⅲ Ⅳ (X i -X)(Y i -Y)<0 X 30
31 (3) 相関係数 相関係数は 2 つの変量 (X Y) 間の 直線的な比例関係の強さ を示す指標 共分散を 2 つの標準偏差の積で割って定義する - 相関係数は-1~+1までの値をとる 単位 を持たない無名数 - 相関係数の定義には データ数 Nが含まれていない ( 定義は1 通りの み ) COV(X Y) ρ(x Y) = σ(x) σ(y) = (X 1 -X)(Y 1 -Y)+ +(X N -X)(Y N -Y) (X 1 -X) 2 + +(X N -X) 2 (Y 1 -Y) 2 + +(Y N -Y) 2 Excelでは 関数 CORELL( データ範囲 (X) データ範囲 31 (Y)) を使って求める
32 相関係数と散布図 ρ=1.0 ( 正の完全相関 ) ρ=-1.0 ( 負の完全相関 ) ρ= ρ= 相関係数の定義 ρxy= COV(X,Y)/σxσy COV(X,Y) : X,Y の共分散 =(1/N-1)*Σ(Xt-EX)(Yt-EY) σx : Xの標準偏差 EX : Xの平均値 σy : Yの標準偏差 EY : Yの平均値 ρ=0 ( 無相関 ) 32
33 (4) 相関行列と分散共分散行列 太枠内が相関行列 X 3 ρ(x 3 X 1 ) ρ(x 3 X 2 ) 1 ρ(x 1 X 2 ) X 2 X 3 X N X 1 X 1 1 ρ(x 1 X 2 ) ρ(x 1 X 3 ) ρ(x 1 X N ) X 2 ρ(x 2 X 1 ) 1 ρ(x 2 X 3 ) ρ(x 2 X N ) X N ρ(x N X 1 ) ρ(x N X 2 ) ρ(x N X 3 ) ρ(xi Xi)=1: 同じ変量 (Xii ) 同士の相関は 1 1 ρ(x i X j )=ρ(x j X i ) : 2つの変量 (X i X j ) の順序を変えて計算しても相関係数の値は同じ 33
34 太枠内が分散共分散行列 X 2 X 3 X N X 1 V X1 COV(X 1 X 2 ) COV(X 1 X 3 ) COV(X 1 X N ) X 2 COV(X 2 X 1 ) V X2 COV(X 2 X 3 ) COV(X 2 X N ) X 3 X 1 COV(X 3 X 1 ) COV(X 3 X 2 ) V X3 COV(X 1 X 2 ) X N COV(X N X 1 ) COV(X N X 2 ) COV(X N X 3 ) V XN 34
35 VaRの計測手法として 分散共分散法の説明をします VaRの計測において 分散共分散行列 相関行列が重要な働きをします 35
36 Ⅲ.VaR の計測と検証より 分散共分散法 ( デルタ法 ) による計算例 2 - リスクファクターが 2 つのケース VaRの計算シート 分散共分散法 ( デルタ法 ) ポートフォリオ 株式投信 100 億円 単独 VaR 標準偏差 信頼係数 感応度 10 年割引国債 100 億円 株式投信 9.00 = 割引国債 保有期間 10 日 信頼水準 % ポートVaR 単純合算 観測データ 250 日 相関考慮後 >2: ポートフォリオ効果 東証 TOPIX 10 年割引国債 投信 VaR 国債 VaR 相関行列 10 日間変化率 10 日間変化率 投信 VaR 2006/9/ 国債 VaR 2006/9/ /9/ 行列計算式 2006/9/ /9/ /9/ 行列計算式 2006/9/ VaR 2 : /9/ VaR : /9/ /9/ 投信感応度国債感応度 分散共分散行列 2006/9/ 投信感応度 2006/9/ 国債感応度 2006/9/ /9/ 行列計算式 2006/9/ /9/ /9/ 行列計算式 2006/9/ ポート分散 : ( 単位調整 ) 2006/9/ ポート標準偏差 : /9/ 信頼係数 /8/ ポートVaR
37 3. 確率変数と確率分布 (1) 確率変数 (2) 確率分布 - 確率密度関数 分布関数 (3) 様々な確率分布 - 一様分布 正規分布 対数正規分布ポワソン分布 2 項分布 (4) 確率変数の独立 37
38 (1) 確率変数 予め定まった確率にしたがって値が変動する数のことを 確率変数 という ( 例 ) サイコロを振ったときに出る目の数 離散的な確率変数 サイコロの目 (X) 確 率 1/6 1/6 1/6 1/6 1/6 1/6 確率 1/ X 38
39 株価 金利 為替等の変化率を 確率変数 として捉えることも可能 連続的な確率変数 確率 下落 (-) X X X X X 3 X 2 X 0 ( 現在値 ) X 1 上昇 (+) X 39
40 その他の確率変数 VaRを250 回計測して VaRを超える損失が発生する回数 事件 事故発生に伴う損失の発生額 (1 回当たり ) 事件 事故の年間発生件数 個別企業の信用状態 40
41 (2) 確率分布 確率分布を表わすとき 2 種類の関数がある 1 確率密度関数確率変数 (X) が ある値 をとる確率 ( 確率密度 ) を表わす関数 2 分布関数 ( 累積確率密度関数 ) 確率変数 (X) が ある値以下 になる確率を表わす関数 41
42 ( 例 ) 数直線上で 0 から 1 までの値をランダムにとる確率変数 (X) を考える X は 0~1 の間で無限の値をとる可能性がある X が 0.7 の値をとる確率はゼロ X が 0.7 以下の値をとる確率は 0.7( 斜線部の面積 ) 確率密度関数 f(x 0 )= 1 f(x) 分布関数 確率は面積で捉える 1 F(X) 0.7 面積 F(X 0 )= ( 確率密度 ) 0 X 0 =0.7 1 X 0 X 0 = X X が 0.7 の値をとる 確率密度 は 1 42
43 ( 参考 ) 人口と人口密度 f(x) : 人口密度 ( 万人 /km 2 ) F(X): 人口 ( 万人 ) 人口は面積で表される X : 各地域の広さ (km 2 ) X : 各地域の広さ (km 2 ) 43
44 より一般的に概念図で示すと 確率密度関数 f(x) 斜線部の面積 積分 100% 縦軸上の点 分布関数 F(X) P% P% X X 0 となる確率 X=X 0 となる確率 ( 確率密度 ) 0% X 0 X X X 0 44
45 (3) 様々な確率分布 一様分布 : ある区間の中の値が同じ確率で生起する分布 f(x) 確率密度関数 F(X) 分布関数 1/(b-a) X a b X 一様分布にしたがう乱数 ( 一様乱数 ) は Excel 関数 RAND() を使って生成することができる 45
46 正規分布 : 左右対称の釣鐘型をした確率分布 平均 (μ) 標準偏差(σ) を与えると分布の形状が決まる N(μ,σ 2 ) と表す EXCEL 関数 NORMDIST(X,μ,σ, 関数形式 ) f(x) 確率密度関数 F(X) 分布関数 1 σ= σ=0.5 σ=1 σ= σ=2 σ=1 平均 (μ)=0 標準偏差(σ)=1の正規分布を標準正規分布と言い N(0,1) と表す 46 0 μ X μ X
47 確率変数 X が標準正規分布にしたがうとき確率変数 σx+μ は正規分布にしたがう f(x) 確率密度関数 X ~ N(0,1) σx ~ N(0, σ 2 ) σx+μ ~ N(μ, σ 2 ) 0 μ X 47
48 確率変数 X が正規分布にしたがうとき確率変数 Δ X+ 定数項は正規分布にしたがう f(x) 確率密度関数 X ~ N(μ, σ 2 ) 標準偏差が Δ 倍になる Δ X + 定数項 ~ N(Δ μ+ 定数項, (Δσ) 2 ) μ Δ μ+ 定数項 X 平均値が移動する 48
49 正規分布の特徴 平均からどれだけ離れているか ( 標準偏差の何倍か ) という情報から X 以下の値をとる確率が分かる 例えば X が N(0,σ 2 ) の正規分布にしたがって生起するとき X σとなる確率は 84.1% X 2σとなる確率は 97.7% X 2.33σとなる確率は 99.0% X 3σとなる確率は 99.9% となることが知られている 99% σ 2σ 99% 点 X このとき σ の前に付いている係数を 信頼係数 という 2.33σ 正規分布は Xが 信頼係数 σ 以下となる確率が分かる便利な確率分布の1つ 49
50 株価 金利 為替等の変化率は 正規分布にしたがうと想定されることが多い - しかし 実際の分布をみると 正規分布と比較して 歪み 偏りやファット テール ( 注 ) 東証 TOPIX 日次変化率の分布 が観察されることも少なくない ( 注 ) 裾野部分の分布が厚くなることをいう ファット テール 実分布正規分布 50
51 対数正規分布 : 左右非対象 片側に裾野が長いファットテールな分布 変数 X の対数値 (logx) が正規分布にしたがうとき 変数 X は対数正規分布にしたがう と言う logx の平均 (μ) logx の標準偏差 (σ) を与えると分布の形状が決まる EXCEL 関数 LOGNORMDIST(X,μ,σ) f(x) 確率密度関数 0.1 F(X) 分布関数 logx の平均 = 0 logx の標準偏差 = logx の平均 = 0 logx の標準偏差 = X 0 51 X
52 ポワソン分布 : 所与の領域 あるいは 所与の時間内において 0 回 1 回 2 回 3 回 と発生する事象が ちょうど K 回発生する確率を示す 平均発生回数 (λ 回 ) を与えると分布の形状が決まる EXCEL 関数 POISSON(K,λ, 関数形式 ) f(k) 確率密度関数 F(K) 分布関数 平均発生回数 λ=2 回 平均発生回数 λ=2 回 K 0 52 K
53 講義 (Ⅲ.) の中で 市場 VaR を計測 ( 分散共分散法 ) するとき正規分布を利用する例をあげます 信用 VaR を計測 ( モンテカルロ シミュレーション法 ) するとき 正規分布を利用する例をあげます オペリスク VaR を計測 ( モンテカルロ シミュレーション法 ) するとき 対数正規分布とポワソン分布を利用する例をあげます 実務的には フィットのよい別の確率分布を利用することもあります 53
54 2 項分布 : 結果が 2 通りある試行 ( 実験 ) を N 回繰り返したとき 片方の結果が起こる回数 (K) の確率分布 試行回数 (N 回 ) と 片方の結果が起きる確率 (p) を与えると分布の形状が決まる ( 例 ) サイコロを 10 回振って 1 の目が出る回数 (K) f(k) 確率密度関数 F(K) 分布関数 N=10,p=1/ N=10,p=1/ K K 1 の目が出る回数 1 の目が出る回数 54
55 ある事象が起きる確率は p N 回の試行のうち K 回はある事象が起きる ある事象が起きない確率は 1-p N 回の試行のうち N-K 回はある事象は起きない 2 項分布 (Excel 関数 ) BINOMDIST(K,N,p,false) = N C K p K (1-p) N-K N 回の試行の中からある事象が起きるK 回の試行を取り出す組み合わせ N C K = N (N-1) (N-K+1) K (K-1) 2 1 ( 例 ) サイコロを 10 回振ったときに 2 回 1 の目が出る確率 BINOMDIST(2,10,1/6,false) = 10 C 2 (1/6) 2 (5/6) 10-2 = (1/6)2 (5/6) 8 55
56 講義の中で VaR 計測モデルのバックテストを行なう とき 2 項分布を利用します 56
57 (4) 確率変数の独立 定義 確率変数 X 1 X 2 が互いに影響されず それぞれの確率分布にしたがって値をとるとき 確率変数 X 1 X 2 は 互いに 独立 であると いう 57
58 ( 例 ) サイコロを振ったときに出る目の数 1 回目 : X 1 = 1 2 回目 : X 2 = 1 3 回目 : X 3 =? サイコロの目 (X 3 ) 確 率 1/6 1/6 1/6 1/6 1/6 1/6 2 回続けて 1 の目が出ても 3 回目の結果には影響を 及ぼさない 3 回目は いずれの目が出る確率も 1/6 58
59 株価 金利 為替等の変化について互いに独立かつ同一の確率分布にしたがって変動している と考えられることが多い i.i.d. の想定 確率変数 X の推移と その確率分布 X Xs X X X 0? Xt X t 0 過去 現在 将来 59
60 独立の定義 確率変数 X t X s の確率関数に関して 以下の式が成り立つとき 確率変数 X t X s は互いに 独立 と言う P(X t =a X s =b) = P(X t =a)p( X s =b) i.i.d. の定義 確率変数 X t X s について 以下の 2 つの条件を満たすとき 確率変数 X t X s は互いに i.i.d. ( 注 ) であると言う ( 注 )independently and identically distributed 1 確率変数 X t X s は互いに独立である 2 確率変数 X t X s は同一の確率分布にしたがう 60
61 定理 確率変数 X 1 X 2 が互いに 独立 のとき 以下のことが成り立つ 1 確立変数 X 1 X 2 の期待値は それぞれの確率変数の期待値の積になる E(X 1 X 2 )=E(X 1 )E(X 2 ) 2 確率変数 X 1 +X 2 の分散は それぞれの確率変数の分散の和に等しい V(X 1 +X 2 )=V(X 1 )+V( X 2 ) 3 確率変数 X 1 と X 2 は無相関である ρ(x 1 X 2 )=0 ( 証明省略 ) 61
62 ルート T 倍ルール 日次ベースの対数変化率 or 変化幅を X 1 X 2 X 3 X T とすると T 日間の対数変化率 or 変化幅は X 1 +X 2 +X 3 + +X T と表される 各期のリスクファクター (X 1,X 2,X 3, X T ) が 互いに独立かつ同一の確率分布にしたがうと想定する i.i.dの定義 日次ベースの対数変化率 or 変化幅 X 1 X 2 X 3 X T の分散を σ 2 標準偏差を σ とすると T 日間の対数変化率 or 変化幅 分散は T σ 2 標準偏差は T σとなる X 1 +X 2 +X 3 + +X T の 62
63 ( 参考 ) 対数変化率の定義 日次対数変化率 log X t X t-1 10 日間対数変化率 X t - X t-1 X t = -1 X t-1 X t-1 log X t X t - X t-10 X t = -1 X t-10 X t-10 X t-10 対数変化率は 通常の変化率と近似的に等しいことが知られている log( 自然対数 ) は Excel では関数 LN( ) で与えられる 63
64 対数変化率の特徴 対数変化率は 同率の低下 上昇により 元の値に戻る 10 日間対数変化率は 日次対数変化率 (10 日分 ) の和となる 変化率 ( 日次 ) 対数変化率 ( 日次 ) 対数変化率 ( 日次 ) X X X X X X X X X X X Σlog(X t /X t-1 ) 対数変化率 (10 日間 ) 100 log(x10/x0)
65 東証 TOPIX 日次変化率の推移 日次変化率標準偏差 - 標準偏差 東証 TOPIX10 日間変化率の推移 日間変化率 標準偏差 - 標準偏差
66 下図は 過去 1 年間のデータをもとに 東証 TOPIX 変化率と 1 期前の変化率との相関関係 ( 自己相関 ) をみたもの 東証 TOPIX 日次変化率 1 期前 東証 TOPIX 10 日間変化率 1 期前 相関係数 ρ=0.037 当期 相関係数 ρ= 日次変化率の自己相関は弱いが 10 日間変化率の自己相関は強いことが観察される - 統計的に厳密に検証すると 多くの時系列データが ( 日次変化率でみても 10 日間変化率でみても ) 独立とは言えないことが多い 66 当期
67 基本統計量 Excel 関数日次 10 日間対数変化率対数変化率 データ数 COUNT 平均 AVERAGE 分散 VARA 標準偏差 STDEVA 分散をみると 10 日間対数変化率の分散は 日次対数変化率の分散の概ね 10 倍となっている 標準偏差をみると 10 日間対数変化率の標準偏差は 日次対数変化率の標準偏差の概ね 10 倍 (=3.162 倍 ) となっている 67
68 ルート T 倍ルール 10 日間対数変化率 X 1 +X 2 + +X T の確率分布 日次対数変化率 X の確率分布 - T σ T σ -σ σ 仮定リスクファクターの確率分布は i.i.d. 68
69 ルート T 倍ルール 日次対数変化率 日次対数変化率 日次対数変化率 日次対数変化率 T 日間対数変化率 T σ σ -σ X X X? X - T σ 仮定リスクファクターの確率分布は i.i.d. 69
70 4. 推定と検定 (1) 推定 (2) 検定 70
71 (1) 推定 母集団の確率分布 特性値は 誰にも分からない 標本の特性値から母集団の特性値を統計的に推測する 母集団確率密度関数 特性値平均 μ 標準偏差 σ 分散 V VaR など. 推定 母集団 標本 ( 実現値 ) 特性値平均 μ * 標準偏差 σ * 分散 V * VaR * など 71
72 (2) 検定 一定の確率分布を前提にして推定した値について その値をとる確率が十分に低いとき 偶然 珍しいことが起きた と考えるのではなく 推定の際に置いた前提が誤っていた と結論付ける 2 推定の前提 ( 確率分布 ) が誤っていたと結論付ける 推定の際に前提とした確率分布 真の確率分布 十分に低い水準 α% 実現値 1 実現する確率が十分に低いと考えられることが起きた 72
73 ( 設問 ) 1 の目がでやすいサイコロがあります サイコロを割ったり X 線透視などをせず サイコロを振るだけで このサイコロが イカサマ かどうかを決めたいと思います あなたは このサイコロを 600 回振って 何回 1 の目が出たら イカサマ だと判断しますか? 120 回で イカサマ だと判断しますか? 150 回で イカサマ だと判断しますか? 200 回で イカサマ だと判断しますか? 300 回で イカサマ だと判断しますか? 400 回で イカサマ だと判断しますか? 73
74 ( 例 )1 の目がでやすい イカサマ サイコロ の 見付け方 このサイコロを振ったとき 1 の目が出る確率は 1/6 である このサイコロを 600 回振ったとき 1 の目が? 回以上発生した このサイコロを振ったとき 1 の目が出る確率が 1/6 だとすると 600 回のうち? 回以上 1 の目が出る確率は十分に低い ( 例えば 0.1% 未満 ) ことが分かる このサイコロを振ったとき 1 の目が出る確率は 1/6 とは言えない 74
75 N 回の観測で K 回 1 の目が出る確率 2 項分布 N C K pk (1-p) N-K N=600 回 p=1/6 1-p=5/6 K 回 確率 確率 K 回以上 % % 0 回以上 % % 100 回以上 % % 110 回以上 % 3.051% 120 回以上 % 0.184% 130 回以上 % 0.004% 140 回以上 % 0.000% 150 回以上 % 0.000% 160 回以上 % 0.000% 170 回以上 % 0.000% 180 回以上 % 0.000% 190 回以上 % 0.000% 200 回以上 % 0.000% 300 回以上 % 0.000% 400 回以上 % 0.000% 500 回以上 % 0.000% 600 回以上 75
76 検定の一般的手続き 1 帰無仮説 を立てる 2 帰無仮説 が 真 (true) であるという仮定の下に 検定統計量 を決定する ただし 検定統計量の確率分布は既知とする 3 試行や標本 ( サンプル ) の抽出により 検定統計量 を計算する 4 検定統計量 の実現値 ( 計算値 ) がどの程度の確率でおき得ることかを確認する 5 検定統計量 の実現値 ( 計算値 ) が十分に低い確率 ( 有意水準 以下 ) でしか置きえないとき 帰無仮説 を棄却する 76
77 2 種類の過誤 検定 では 次の 2 通りの 過誤 ( エラー ) が起きる可能性がある したがって バックテストの結果も 過誤 ( エラー ) を伴っている可能性がある点 注意を要する 第 1 種の過誤 ( エラー ) 本当は帰無仮説が正しいのに 検定の結果 帰無仮説が誤っていると結論付けてしまう 第 2 種の過誤 ( エラー ) 本当は帰無仮説が正しくないのに 検定の結果 帰無仮説が正しいと結論付けてしまう 77
78 推定に利用した確率分布 = 真の確率分布 第 1 種の過誤 実現値 推定に利用した確率分布 = 真の確率分布 第 2 種の過誤 実現値 78
79 VaR 計測モデルのバックテストは 検定 の考え方に基づいて行います 79
80 参考文献 資料 イラスト 図解確率 統計のしくみが分かる本 長谷川勝也著 技術評論社 初等統計学 P.G. ホーエル著 浅井晃 村上正康訳 培風館 日本銀行 市場リスク管理の基礎 セミナー 補足 1 確率 統計の基礎 金融高度化センター碓井茂樹 80
【補足資料】確率・統計の基礎知識
補足資料 確率 統計の基礎知識 2011 年 5 月 日本銀行金融機構局 金融高度化センター 1 目 次 1. 基本統計量 (1 変量 ) - 平均 分散 標準偏差 パーセント点 2. 基本統計量 (2 変量 ) - 散布図 共分散 相関係数 相関行列 3. 確率変数 - 確率変数 確率分布 期待値 独立 4. 推定と検定 - 記述統計と推測統計 推定 検定 (2 項検定 ) 5. 線形回帰分析 -
確率・統計の基礎知識
補足資料 確率 統計の基礎知識 2012 年 8 月 日本銀行金融機構局 金融高度化センター 1 目 次 1. 基本統計量 (1 変量 ) - 平均 分散 標準偏差 パーセント点 2. 基本統計量 (2 変量 ) - 散布図 共分散 相関係数 相関行列と分散共分散行列相関行列と分散共分散行列 3. 確率変数と確率分布 - 確率変数 確率分布 期待値 独立 4. 推定と検定 - 記述統計と推測統計 推定
VaRの計測と検証
Ⅰ.VaR の計測と検証 2015 年 8 9 月日本銀行金融機構局金融高度化センター 目 次 1. リスク リスクマネジメントの定義 2.VaR の計測手法 3. バックテストによる VaR の検証 2 1. リスク リスクマネジメントの定義 リスクの定義 組織の目標 目的の達成に ( マイナスの ) 影響を与える事象の発生可能性影響の大きさと発生の可能性に基づいて測定される 3 目標 リスク 統制
ビジネス統計 統計基礎とエクセル分析 正誤表
ビジネス統計統計基礎とエクセル分析 ビジネス統計スペシャリスト エクセル分析スペシャリスト 公式テキスト正誤表と学習用データ更新履歴 平成 30 年 5 月 14 日現在 公式テキスト正誤表 頁場所誤正修正 6 知識編第 章 -3-3 最頻値の解説内容 たとえば, 表.1 のデータであれば, 最頻値は 167.5cm というたとえば, 表.1 のデータであれば, 最頻値は 165.0cm ということになります
Probit , Mixed logit
Probit, Mixed logit 2016/5/16 スタートアップゼミ #5 B4 後藤祥孝 1 0. 目次 Probit モデルについて 1. モデル概要 2. 定式化と理解 3. 推定 Mixed logit モデルについて 4. モデル概要 5. 定式化と理解 6. 推定 2 1.Probit 概要 プロビットモデルとは. 効用関数の誤差項に多変量正規分布を仮定したもの. 誤差項には様々な要因が存在するため,
EBNと疫学
推定と検定 57 ( 復習 ) 記述統計と推測統計 統計解析は大きく 2 つに分けられる 記述統計 推測統計 記述統計 観察集団の特性を示すもの 代表値 ( 平均値や中央値 ) や ばらつきの指標 ( 標準偏差など ) 図表を効果的に使う 推測統計 観察集団のデータから母集団の特性を 推定 する 平均 / 分散 / 係数値などの推定 ( 点推定 ) 点推定値のばらつきを調べる ( 区間推定 ) 検定統計量を用いた検定
統計的データ解析
統計的データ解析 011 011.11.9 林田清 ( 大阪大学大学院理学研究科 ) 連続確率分布の平均値 分散 比較のため P(c ) c 分布 自由度 の ( カイ c 平均値 0, 標準偏差 1の正規分布 に従う変数 xの自乗和 c x =1 が従う分布を自由度 の分布と呼ぶ 一般に自由度の分布は f /1 c / / ( c ) {( c ) e }/ ( / ) 期待値 二乗 ) 分布 c
基礎統計
基礎統計 第 11 回講義資料 6.4.2 標本平均の差の標本分布 母平均の差 標本平均の差をみれば良い ただし, 母分散に依存するため場合分けをする 1 2 3 分散が既知分散が未知であるが等しい分散が未知であり等しいとは限らない 1 母分散が既知のとき が既知 標準化変量 2 母分散が未知であり, 等しいとき 分散が未知であるが, 等しいということは分かっているとき 標準化変量 自由度 の t
第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均
第 3 回講義の項目と概要 016.8.9 1.3 統計的手法入門 : 品質のばらつきを解析する 1.3.1 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均 :AVERAGE 関数, 標準偏差 :STDEVP 関数とSTDEVという関数 1 取得したデータそのものの標準偏差
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :
統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ : https://goo.gl/qw1djw 正規分布 ( 復習 ) 正規分布 (Normal Distribution)N (μ, σ 2 ) 別名 : ガウス分布 (Gaussian Distribution) 密度関数 Excel:= NORM.DIST
市場リスクの把握と管理
Ⅱ. 市場リスクの把握と管理 2013 年 4 月 日本銀行金融機構局 金融高度化センター 目次 1. 市場リスクとは 2. 現在価値アプローチ 3.BPV GPS によるリスク量の把握 4.VaR によるリスク量の把握 5. バックテストによる VaR の検証 6.VaR の限界とストレステスト 2 1. 市場リスクとは 定義 ( 金融検査マニュアル ) 市場リスクとは 金利 為替 株式等の様々な市場のリスク
Excelによる統計分析検定_知識編_小塚明_5_9章.indd
第7章57766 検定と推定 サンプリングによって得られた標本から, 母集団の統計的性質に対して推測を行うことを統計的推測といいます 本章では, 推測統計の根幹をなす仮説検定と推定の基本的な考え方について説明します 前章までの知識を用いて, 具体的な分析を行います 本章以降の知識は操作編での操作に直接関連していますので, 少し聞きなれない言葉ですが, 帰無仮説 有意水準 棄却域 などの意味を理解して,
講義「○○○○」
講義 信頼度の推定と立証 内容. 点推定と区間推定. 指数分布の点推定 区間推定 3. 指数分布 正規分布の信頼度推定 担当 : 倉敷哲生 ( ビジネスエンジニアリング専攻 ) 統計的推測 標本から得られる情報を基に 母集団に関する結論の導出が目的 測定値 x x x 3 : x 母集団 (populaio) 母集団の特性値 統計的推測 標本 (sample) 標本の特性値 分布のパラメータ ( 母数
【補足資料】確率・統計の基礎知識
補 足 資 料 確 率 統 計 の 基 礎 知 識 2011 年 3 月 日 本 銀 行 金 融 機 構 局 金 融 高 度 化 センター 1 目 次 1. 基 本 統 計 量 (1 変 量 ) - 平 均 分 散 標 準 偏 差 パーセント 点 2. 基 本 統 計 量 (2 変 量 ) - 散 布 図 共 分 散 相 関 係 数 相 関 行 列 3. 確 率 変 数 - 確 率 変 数 確 率
Microsoft PowerPoint - 測量学.ppt [互換モード]
8/5/ 誤差理論 測定の分類 性格による分類 独立 ( な ) 測定 : 測定値がある条件を満たさなければならないなどの拘束や制約を持たないで独立して行う測定 条件 ( 付き ) 測定 : 三角形の 3 つの内角の和のように, 個々の測定値間に満たすべき条件式が存在する場合の測定 方法による分類 直接測定 : 距離や角度などを機器を用いて直接行う測定 間接測定 : 求めるべき量を直接測定するのではなく,
Microsoft PowerPoint - stat-2014-[9] pptx
統計学 第 17 回 講義 母平均の区間推定 Part-1 014 年 6 17 ( )6-7 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: htt://www3.u-toyama.ac.j/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を
<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>
第 4 回二項分布, ポアソン分布, 正規分布 実験計画学 009 年 月 0 日 A. 代表的な分布. 離散分布 二項分布大きさ n の標本で, 事象 Eの起こる確率を p とするとき, そのうち x 個にEが起こる確率 P(x) は二項分布に従う. 例さいころを 0 回振ったときに の出る回数 x の確率分布は二項分布に従う. この場合, n = 0, p = 6 の二項分布になる さいころを
Microsoft PowerPoint - e-stat(OLS).pptx
経済統計学 ( 補足 ) 最小二乗法について 担当 : 小塚匡文 2015 年 11 月 19 日 ( 改訂版 ) 神戸大学経済学部 2015 年度後期開講授業 補足 : 最小二乗法 ( 単回帰分析 ) 1.( 単純 ) 回帰分析とは? 標本サイズTの2 変数 ( ここではXとY) のデータが存在 YをXで説明する回帰方程式を推定するための方法 Y: 被説明変数 ( または従属変数 ) X: 説明変数
モジュール1のまとめ
数理統計学 第 0 回 復習 標本分散と ( 標本 ) 不偏分散両方とも 分散 というのが実情 二乗偏差計標本分散 = データ数 (0ページ) ( 標本 ) 不偏分散 = (03 ページ ) 二乗偏差計 データ数 - 分析ではこちらをとることが多い 復習 ここまで 実験結果 ( 万回 ) 平均 50Kg 標準偏差 0Kg 0 人 全体に小さすぎる > mea(jkke) [] 89.4373 標準偏差
Microsoft PowerPoint - 基礎・経済統計6.ppt
. 確率変数 基礎 経済統計 6 確率分布 事象を数値化したもの ( 事象ー > 数値 の関数 自然に数値されている場合 さいころの目 量的尺度 数値化が必要な場合 質的尺度, 順序的尺度 それらの尺度に数値を割り当てる 例えば, コインの表が出たら, 裏なら 0. 離散確率変数と連続確率変数 確率変数の値 連続値をとるもの 身長, 体重, 実質 GDP など とびとびの値 離散値をとるもの 新生児の性別
Microsoft PowerPoint - Statistics[B]
講義の目的 サンプルサイズの大きい標本比率の分布は正規分布で近似できることを理解します 科目コード 130509, 130609, 110225 統計学講義第 19/20 回 2019 年 6 月 25 日 ( 火 )6/7 限 担当教員 : 唐渡広志 ( からと こうじ ) 研究室 : email: website: 経済学研究棟 4 階 432 号室 [email protected]
Microsoft Word - å“Ÿåłžå¸°173.docx
回帰分析 ( その 3) 経済情報処理 価格弾力性の推定ある商品について その購入量を w 単価を p とし それぞれの変化量を w p で表 w w すことにする この時 この商品の価格弾力性 は により定義される これ p p は p が 1 パーセント変化した場合に w が何パーセント変化するかを示したものである ここで p を 0 に近づけていった極限を考えると d ln w 1 dw dw
Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷
熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI プロジェクト @ 宮崎県美郷町 熊本大学副島慶人川村諒 1 実験の目的 従来 信号の受信電波強度 (RSSI:RecevedSgnal StrengthIndcator) により 対象の位置を推定する手法として 無線 LAN の AP(AccessPont) から受信する信号の減衰量をもとに位置を推定する手法が多く検討されている
<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>
第 7 回 t 分布と t 検定 実験計画学 A.t 分布 ( 小標本に関する平均の推定と検定 ) 前々回と前回の授業では, 標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定 検定した. しかし, 母集団が正規分布し, 標本が小さい場合には, 標本分散から母分散を推定するときの不確実さを加味したt 分布を用いて推定 検定しなければならない. t 分布は標本分散の自由度 f(
統計学の基礎から学ぶ実験計画法ー1
第 部統計学の基礎と. 統計学とは. 統計学の基本. 母集団とサンプル ( 標本 ). データ (data) 3. 集団の特性を示す統計量 基本的な解析手法 3. 統計量 (statistic) とは 3. 集団を代表する統計量 - 平均値など 3.3 集団のばらつきを表す値 - 平方和 分散 標準偏差 4. ばらつき ( 分布 ) を表す関数 4. 確率密度関数 4. 最も重要な正規分布 4.3
Microsoft Word - lec_student-chp3_1-representative
1. はじめに この節でのテーマ データ分布の中心位置を数値で表す 可視化でとらえた分布の中心位置を数量化する 平均値とメジアン, 幾何平均 この節での到達目標 1 平均値 メジアン 幾何平均の定義を書ける 2 平均値とメジアン, 幾何平均の特徴と使える状況を説明できる. 3 平均値 メジアン 幾何平均を計算できる 2. 特性値 集めたデータを度数分布表やヒストグラムに整理する ( 可視化する )
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典
多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典 重回帰分析とは? 重回帰分析とは複数の説明変数から目的変数との関係性を予測 評価説明変数 ( 数量データ ) は目的変数を説明するのに有効であるか得られた関係性より未知のデータの妥当性を判断する これを重回帰分析という つまり どんなことをするのか? 1 最小 2 乗法により重回帰モデルを想定 2 自由度調整済寄与率を求め
経営統計学
5 章基本統計量 3.5 節で量的データの集計方法について簡単に触れ 前章でデータの分布について学びましたが データの特徴をつの数値で示すこともよく行なわれます これは統計量と呼ばれ 主に分布の中心や拡がりなどを表わします この章ではよく利用される分布の統計量を特徴で分類して説明します 数式表示を統一的に行なうために データの個数を 個とし それらを,,, と表わすことにします ここで学ぶ統計量は統計分析の基礎となっており
相関係数と偏差ベクトル
相関係数と偏差ベクトル 経営統計演習の補足資料 07 年 月 9 日金沢学院大学経営情報学部藤本祥二 相関係数の復習 r = s xy s x s y = = n σ n i= σn i= n σ n i= n σ i= x i xҧ y i തy x i xҧ n σ n i= y i തy x i xҧ x i xҧ y i തy σn i= y i തy 式が長くなるので u, v の文字で偏差を表すことにする
平均値 () 次のデータは, ある高校生 7 人が ヵ月にカレーライスを食べた回数 x を調べたものである 0,8,4,6,9,5,7 ( 回 ) このデータの平均値 x を求めよ () 右の表から, テレビをみた時間 x の平均値を求めよ 階級 ( 分 ) 階級値度数 x( 分 ) f( 人 )
データの分析 データの整理右の度数分布表は,A 高校の 0 人について, 日にみたテレビの時間を記入したものである 次の問いに答えよ () テレビをみた時間が 85 分未満の生徒は何人いるか () テレビをみた時間が 95 分以上の生徒は全体の何 % であるか (3) 右の度数分布表をもとにして, ヒストグラムをかけ 階級 ( 分 ) 階級値度数相対 ( 分 ) ( 人 ) 度数 55 以上 ~65
Microsoft PowerPoint - Econometrics pptx
計量経済学講義 第 4 回回帰モデルの診断と選択 Part 07 年 ( ) 限 担当教員 : 唐渡 広志 研究室 : 経済学研究棟 4 階 43 号室 emal: [email protected] webste: http://www3.u-toyama.ac.p/kkarato/ 講義の目的 誤差項の分散が不均 である場合や, 系列相関を持つ場合についての検定 法と修正 法を学びます
不偏推定量
不偏推定量 情報科学の補足資料 018 年 6 月 7 日藤本祥二 統計的推定 (statistical estimatio) 確率分布が理論的に分かっている標本統計量を利用する 確率分布の期待値の値をそのまま推定値とするのが点推定 ( 信頼度 0%) 点推定に ± で幅を持たせて信頼度を上げたものが区間推定 持たせた幅のことを誤差 (error) と呼ぶ 信頼度 (cofidece level)
PowerPoint プレゼンテーション
1/X Chapter 9: Linear correlation Cohen, B. H. (2007). In B. H. Cohen (Ed.), Explaining Psychological Statistics (3rd ed.) (pp. 255-285). NJ: Wiley. 概要 2/X 相関係数とは何か 相関係数の数式 検定 注意点 フィッシャーのZ 変換 信頼区間 相関係数の差の検定
ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.
23(2011) (1 C104) 5 11 (2 C206) 5 12 http://www.math.is.tohoku.ac.jp/~obata,.,,,.. 1. 2. 3. 4. 5. 6. 7.,,. 1., 2007 ( ). 2. P. G. Hoel, 1995. 3... 1... 2.,,. ii 3.,. 4. F. (),.. 5.. 6.. 7.,,. 8.,. 1. (75%
Microsoft Word - Stattext12.doc
章対応のない 群間の量的データの検定. 検定手順 この章ではデータ間に 対 の対応のないつの標本から推定される母集団間の平均値や中央値の比較を行ないます 検定手法は 図. のようにまず正規に従うかどうかを調べます 但し この場合はつの群が共に正規に従うことを調べる必要があります 次に 群とも正規ならば F 検定を用いて等分散であるかどうかを調べます 等分散の場合は t 検定 等分散でない場合はウェルチ
Microsoft Word - 補論3.2
補論 3. 多変量 GARC モデル 07//6 新谷元嗣 藪友良 対数尤度関数 3 章 7 節では 変量の対数尤度を求めた ここでは多変量の場合 とくに 変量について対数尤度を求める 誤差項 は平均 0 で 次元の正規分布に従うとする 単純化のため 分散と共分散は時間を通じて一定としよう ( この仮定は後で変更される ) したがって ij から添え字 を除くことができる このとき と の尤度関数は
Microsoft PowerPoint - H17-5時限(パターン認識).ppt
パターン認識早稲田大学講義 平成 7 年度 独 産業技術総合研究所栗田多喜夫 赤穂昭太郎 統計的特徴抽出 パターン認識過程 特徴抽出 認識対象から何らかの特徴量を計測 抽出 する必要がある 認識に有効な情報 特徴 を抽出し 次元を縮小した効率の良い空間を構成する過程 文字認識 : スキャナ等で取り込んだ画像から文字の識別に必要な本質的な特徴のみを抽出 例 文字線の傾き 曲率 面積など 識別 与えられた未知の対象を
13章 回帰分析
単回帰分析 つ以上の変数についての関係を見る つの 目的 被説明 変数を その他の 説明 変数を使って 予測しようというものである 因果関係とは限らない ここで勉強すること 最小 乗法と回帰直線 決定係数とは何か? 最小 乗法と回帰直線 これまで 変数の間の関係の深さについて考えてきた 相関係数 ここでは 変数に役割を与え 一方の 説明 変数を用いて他方の 目的 被説明 変数を説明することを考える
ベイズ統計入門
ベイズ統計入門 条件付確率 事象 F が起こったことが既知であるという条件の下で E が起こる確率を条件付確率 (codtoal probablt) という P ( E F ) P ( E F ) P( F ) 定義式を変形すると 確率の乗法公式となる ( E F ) P( F ) P( E F ) P( E) P( F E) P 事象の独立 ある事象の生起する確率が 他のある事象が生起するかどうかによって変化しないとき
自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好
. 内容 3. 質的データの解析方法 ( 名義尺度 ).χ 検定 タイプ. 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 点比較法 点識別法 点嗜好法 3 点比較法 3 点識別法 3 点嗜好法 : 点比較法 : 点識別法 配偶法 配偶法 ( 官能評価の基礎と応用 ) 3 A か B かの判定において 回の判定でAが選ばれる回数 kは p の二項分布に従う H :
Microsoft PowerPoint - Inoue-statistics [互換モード]
誤差論 神戸大学大学院農学研究科 井上一哉 (Kazuya INOUE) 誤差論 2011 年度前期火曜クラス 1 講義内容 誤差と有効数字 (Slide No.2~8 Text p.76~78) 誤差の分布と標準偏差 (Slide No.9~18 Text p.78~80) 最確値とその誤差 (Slide No.19~25 Text p.80~81) 誤差の伝播 (Slide No.26~32 Text
(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説
第 3 章 t 検定 (pp. 33-42) 3-1 統計的検定 統計的検定とは 設定した仮説を検証する場合に 仮説に基づいて集めた標本を 確率論の観点から分析 検証すること 使用する標本は 母集団から無作為抽出されたものでなければならない パラメトリック検定とノンパラメトリック検定 パラメトリック検定は母集団が正規分布に従う間隔尺度あるいは比率尺度の連続データを対象とする ノンパラメトリック検定は母集団に特定の分布を仮定しない
14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手
14 化学実験法 II( 吉村 ( 洋 014.6.1. 最小 乗法のはなし 014.6.1. 内容 最小 乗法のはなし...1 最小 乗法の考え方...1 最小 乗法によるパラメータの決定... パラメータの信頼区間...3 重みの異なるデータの取扱い...4 相関係数 決定係数 ( 最小 乗法を語るもう一つの立場...5 実験条件の誤差の影響...5 問題...6 最小 乗法の考え方 飲料水中のカルシウム濃度を
Microsoft PowerPoint - statistics pptx
統計学 第 16 回 講義 母平均の区間推定 Part-1 016 年 6 10 ( ) 1 限 担当教員 : 唐渡 広志 ( からと こうじ ) 研究室 : 経済学研究棟 4 階 43 号室 email: [email protected] website: http://www3.u-toyama.ac.jp/kkarato/ 1 講義の目的 標本平均は正規分布に従うという性質を
リスクマネジメント(総論)
リスクマネジメント ( 総論 ) 2018 年 7 月日本銀行金融機構局金融高度化センター 目次 1. リスク リスクマネジメントの定義 2. リスクの計量化 3.VaRの計測と検証 4. ストレステスト シナリオ分析 2 1. リスク リスクマネジメントの定義 リスクの定義 組織の目標 目的の達成に ( マイナスの ) 影響を与える事象の発生可能性影響の大きさと発生の可能性に基づいて測定される 3
様々なミクロ計量モデル†
担当 : 長倉大輔 ( ながくらだいすけ ) この資料は私の講義において使用するために作成した資料です WEB ページ上で公開しており 自由に参照して頂いて構いません ただし 内容について 一応検証してありますが もし間違いがあった場合でもそれによって生じるいかなる損害 不利益について責任を負いかねますのでご了承ください 間違いは発見次第 継続的に直していますが まだ存在する可能性があります 1 カウントデータモデル
リスク計測手法と内部監査のポイント
リスク計測手法と内部監査のポイント VaR の理解と検証 2010 年 3 月日本銀行金融機構局金融高度化センター 企画役 碓井茂樹 公認内部監査人 (CIA) 内部統制評価指導士 (CCSA) 公認金融監査人 (CFSA) E-mail: [email protected] Tel:03-3277-1886 1 目次 1. はじめに 2.VaRの計測手法 3. バックテストによる検証 4.VaRの限界とストレステスト
データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの 2
春学期統計学 I データの整理 : 度数分布 標本分散 等 担当 : 長倉大輔 ( ながくらだいすけ ) 1 データの整理 ( 度数分布表とヒストグラム ) 1 次元のデータの整理の仕方として代表的な ものに度数分布表とヒストグラムがあります 度数分布表観測値をその値に応じていくつかのグループ ( これを階級という ) に分類し 各階級に入る観測値の数 ( これを度数という ) を数えて表にしたもの
スライド 1
データ解析特論重回帰分析編 2017 年 7 月 10 日 ( 月 )~ 情報エレクトロニクスコース横田孝義 1 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える 具体的には y = a + bx という回帰直線 ( モデル ) でデータを代表させる このためにデータからこの回帰直線の切片 (a) と傾き (b) を最小
青焼 1章[15-52].indd
1 第 1 章統計の基礎知識 1 1 なぜ統計解析が必要なのか? 人間は自分自身の経験にもとづいて 感覚的にものごとを判断しがちである 例えばある疾患に対する標準治療薬の有効率が 50% であったとする そこに新薬が登場し ある医師がその新薬を 5 人の患者に使ったところ 4 人が有効と判定されたとしたら 多くの医師はこれまでの標準治療薬よりも新薬のほうが有効性が高そうだと感じることだろう しかし
カイ二乗フィット検定、パラメータの誤差
統計的データ解析 008 008.. 林田清 ( 大阪大学大学院理学研究科 ) 問題 C (, ) ( x xˆ) ( y yˆ) σ x πσ σ y y Pabx (, ;,,, ) ˆ y σx σ y = dx exp exp πσx ただし xy ˆ ˆ はyˆ = axˆ+ bであらわされる直線モデル上の点 ( ˆ) ( ˆ ) ( ) x x y ax b y ax b Pabx (,
経済統計分析1 イントロダクション
1 経済統計分析 9 分散分析 今日のおはなし. 検定 statistical test のいろいろ 2 変数の関係を調べる手段のひとつ適合度検定独立性検定分散分析 今日のタネ 吉田耕作.2006. 直感的統計学. 日経 BP. 中村隆英ほか.1984. 統計入門. 東大出版会. 2 仮説検定の手続き 仮説検定のロジック もし帰無仮説が正しければ, 検定統計量が既知の分布に従う 計算された検定統計量の値から,
Microsoft PowerPoint - statistics pptx
統計学 第 回 講義 仮説検定 Part-3 06 年 6 8 ( )3 限 担当教員 唐渡 広志 ( からと こうじ ) 研究室 経済学研究棟 4 階 43 号室 email [email protected] webite htt://www3.u-toyama.ac.j/kkarato/ 講義の目的 つの 集団の平均 ( 率 ) に差があるかどうかを検定する 法を理解します keyword:
森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て
. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,0 年に 回の渇水を対象として計画が立てられる. このように, 水利構造物の設計や, 治水や利水の計画などでは, 年に 回起こるような降雨事象 ( 最大降雨強度, 最大連続干天日数など
解析センターを知っていただく キャンペーン
005..5 SAS 問題設定 目的 PKパラメータ (AUC,Cmax,Tmaxなど) の推定 PKパラメータの群間比較 PKパラメータのバラツキの評価! データの特徴 非反復測定値 個体につき 個の測定値しか得られない plasma concentration 非反復測定値のイメージ図 測定時点間で個体の対応がない 着目する状況 plasma concentration 経時反復測定値のイメージ図
ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,
(1 C205) 4 8 27(2015) http://www.math.is.tohoku.ac.jp/~obata,.,,,..,,. 1. 2. 3. 4. 5. 6. 7.... 1., 2014... 2. P. G., 1995.,. 3.,. 4.. 5., 1996... 1., 2007,. ii 2. F. ( ),.. 3... 4.,,. 5. G., L., D. ( )
スライド 1
データ解析特論第 10 回 ( 全 15 回 ) 2012 年 12 月 11 日 ( 火 ) 情報エレクトロニクス専攻横田孝義 1 終了 11/13 11/20 重回帰分析をしばらくやります 12/4 12/11 12/18 2 前回から回帰分析について学習しています 3 ( 単 ) 回帰分析 単回帰分析では一つの従属変数 ( 目的変数 ) を 一つの独立変数 ( 説明変数 ) で予測する事を考える
ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝
ダンゴムシの 交替性転向反応に 関する研究 3A15 今野直輝 1. 研究の動機 ダンゴムシには 右に曲がった後は左に 左に曲がった後は右に曲がる という交替性転向反応という習性がある 数多くの生物において この習性は見受けられるのだが なかでもダンゴムシやその仲間のワラジムシは その行動が特に顕著であるとして有名である そのため図 1のような道をダンゴムシに歩かせると 前の突き当りでどちらの方向に曲がったかを見ることによって
Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (
http://localhost:8888/notebooks/... Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (http://shop.ohmsha.co.jp/shop /shopdetail.html?brandcode=000000001781&search=978-4-274-06710-5&sort=) を参考にしています
1. 期待収益率 ( 期待リターン ) 収益率 ( リターン ) には次の二つがあります 実際の価格データから計算した 事後的な収益率 将来発生しうると予想する 事前的な収益率 これまでみてきた債券の利回りを求める計算などは 事後的な収益率 の計算でした 事後的な収益率は一つですが 事前に予想できる
Ⅳ ポートフォリオ編 株式や債券などの将来の収益は預貯金などとは違い 不確実です 不確実で 値動きの異なる複数の銘柄やファンドなどを組み合わせた場合に 全体としてどんな動きになるのかということを予想するためには 統計 確率的な手法を取り入れて 計算することができます ポートフォリオに関する計算問題がとっつきにくいと感じる場合は 統計 確率などの考え方をベースにしているのだ ということを意識して 考え方に慣れていきましょう
1.民営化
参考資料 最小二乗法 数学的性質 経済統計分析 3 年度秋学期 回帰分析と最小二乗法 被説明変数 の動きを説明変数 の動きで説明 = 回帰分析 説明変数がつ 単回帰 説明変数がつ以上 重回帰 被説明変数 従属変数 係数 定数項傾き 説明変数 独立変数 残差... で説明できる部分 説明できない部分 説明できない部分が小さくなるように回帰式の係数 を推定する有力な方法 = 最小二乗法 最小二乗法による回帰の考え方
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定
異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 4-1-1 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定の反復 (e.g., A, B, C の 3 群の比較を A-B 間 B-C 間 A-C 間の t 検定で行う
PowerPoint Presentation
付録 2 2 次元アフィン変換 直交変換 たたみ込み 1.2 次元のアフィン変換 座標 (x,y ) を (x,y) に移すことを 2 次元での変換. 特に, 変換が と書けるとき, アフィン変換, アフィン変換は, その 1 次の項による変換 と 0 次の項による変換 アフィン変換 0 次の項は平行移動 1 次の項は座標 (x, y ) をベクトルと考えて とすれば このようなもの 2 次元ベクトルの線形写像
統計Ⅰ 第1回 序説~確率
授業担当 : 徳永伸一 東京医科歯科大学教養部 数学講座 あらためて注意しておきたいこと ( 前期のはじめに注意したこと +α) 後期の授業は今日を含め ( たった )6 回 成績評価は前期試験 + 後期試験で 後期の方が比重が大きいですが前期の出来が悪かった人はハンデがあると思ってください 後期試験の出題範囲には前期授業の内容も含まれます 復習も怠りなく 欠席した場合は次回までに要点の確認を 次回の授業までに授業スライドを
はじめに Excel における計算式の入力方法の基礎 Excel では計算式を入力することで様々な計算を行うことができる 例えば はセルに =SQRT((4^2)/3+3*5-2) と入力することで算出される ( 答え ) どのような数式が使えるかは 数式
統計演習 統計 とはバラツキのあるデータから数値上の性質や規則性あるいは不規則性を 客観的に分析 評価する手法のことである 統計的手法には様々なものが含まれるが 今回はそのなかから 記述統計と統計学的推測について簡単にふれる 記述統計 : 収集した標本の平均や分散 標準偏差などを計算し データの示す傾向や性質を要約して把握する手法のこと 求められた値を記述統計量 ( または要約統計量 ) と言う 平均値
スライド 1
計測工学第 12 回以降 測定値の誤差と精度編 2014 年 7 月 2 日 ( 水 )~7 月 16 日 ( 水 ) 知能情報工学科 横田孝義 1 授業計画 4/9 4/16 4/23 5/7 5/14 5/21 5/28 6/4 6/11 6/18 6/25 7/2 7/9 7/16 7/23 2 誤差とその取扱い 3 誤差 = 測定値 真の値 相対誤差 = 誤差 / 真の値 4 誤差 (error)
Microsoft PowerPoint - 資料04 重回帰分析.ppt
04. 重回帰分析 京都大学 加納学 Division of Process Control & Process Sstems Engineering Department of Chemical Engineering, Koto Universit [email protected] http://www-pse.cheme.koto-u.ac.jp/~kano/ Outline
ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル
時系列分析 変量時系列モデルとその性質 担当 : 長倉大輔 ( ながくらだいすけ 時系列モデル 時系列モデルとは時系列データを生み出すメカニズムとなるものである これは実際には未知である 私たちにできるのは観測された時系列データからその背後にある時系列モデルを推測 推定するだけである 以下ではいくつかの代表的な時系列モデルを考察する 自己回帰モデル (Auoregressive Model もっとも頻繁に使われる時系列モデルは自己回帰モデル
Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]
R で統計解析入門 (12) 生存時間解析 中篇 準備 : データ DEP の読み込み 1. データ DEP を以下からダウンロードする http://www.cwk.zaq.ne.jp/fkhud708/files/dep.csv /fkh /d 2. ダウンロードした場所を把握する ここでは c:/temp とする 3. R を起動し,2. 2 の場所に移動し, データを読み込む 4. データ
Microsoft PowerPoint - ch04j
Ch.4 重回帰分析 : 推論 重回帰分析 y = 0 + 1 x 1 + 2 x 2 +... + k x k + u 2. 推論 1. OLS 推定量の標本分布 2. 1 係数の仮説検定 : t 検定 3. 信頼区間 4. 係数の線形結合への仮説検定 5. 複数線形制約の検定 : F 検定 6. 回帰結果の報告 入門計量経済学 1 入門計量経済学 2 OLS 推定量の標本分布について OLS 推定量は確率変数
Medical3
Chapter 1 1.4.1 1 元配置分散分析と多重比較の実行 3つの治療法による測定値に有意な差が認められるかどうかを分散分析で調べます この例では 因子が1つだけ含まれるため1 元配置分散分析 one-way ANOVA の適用になります また 多重比較法 multiple comparison procedure を用いて 具体的のどの治療法の間に有意差が認められるかを検定します 1. 分析メニュー
