Microsoft PowerPoint - Ⅱ(リスク計量化入門）.ppt

Ⅱ. 統計確率の基礎知識リスク計量化の前提となる統計確率の基礎知識について整理復習します図解中心の説明ですので統計確率は苦手だと感じている方も理解度アップに繋がります 1

目次 1. 基本統計量 (1 変量 ) 2. 基本統計量 (2 変量 ) 3. 確率変数と確率分布 4. 推定と検定 2

1. 基本統計量 (1 変量 ) (1) 平均 (2) 分散 (3) 標準偏差 (4) パーセント点 3

講義の中では以下の観測データを使います ( 例 ) 東証 TOPIX 日次変化率 250 個東証 TOPIX 10 日間変化率 250 東証指個日次変化 10 日変化 200X/9/29 1610.73 0.508 0.785 200X/9/28 1602.57 0.722 1.194 200X/9/27 1591.04 2.651 0.319 200X/9/26 1549.41-0.667-2.994 200X/9/25 1559.78-0.245-3.783 200X/9/22 1563.60-1.048-3.139 200X/9/21 1580.08 0.629-3.894 200X/9/20 1570.18-1.379-5.040 200X/9/19 1591.98-0.091-3.538 200X/9/15 1593.43-0.295-2.474 200X/9/14 1591.04 2.651 0.319 4

12 東証 TOPIX 日次変化率の推移 8 4 0-4 -8-12 12 東証 TOPIX10 日間変化率の推移 8 4 0-4 -8-12 5

基本統計 Excel 関数日次変化率 10 日間変化率データ COUNT 250 250 平 AVERAGE 0.063 0.656 分 VARA 1.540 14.966 標準偏 STDEVA 1.241 3.869 ( 設問 ) グラフと基本統計量をみてどんなことに気付きましたか? ( ヒント ) 気付いて欲しいことは4つあります答えは講義の中で 6

(1) 平均平均は観測データセットの中心の位置を示す指標の 1 つ X = データの和データの数 = X 1 +X 2 + +X N N Excel では関数 AVERAGE( データ範囲 ) を使って求める 7

(2 ⅰ) 分散 ( 記述統計の立場で定義 ) 分散は観測データセットのバラツキを示す指標の 1 つ - データの偏差平方和 ( 平均との差を2 乗して合計 ) を求めてデータの数で割る - 分散の単位はデータの持つ単位の2 乗 Vp=σ 2 = = データの偏差平方和データの (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N Excel では関数 VARP( データ範囲 ) を使って求める 8

記述統計 : 中学高校で学習する平均と分散 ( 例 ) 観測データ平均 : 中心の位 3 4 5 6 7 偏差 ( 平均との差 ) -2-1 0 1 2 合計するとゼロ偏差平方 (-2) 2 (-1) 2 0 2 1 2 2 2 合計すると偏差平方和 10 観測データがバラつく ( 平均から離れる ) と偏差平方和は増えるしかし観測データ数が増えても偏差平方和は増えてしまう分散偏差平方和 10 観測データ数 5 9

( 参考 ) 記述統計の考え方観測データを母集団全体と考えて統計量の算定を行い観測データが持つ特性を分析記述する ( 例 ) ある特定の集団 (N 人 ) の身長の平均と分散を計算する平均 X 分散 Vp = = X 1 +X 2 + +X N N (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N 10

母集団 = 標本の特性値を調べる平均 μ 分散 V 標準偏差 σ VaR など. 計測可母集団 = 標本 11

(2 ⅱ) 分散 ( 推測統計の立場で定義 ) 分散は観測データセットのバラツキを示す指標の1つ - データの偏差平方和 ( 平均との差を2 乗して合計 ) を求めてデータの数-1 で割る - 分散の単位はデータの持つ単位の2 乗 Va=σ 2 = = データの偏差平方和データ数 -1 (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N-1 Excel では関数 VARA( データ範囲 ) を使って求める 12

( 参考 ) 推測統計の考え方観測データを母集団から抽出した標本 ( サンプル ) と考えて統計量の算定を行い母集団の特性を推測し検証する ( 例 ) 任意に抽出した N 人 ( 標本 ) の身長を計測して日本人全体 ( 母集団 ) の身長の平均と分散を推定する平均 X = 分散 ( 不偏標本分散 ) X 1 +X 2 + +X N N Va = (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 N-1 13

母集団母集団の特性値 ( 真の値 ) は分からない平均 μ 分散 V 標準偏差 σ VaR など. 推定標本標本の特性値平均 μ * 分散 V * 標準偏差 σ * VaR * など 14

N-1 で割った標本分散の特徴母集団の真の分散を統計的手法で推定するときに N-1で割った標本分散を使うのは以下のような特徴があるため ( 一致性 ) 標本分散は Nが大きくなると母集団の真の分散に限りなく近づく ( 不偏性 ) 標本分散は母集団の真の分散の偏りのない推定値となることが知られている 15

標本分散 (V * ) を標本を変えて繰り返し計算すると真の分散を中心にして偏りなく分布する ( 不偏性 ) 標本分散 V * (1) 標本分散 V * (7) 標本分散 V * (3) 標本分散 V * (5) 母集団の真の分散 V ( 誰も知らない ) 標本分散 V * (4) 標本分散 V * (6) 標本分散 V * (2) 16

講義の中で VaR を計測する際に使う分散標準偏差は推測統計の立場から定義したもの (N-1 で割ったもの ) です 17

(3) 標準偏差 ( 推測統計の立場で記載 ) 標準偏差は観測データセットのバラツキを示す指標の 1 つ分散の平方根 ( ルート ) をとって定義する - 標準偏差の単位はデータの持つ単位と同じ σ = データの偏差平方和データ数 -1 (X 1 -X) 2 +(X 2 -X) 2 + +(X N -X) 2 = N-1 Excel では関数 STDEVA( データ範囲 ) を使って求める 18

平均サンプル1-2 -1 0 1 2 標準偏差標準偏差 1.581 1.581 サンプル2-4 -2 0 2 4 標準偏差標準偏差 3.162 3.162 19

東証 TOPIX 日次変化率の推移 12 8 4 0-4 日次変化率標準偏差 - 標準偏差 -8-12 東証 TOPIX10 日間変化率の推移 12 8 4 0-4 10 日間変化率標準偏差 - 標準偏差 -8-12 20

基本統計 Excel 関日次変化 10 日変化データ COUN 250 250 平 AVERAG 0.063 0.656 分 VAR 1.540 14.966 標準偏 STDEV 1.241 3.869 平均をみると日次変化率 10 日間変化率とも概ねゼロとなっている分散をみると 10 日間変化率の分散は日次変化率の分散の概ね10 倍となっている標準偏差をみると 10 日間変化率の標準偏差は日次変化率の標準偏差の概ね 10 倍 (=3.162 倍 ) となっている 21

株価金利為替等の変化率に関して 1 その平均をゼロと仮定したり 2 T 日間変化率の標準偏差は日次変化率の標準偏差の T 倍と仮定して市場 VaRを計測することがある 22

(4) パーセント点パーセント点とは観測データを小さい順に並べたときにその値よりも小さな値の割合が指定された割合 ( 百分率 ) になるデータの値として定義される例えば 99 パーセント点というのはその値より小さなデータの割合が 99% となるデータの値のことを指す - 50 パーセント点のことを中央値 ( メジアン ) と呼ぶ - 25 パーセント点を第 1 四分位点 75 パーセント点を第 3 四分位点と呼ぶ Excelでは関数 PERCENTILE( データ範囲, 率 ) を使って求める 23

( 例 ) 1000 個の損失データが観測されている場合 99% 点というのは損失額を小さい順に並べて 990 番目になるデータ値のこと順位百分位損失額 985 番目 98.5% 529 986 番目 98.6% 558 987 番目 98.7% 589 988 番目 98.8% 618 989 番目 98.9% 621 990 番目 99.0% 632 991 番目 99.1% 654 992 番目 99.2% 671 993 番目 99.3% 698 994 番目 99.4% 703 995 番目 99.5% 712 996 番目 99.6% 776 997 番目 99.7% 794 998 番目 99.8% 810 999 番目 99.9% 831 1000 番目 100.0% 869 99% 24

99%VaR は文字通り 99 パーセント点のことです 99% 小大 99 パーセント点損失額 25

2. 基本統計量 (2 変量 ) (1) 散布図 (2) 共分散 (3) 相関係数 (4) 相関行列 26

以下のような 2 変量の関係を調べるためには散布図を書くのが直感的に理解しやすい東証 TOPIX 10 年割引国債 10 日間変化率 10 日間変化率 (X) (Y) 200X/9/29 0.785-0.098 200X/9/28 1.194 0.010 200X/9/27 0.319 0.177 200X/9/26-2.994 0.315 200X/9/25-3.783 0.688 200X/9/22-3.139 0.560 200X/9/21-3.894-0.088 200X/9/20-5.040 0.295 200X/9/19-3.538-0.010 200X/9/15-2.474 0.098 (1) 散布図 27

株価変化率と国債価格変化率との関係 Ⅱ Ⅳ のエリアに分布が多い株価変化率がプラス ( マイナス ) のとき国債価格変化率はマイナス ( プラス ) となる傾向がある Ⅱ 2.500 2.000 1.500 1.000 Ⅰ 国債 10 日間変化率 0.500 0.000-15.000-10.000-5.000 0.000-0.500 5.000 10.000-1.000-1.500 Ⅲ -2.000-2.500 東証 TOPIX 10 日間変化率 Ⅳ 28

(2) 共分散 ( 推測統計の立場で記載 ) 共分散は 2 つの変量 (X Y) の間の直線的な比例関係の強さを示す指標 - データの偏差積和を求めてデータ数 -1 で割る - 共分散の単位は Xの持つ単位掛ける Yの持つ単位データの偏差積和 COV(X Y) = = データ数 -1 (X 1 -X)(Y 1 -Y)+(X 2 -X)(Y 2 -Y)+ +(X N -X)(Y N -Y) N-1 Excel では関数 COVAR( データ範囲 (X) データ範囲 (Y)) を使って求める ( 注 )Excel ではデータの偏差積和を N-1 ではなく N で割って共分散を定義している ( 記述統計の立場で定義している ) ため別途調整を行う必要がある 29

偏差積和 = (X 1 -X)(Y 1 -Y)+ (X 2 -X)(Y 2 -Y)+ +(X N -X)(Y N -Y) Ⅰ Ⅲ のエリアに多く分布偏差積和 > 0 : 正の相関 Ⅱ Ⅳ のエリアに多く分布偏差積和 < 0 : 負の相関 (X i -X)(Y i -Y)<0 Ⅱ Ⅰ (X i -X)(Y i -Y)>0 Y Y i X i (X i -X)(Y i -Y)>0 Ⅲ Ⅳ (X i -X)(Y i -Y)<0 X 30

(3) 相関係数相関係数は 2 つの変量 (X Y) 間の直線的な比例関係の強さを示す指標共分散を 2 つの標準偏差の積で割って定義する - 相関係数は-1~+1までの値をとる単位を持たない無名数 - 相関係数の定義にはデータ数 Nが含まれていない ( 定義は1 通りのみ ) COV(X Y) ρ(x Y) = σ(x) σ(y) = (X 1 -X)(Y 1 -Y)+ +(X N -X)(Y N -Y) (X 1 -X) 2 + +(X N -X) 2 (Y 1 -Y) 2 + +(Y N -Y) 2 Excelでは関数 CORELL( データ範囲 (X) データ範囲 31 (Y)) を使って求める

相関係数と散布図 3 3 2 2 ρ=1.0 ( 正の完全相関 ) 1 0-3 -2-1 0 1 2 3-1 -2 1 0-3 -2-1 0 1 2 3-1 -2 ρ=-1.0 ( 負の完全相関 ) -3-3 3 3 2 2 1 1 ρ=0.7 0-3 -2-1 0 1 2 3 0-3 -2-1 0 1 2 3 ρ=-0.7-1 -1-2 -2-3 -3 3 相関係数の定義 ρxy= COV(X,Y)/σxσy COV(X,Y) : X,Y の共分散 =(1/N-1)*Σ(Xt-EX)(Yt-EY) σx : Xの標準偏差 EX : Xの平均値 σy : Yの標準偏差 EY : Yの平均値 2 1 0-3 -2-1 0 1 2 3-1 -2-3 ρ=0 ( 無相関 ) 32

(4) 相関行列と分散共分散行列太枠内が相関行列 X 3 ρ(x 3 X 1 ) ρ(x 3 X 2 ) 1 ρ(x 1 X 2 ) X 2 X 3 X N X 1 X 1 1 ρ(x 1 X 2 ) ρ(x 1 X 3 ) ρ(x 1 X N ) X 2 ρ(x 2 X 1 ) 1 ρ(x 2 X 3 ) ρ(x 2 X N ) X N ρ(x N X 1 ) ρ(x N X 2 ) ρ(x N X 3 ) ρ(xi Xi)=1: 同じ変量 (Xii ) 同士の相関は 1 1 ρ(x i X j )=ρ(x j X i ) : 2つの変量 (X i X j ) の順序を変えて計算しても相関係数の値は同じ 33

太枠内が分散共分散行列 X 2 X 3 X N X 1 V X1 COV(X 1 X 2 ) COV(X 1 X 3 ) COV(X 1 X N ) X 2 COV(X 2 X 1 ) V X2 COV(X 2 X 3 ) COV(X 2 X N ) X 3 X 1 COV(X 3 X 1 ) COV(X 3 X 2 ) V X3 COV(X 1 X 2 ) X N COV(X N X 1 ) COV(X N X 2 ) COV(X N X 3 ) V XN 34

VaRの計測手法として分散共分散法の説明をします VaRの計測において分散共分散行列相関行列が重要な働きをします 35

Ⅲ.VaR の計測と検証より分散共分散法 ( デルタ法 ) による計算例 2 - リスクファクターが 2 つのケース VaRの計算シート分散共分散法 ( デルタ法 ) ポートフォリオ株式投信 100 億円単独 VaR 標準偏差信頼係数感応度 10 年割引国債 100 億円株式投信 9.00 = 3.8686 2.33 100 割引国債 1.99 0.8568 2.33 100 保有期間 10 日信頼水準 99.00 % ポートVaR 単純合算 10.99 1 観測データ 250 日相関考慮後 8.35 2 1>2: ポートフォリオ効果東証 TOPIX 10 年割引国債投信 VaR 国債 VaR 相関行列 10 日間変化率 10 日間変化率 9.00 1.99 1-0.4233 9.00 投信 VaR 2006/9/29 0.785-0.098-0.4233 1 1.99 国債 VaR 2006/9/28 1.194 0.010 2006/9/27 0.319 0.177 行列計算式 2006/9/26-2.994 0.315 8.1560-1.8162 9.00 2006/9/25-3.783 0.688 1.99 2006/9/22-3.139 0.560 行列計算式 2006/9/21-3.894-0.088 VaR 2 : 69.78 2006/9/20-5.040 0.295 VaR : 8.35 2006/9/19-3.538-0.010 2006/9/15-2.474 0.098 投信感応度国債感応度分散共分散行列 2006/9/14-2.248-0.197 100.00 100.00 14.96626-1.3938 100.00 投信感応度 2006/9/13-1.822 0.187-1.3938 0.7364709 100.00 国債感応度 2006/9/12-1.875 0.403 2006/9/11-0.235 0.433 行列計算式 2006/9/8 0.007 0.118 1357.2481-65.7303 100.00 2006/9/7-0.591 1.179 100.00 2006/9/6 0.155 1.228 行列計算式 2006/9/5 0.582 1.051 ポート分散 : 12.92 ( 単位調整 ) 2006/9/4 1.534 1.296 ポート標準偏差 : 3.59 2006/9/1-0.495 1.964 信頼係数 2.33 2006/8/31 0.184 1.837 ポートVaR 8.36 36

3. 確率変数と確率分布 (1) 確率変数 (2) 確率分布 - 確率密度関数分布関数 (3) 様々な確率分布 - 一様分布正規分布対数正規分布ポワソン分布 2 項分布 (4) 確率変数の独立 37

(1) 確率変数予め定まった確率にしたがって値が変動する数のことを確率変数という ( 例 ) サイコロを振ったときに出る目の数離散的な確率変数サイコロの目 (X) 1 2 3 4 5 6 確率 1/6 1/6 1/6 1/6 1/6 1/6 確率 1/6 1 2 3 4 5 6 X 38

株価金利為替等の変化率を確率変数として捉えることも可能連続的な確率変数確率下落 (-) X X X X X 3 X 2 X 0 ( 現在値 ) X 1 上昇 (+) X 39

その他の確率変数 VaRを250 回計測して VaRを超える損失が発生する回数事件事故発生に伴う損失の発生額 (1 回当たり ) 事件事故の年間発生件数個別企業の信用状態 40

(2) 確率分布確率分布を表わすとき 2 種類の関数がある 1 確率密度関数確率変数 (X) がある値をとる確率 ( 確率密度 ) を表わす関数 2 分布関数 ( 累積確率密度関数 ) 確率変数 (X) がある値以下になる確率を表わす関数 41

( 例 ) 数直線上で 0 から 1 までの値をランダムにとる確率変数 (X) を考える X は 0~1 の間で無限の値をとる可能性がある X が 0.7 の値をとる確率はゼロ X が 0.7 以下の値をとる確率は 0.7( 斜線部の面積 ) 確率密度関数 f(x 0 )= 1 f(x) 分布関数確率は面積で捉える 1 F(X) 0.7 面積 F(X 0 )= 0.7 0.7 1( 確率密度 ) 0 X 0 =0.7 1 X 0 X 0 = 0.7 1 X X が 0.7 の値をとる確率密度は 1 42

( 参考 ) 人口と人口密度 f(x) : 人口密度 ( 万人 /km 2 ) F(X): 人口 ( 万人 ) 人口は面積で表される X : 各地域の広さ (km 2 ) X : 各地域の広さ (km 2 ) 43

より一般的に概念図で示すと確率密度関数 f(x) 斜線部の面積積分 100% 縦軸上の点分布関数 F(X) P% P% X X 0 となる確率 X=X 0 となる確率 ( 確率密度 ) 0% X 0 X X X 0 44

(3) 様々な確率分布一様分布 : ある区間の中の値が同じ確率で生起する分布 f(x) 確率密度関数 F(X) 分布関数 1/(b-a) 1.2 1 0.8 0.6 0.4 0.2 X a b 0 1 0 X 一様分布にしたがう乱数 ( 一様乱数 ) は Excel 関数 RAND() を使って生成することができる 45

正規分布 : 左右対称の釣鐘型をした確率分布平均 (μ) 標準偏差(σ) を与えると分布の形状が決まる N(μ,σ 2 ) と表す EXCEL 関数 NORMDIST(X,μ,σ, 関数形式 ) f(x) 確率密度関数 F(X) 分布関数 1 σ=0.5 0.8 0.6 σ=0.5 σ=1 σ=2 0.4 0.2 σ=2 σ=1 平均 (μ)=0 標準偏差(σ)=1の正規分布を標準正規分布と言い N(0,1) と表す 46 0 μ X μ X

確率変数 X が標準正規分布にしたがうとき確率変数 σx+μ は正規分布にしたがう f(x) 確率密度関数 X ~ N(0,1) σx ~ N(0, σ 2 ) σx+μ ~ N(μ, σ 2 ) 0 μ X 47

確率変数 X が正規分布にしたがうとき確率変数 Δ X+ 定数項は正規分布にしたがう f(x) 確率密度関数 X ~ N(μ, σ 2 ) 標準偏差が Δ 倍になる Δ X + 定数項 ~ N(Δ μ+ 定数項, (Δσ) 2 ) μ Δ μ+ 定数項 X 平均値が移動する 48

正規分布の特徴平均からどれだけ離れているか ( 標準偏差の何倍か ) という情報から X 以下の値をとる確率が分かる例えば X が N(0,σ 2 ) の正規分布にしたがって生起するとき X σとなる確率は 84.1% X 2σとなる確率は 97.7% X 2.33σとなる確率は 99.0% X 3σとなる確率は 99.9% となることが知られている 99% σ 2σ 99% 点 X このとき σ の前に付いている係数を信頼係数という 2.33σ 正規分布は Xが信頼係数 σ 以下となる確率が分かる便利な確率分布の1つ 49

株価金利為替等の変化率は正規分布にしたがうと想定されることが多い - しかし実際の分布をみると正規分布と比較して歪み偏りやファットテール ( 注 ) 東証 TOPIX 日次変化率の分布が観察されることも少なくない ( 注 ) 裾野部分の分布が厚くなることをいう 50 45 40 35 30 25 20 ファットテール 15 10 5 0 実分布正規分布 50

対数正規分布 : 左右非対象片側に裾野が長いファットテールな分布変数 X の対数値 (logx) が正規分布にしたがうとき変数 X は対数正規分布にしたがうと言う logx の平均 (μ) logx の標準偏差 (σ) を与えると分布の形状が決まる EXCEL 関数 LOGNORMDIST(X,μ,σ) f(x) 確率密度関数 0.1 F(X) 分布関数 1 0.08 0.06 logx の平均 = 0 logx の標準偏差 = 1 0.8 0.6 logx の平均 = 0 logx の標準偏差 = 1 0.04 0.4 0.02 0.2 0 X 0 51 X

ポワソン分布 : 所与の領域あるいは所与の時間内において 0 回 1 回 2 回 3 回と発生する事象がちょうど K 回発生する確率を示す平均発生回数 (λ 回 ) を与えると分布の形状が決まる EXCEL 関数 POISSON(K,λ, 関数形式 ) f(k) 確率密度関数 F(K) 分布関数 0.3 0.25 平均発生回数 λ=2 回 1.2 1 平均発生回数 λ=2 回 0.2 0.8 0.15 0.6 0.1 0.4 0.05 0.2 0 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20 K 0 52 K

講義 (Ⅲ.) の中で市場 VaR を計測 ( 分散共分散法 ) するとき正規分布を利用する例をあげます信用 VaR を計測 ( モンテカルロシミュレーション法 ) するとき正規分布を利用する例をあげますオペリスク VaR を計測 ( モンテカルロシミュレーション法 ) するとき対数正規分布とポワソン分布を利用する例をあげます実務的にはフィットのよい別の確率分布を利用することもあります 53

2 項分布 : 結果が 2 通りある試行 ( 実験 ) を N 回繰り返したとき片方の結果が起こる回数 (K) の確率分布試行回数 (N 回 ) と片方の結果が起きる確率 (p) を与えると分布の形状が決まる ( 例 ) サイコロを 10 回振って 1 の目が出る回数 (K) f(k) 確率密度関数 F(K) 分布関数 0.4 1 0.2 N=10,p=1/6 0.8 0.6 0.4 N=10,p=1/6 0.2 0 K 0 2 4 6 8 10 0 2 4 6 8 10 0 K 1 の目が出る回数 1 の目が出る回数 54

ある事象が起きる確率は p N 回の試行のうち K 回はある事象が起きるある事象が起きない確率は 1-p N 回の試行のうち N-K 回はある事象は起きない 2 項分布 (Excel 関数 ) BINOMDIST(K,N,p,false) = N C K p K (1-p) N-K N 回の試行の中からある事象が起きるK 回の試行を取り出す組み合わせ N C K = N (N-1) (N-K+1) K (K-1) 2 1 ( 例 ) サイコロを 10 回振ったときに 2 回 1 の目が出る確率 BINOMDIST(2,10,1/6,false) = 10 C 2 (1/6) 2 (5/6) 10-2 = 10 9 2 1 (1/6)2 (5/6) 8 55

講義の中で VaR 計測モデルのバックテストを行なうとき 2 項分布を利用します 56

(4) 確率変数の独立定義確率変数 X 1 X 2 が互いに影響されずそれぞれの確率分布にしたがって値をとるとき確率変数 X 1 X 2 は互いに独立であるという 57

( 例 ) サイコロを振ったときに出る目の数 1 回目 : X 1 = 1 2 回目 : X 2 = 1 3 回目 : X 3 =? サイコロの目 (X 3 ) 1 2 3 4 5 6 確率 1/6 1/6 1/6 1/6 1/6 1/6 2 回続けて 1 の目が出ても 3 回目の結果には影響を及ぼさない 3 回目はいずれの目が出る確率も 1/6 58

株価金利為替等の変化について互いに独立かつ同一の確率分布にしたがって変動していると考えられることが多い i.i.d. の想定確率変数 X の推移とその確率分布 X Xs X X X 0? Xt X t 0 過去現在将来 59

独立の定義確率変数 X t X s の確率関数に関して以下の式が成り立つとき確率変数 X t X s は互いに独立と言う P(X t =a X s =b) = P(X t =a)p( X s =b) i.i.d. の定義確率変数 X t X s について以下の 2 つの条件を満たすとき確率変数 X t X s は互いに i.i.d. ( 注 ) であると言う ( 注 )independently and identically distributed 1 確率変数 X t X s は互いに独立である 2 確率変数 X t X s は同一の確率分布にしたがう 60

定理確率変数 X 1 X 2 が互いに独立のとき以下のことが成り立つ 1 確立変数 X 1 X 2 の期待値はそれぞれの確率変数の期待値の積になる E(X 1 X 2 )=E(X 1 )E(X 2 ) 2 確率変数 X 1 +X 2 の分散はそれぞれの確率変数の分散の和に等しい V(X 1 +X 2 )=V(X 1 )+V( X 2 ) 3 確率変数 X 1 と X 2 は無相関である ρ(x 1 X 2 )=0 ( 証明省略 ) 61

ルート T 倍ルール日次ベースの対数変化率 or 変化幅を X 1 X 2 X 3 X T とすると T 日間の対数変化率 or 変化幅は X 1 +X 2 +X 3 + +X T と表される各期のリスクファクター (X 1,X 2,X 3, X T ) が互いに独立かつ同一の確率分布にしたがうと想定する i.i.dの定義日次ベースの対数変化率 or 変化幅 X 1 X 2 X 3 X T の分散を σ 2 標準偏差を σ とすると T 日間の対数変化率 or 変化幅分散は T σ 2 標準偏差は T σとなる X 1 +X 2 +X 3 + +X T の 62

( 参考 ) 対数変化率の定義日次対数変化率 log X t X t-1 10 日間対数変化率 X t - X t-1 X t = -1 X t-1 X t-1 log X t X t - X t-10 X t = -1 X t-10 X t-10 X t-10 対数変化率は通常の変化率と近似的に等しいことが知られている log( 自然対数 ) は Excel では関数 LN( ) で与えられる 63

対数変化率の特徴対数変化率は同率の低下上昇により元の値に戻る 10 日間対数変化率は日次対数変化率 (10 日分 ) の和となる変化率 ( 日次 ) 対数変化率 ( 日次 ) 対数変化率 ( 日次 ) 100 0.0101 0.0101 X10 100 0.2877 99-0.0100-0.0101 X9 75-0.4700 100 0.0526 0.0513 X8 120 1.3863 95-0.0500-0.0513 X7 30-0.6931 100 0.1111 0.1054 X6 60-0.9163 90-0.1000-0.1054 X5 150 0.5108 100 0.2500 0.2231 X4 90 1.0986 80-0.2000-0.2231 X3 30-0.6931 100 0.4286 0.3567 X2 60-0.2877 70-0.3000-0.3567 X1 80-0.1178 100 0.6667 0.5108 X0 90 60-0.4000-0.5108 Σlog(X t /X t-1 ) 0.1054 100 1.0000 0.6931 50-0.5000-0.6931 対数変化率 (10 日間 ) 100 log(x10/x0) 0.1054 64

東証 TOPIX 日次変化率の推移 12 8 4 0-4 日次変化率標準偏差 - 標準偏差 -8-12 東証 TOPIX10 日間変化率の推移 12 8 4 0-4 10 日間変化率標準偏差 - 標準偏差 -8-12 65

下図は過去 1 年間のデータをもとに東証 TOPIX 変化率と 1 期前の変化率との相関関係 ( 自己相関 ) をみたもの東証 TOPIX 日次変化率 1 期前 4 3 2 東証 TOPIX 10 日間変化率 1 期前 10 5 1 0-4 -3-2 -1 0-1 1 2 3 4-2 -3-4 相関係数 ρ=0.037 当期 0-15 -10-5 0 5 10-5 -10-15 相関係数 ρ=0.905 - 日次変化率の自己相関は弱いが 10 日間変化率の自己相関は強いことが観察される - 統計的に厳密に検証すると多くの時系列データが ( 日次変化率でみても 10 日間変化率でみても ) 独立とは言えないことが多い 66 当期

基本統計量 Excel 関数日次 10 日間対数変化率対数変化率データ数 COUNT 250 250 平均 AVERAGE 0.063 0.656 分散 VARA 1.540 14.966 標準偏差 STDEVA 1.241 3.869 分散をみると 10 日間対数変化率の分散は日次対数変化率の分散の概ね 10 倍となっている標準偏差をみると 10 日間対数変化率の標準偏差は日次対数変化率の標準偏差の概ね 10 倍 (=3.162 倍 ) となっている 67

ルート T 倍ルール 10 日間対数変化率 X 1 +X 2 + +X T の確率分布日次対数変化率 X の確率分布 - T σ T σ -σ σ 仮定リスクファクターの確率分布は i.i.d. 68

ルート T 倍ルール日次対数変化率日次対数変化率日次対数変化率日次対数変化率 T 日間対数変化率 T σ σ -σ X X X? X - T σ 仮定リスクファクターの確率分布は i.i.d. 69

4. 推定と検定 (1) 推定 (2) 検定 70

(1) 推定母集団の確率分布特性値は誰にも分からない標本の特性値から母集団の特性値を統計的に推測する母集団確率密度関数特性値平均 μ 標準偏差 σ 分散 V VaR など. 推定母集団標本 ( 実現値 ) 特性値平均 μ * 標準偏差 σ * 分散 V * VaR * など 71

(2) 検定一定の確率分布を前提にして推定した値についてその値をとる確率が十分に低いとき偶然珍しいことが起きたと考えるのではなく推定の際に置いた前提が誤っていたと結論付ける 2 推定の前提 ( 確率分布 ) が誤っていたと結論付ける推定の際に前提とした確率分布真の確率分布十分に低い水準 α% 実現値 1 実現する確率が十分に低いと考えられることが起きた 72

( 設問 ) 1 の目がでやすいサイコロがありますサイコロを割ったり X 線透視などをせずサイコロを振るだけでこのサイコロがイカサマかどうかを決めたいと思いますあなたはこのサイコロを 600 回振って何回 1 の目が出たらイカサマだと判断しますか? 120 回でイカサマだと判断しますか? 150 回でイカサマだと判断しますか? 200 回でイカサマだと判断しますか? 300 回でイカサマだと判断しますか? 400 回でイカサマだと判断しますか? 73

( 例 )1 の目がでやすいイカサマサイコロの見付け方このサイコロを振ったとき 1 の目が出る確率は 1/6 であるこのサイコロを 600 回振ったとき 1 の目が? 回以上発生したこのサイコロを振ったとき 1 の目が出る確率が 1/6 だとすると 600 回のうち? 回以上 1 の目が出る確率は十分に低い ( 例えば 0.1% 未満 ) ことが分かるこのサイコロを振ったとき 1 の目が出る確率は 1/6 とは言えない 74

N 回の観測で K 回 1 の目が出る確率 2 項分布 N C K pk (1-p) N-K N=600 回 p=1/6 1-p=5/6 K 回確率確率 K 回以上 0 0.000% 100.000% 0 回以上 100 4.264% 60.278% 100 回以上 110 2.904% 20.634% 110 回以上 120 0.652% 3.051% 120 回以上 130 0.052% 0.184% 130 回以上 140 0.002% 0.004% 140 回以上 150 0.000% 0.000% 150 回以上 160 0.000% 0.000% 160 回以上 170 0.000% 0.000% 170 回以上 180 0.000% 0.000% 180 回以上 190 0.000% 0.000% 190 回以上 200 0.000% 0.000% 200 回以上 300 0.000% 0.000% 300 回以上 400 0.000% 0.000% 400 回以上 500 0.000% 0.000% 500 回以上 600 0.000% 0.000% 600 回以上 75

検定の一般的手続き 1 帰無仮説を立てる 2 帰無仮説が真 (true) であるという仮定の下に検定統計量を決定するただし検定統計量の確率分布は既知とする 3 試行や標本 ( サンプル ) の抽出により検定統計量を計算する 4 検定統計量の実現値 ( 計算値 ) がどの程度の確率でおき得ることかを確認する 5 検定統計量の実現値 ( 計算値 ) が十分に低い確率 ( 有意水準以下 ) でしか置きえないとき帰無仮説を棄却する 76

2 種類の過誤検定では次の 2 通りの過誤 ( エラー ) が起きる可能性があるしたがってバックテストの結果も過誤 ( エラー ) を伴っている可能性がある点注意を要する第 1 種の過誤 ( エラー ) 本当は帰無仮説が正しいのに検定の結果帰無仮説が誤っていると結論付けてしまう第 2 種の過誤 ( エラー ) 本当は帰無仮説が正しくないのに検定の結果帰無仮説が正しいと結論付けてしまう 77

推定に利用した確率分布 = 真の確率分布第 1 種の過誤実現値推定に利用した確率分布 = 真の確率分布第 2 種の過誤実現値 78

VaR 計測モデルのバックテストは検定の考え方に基づいて行います 79

参考文献資料イラスト図解確率統計のしくみが分かる本長谷川勝也著技術評論社初等統計学 P.G. ホーエル著浅井晃村上正康訳培風館日本銀行市場リスク管理の基礎セミナー補足 1 確率統計の基礎金融高度化センター碓井茂樹 80