Microsoft Word - HM-RAJ doc

Similar documents
Akito Niwa Kouya Tochikubo ( ) SI Systems Integration Technology Center, Toshiba Solutions Corporation 1 [1-10] IPA FIPS $[2,

CryptrecReport.dvi

2004 1

経済統計分析1 イントロダクション

第 3 回講義の項目と概要 統計的手法入門 : 品質のばらつきを解析する 平均と標準偏差 (P30) a) データは平均を見ただけではわからない 平均が同じだからといって 同一視してはいけない b) データのばらつきを示す 標準偏差 にも注目しよう c) 平均

基礎統計

情報工学概論

Microsoft Word - apstattext04.docx

自動車感性評価学 1. 二項検定 内容 2 3. 質的データの解析方法 1 ( 名義尺度 ) 2.χ 2 検定 タイプ 1. 二項検定 官能検査における分類データの解析法 識別できるかを調べる 嗜好に差があるかを調べる 2 点比較法 2 点識別法 2 点嗜好法 3 点比較法 3 点識別法 3 点嗜好

Medical3

Microsoft Word - å“Ÿåłžå¸°173.docx

仮説検定を伴う方法では 検定の仮定が満たされ 検定に適切な検出力があり データの分析に使用される近似で有効な結果が得られることを確認することを推奨します カイ二乗検定の場合 仮定はデータ収集に固有であるためデータチェックでは対応しません Minitab は近似法の検出力と妥当性に焦点を絞っています

Medical3

統計的データ解析

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

平成 7 年度数学 (3) あるゲームを 回行ったときに勝つ確率が. 8のプレイヤーがいる このゲームは 回ごとに独 立であるとする a. このゲームを 5 回行う場合 中心極限定理を用いると このプレイヤーが 5 回以上勝つ確率 は である. 回以上ゲームをした場合 そのうちの勝ち数が 3 割以上

Python-statistics5 Python で統計学を学ぶ (5) この内容は山田 杉澤 村井 (2008) R によるやさしい統計学 (

Microsoft Word - Stattext12.doc

Microsoft PowerPoint - statistics pptx

Microsoft Word - Stattext11.doc

Microsoft PowerPoint - Lecture 10.ppt [互換モード]

Chapter カスタムテーブルの概要 カスタムテーブル Custom Tables は 複数の変数に基づいた多重クロス集計テーブルや スケール変数を用いた集計テーブルなど より複雑な集計表を自由に設計することができるIBM SPSS Statisticsのオプション製品です テーブ

カイ二乗フィット検定、パラメータの誤差

<4D F736F F D208D A778D5A8A778F4B8E7793B CC A7795D2816A2E646F6378>

Microsoft PowerPoint - sc7.ppt [互換モード]

日心TWS

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

RSS Higher Certificate in Statistics, Specimen A Module 3: Basic Statistical Methods Solutions Question 1 (i) 帰無仮説 : 200C と 250C において鉄鋼の破壊応力の母平均には違いはな

Microsoft Word - Stattext13.doc

Excelによる統計分析検定_知識編_小塚明_5_9章.indd

ビジネス統計 統計基礎とエクセル分析 正誤表

<4D F736F F D208EC08CB18C7689E68A E F AA957A82C682948C9F92E82E646F63>

<4D F736F F D208EC08CB18C7689E68A E F193F18D8095AA957A C C839395AA957A814590B38B4B95AA957A2E646F63>

Microsoft PowerPoint - e-stat(OLS).pptx

Microsoft PowerPoint - CVM.ppt [互換モード]

講義「○○○○」

情報処理学会研究報告 IPSJ SIG Technical Report Vol.2012-MPS-88 No /5/17 RMT テストの性能検証 ~NIST 乱数検定との比較 ~ 三賀森悠大 1,a) 楊欣 1 糸井良太 1 田中美栄子 1,b) 概要 : 我々が以前に提案した,R

Microsoft PowerPoint - stat-2014-[9] pptx

EBNと疫学

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - statistics pptx

Microsoft Word - apstattext03.docx

PowerPoint プレゼンテーション

今日の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

データ解析

解析センターを知っていただく キャンペーン

Microsoft PowerPoint - Statistics[B]

ANOVA

Microsoft Word - appendix_b

スライド 1

統計学 Ⅱ( 章 ( 区間推定のシミュレーション 母平均 μ の区間推定 X ~ N, のとき X T ~ 自由度 1の t分布 1 自由度 -1のt 分布の97.5% 点 :t.975 P t T t この式に T を代入する t.975 母集団

スライド 1

不偏推定量

ii 3.,. 4. F. (), ,,. 8.,. 1. (75% ) (25% ) =9 7, =9 8 (. ). 1.,, (). 3.,. 1. ( ).,.,.,.,.,. ( ) (1 2 )., ( ), 0. 2., 1., 0,.

Microsoft PowerPoint slide2forWeb.ppt [互換モード]

集中理論談話会 #9 Bhat, C.R., Sidharthan, R.: A simulation evaluation of the maximum approximate composite marginal likelihood (MACML) estimator for mixed mu

Probit , Mixed logit

数値計算法

Microsoft PowerPoint - Econometrics pptx

第7章

JMP による 2 群間の比較 SAS Institute Japan 株式会社 JMP ジャパン事業部 2008 年 3 月 JMP で t 検定や Wilcoxon 検定はどのメニューで実行できるのか または検定を行う際の前提条件の評価 ( 正規性 等分散性 ) はどのメニューで実行できるのかと

統計学 - 社会統計の基礎 - 正規分布 標準正規分布累積分布関数の逆関数 t 分布正規分布に従うサンプルの平均の信頼区間 担当 : 岸 康人 資料ページ :

スライド 1

<4D F736F F D208FAC8A778D5A8A778F4B8E7793B CC81698E5A909495D2816A2E646F6378>

横浜市環境科学研究所

現代日本論演習/比較現代日本論研究演習I「統計分析の基礎」

ii 3.,. 4. F. (), ,,. 8.,. 1. (75%) (25%) =7 20, =7 21 (. ). 1.,, (). 3.,. 1. ().,.,.,.,.,. () (12 )., (), 0. 2., 1., 0,.

Microsoft PowerPoint ppt

異文化言語教育評価論 ⅠA 第 4 章分散分析 (3 グループ以上の平均を比較する ) 平成 26 年 5 月 14 日 報告者 :D.M. K.S. 4-1 分散分析とは 検定の多重性 t 検定 2 群の平均値を比較する場合の手法分散分析 3 群以上の平均を比較する場合の手法 t 検定

Microsoft PowerPoint - 基礎・経済統計6.ppt

<4D F736F F D204B208C5182CC94E497A682CC8DB782CC8C9F92E BD8F6494E48A722E646F6378>

Microsoft Word - apstattext05.docx

確率分布 - 確率と計算 1 6 回に 1 回の割合で 1 の目が出るさいころがある. このさいころを 6 回投げたとき,1 度も 1 の目が出ない確率を求めよ. 5 6 /6 6 =15625/46656= (5/6) 6 = ある市の気象観測所での記録では, 毎年雨の降る

スライド 1

Microsoft PowerPoint - H21生物計算化学2.ppt

Microsoft Word - mstattext03.docx

Microsoft Word - Time Series Basic - Modeling.doc

Microsoft Word - 保健医療統計学112817完成版.docx

<4D F736F F D2090B695A8939D8C768A E F AA957A82C682948C9F92E8>

Microsoft PowerPoint - statistics pptx

スライド 1

母平均 母分散 母標準偏差は, が連続的な場合も含めて, すべての個体の特性値 のすべての実現値 の平均 分散 標準偏差であると考えてよい 有限母集団で が離散的な場合, まさにその意味になるが, そうでない場合も, このように理解してよい 5 母数 母集団から定まる定数のこと 母平均, 母分散,

混沌系工学特論 #5

森林水文 水資源学 2 2. 水文統計 豪雨があった時, 新聞やテレビのニュースで 50 年に一度の大雨だった などと報告されることがある. 今争点となっている川辺川ダムは,80 年に 1 回の洪水を想定して治水計画が立てられている. 畑地かんがいでは,10 年に 1 回の渇水を対象として計画が立て

(3) 検定統計量の有意確率にもとづく仮説の採否データから有意確率 (significant probability, p 値 ) を求め 有意水準と照合する 有意確率とは データの分析によって得られた統計値が偶然おこる確率のこと あらかじめ設定した有意確率より低い場合は 帰無仮説を棄却して対立仮説

統計学の基礎から学ぶ実験計画法ー1

Microsoft PowerPoint - 測量学.ppt [互換モード]

今回 次回の要点 あぶない 時系列データ解析は やめましょう! 統計モデル のあてはめ Danger!! (危 1) 時系列データの GLM あてはめ (危 2) 時系列Yt 時系列 Xt 各時刻の個体数 気温 とか これは次回)

データ科学2.pptx

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

スライド タイトルなし

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

ii 2. F. ( ), ,,. 5. G., L., D. ( ) ( ), 2005.,. 6.,,. 7.,. 8. ( ), , (20 ). 1. (75% ) (25% ). 60.,. 2. =8 5, =8 4 (. 1.) 1.,,

<4D F736F F D208EC08CB18C7689E68A E F1939D8C E82E646F63>

第1回

モジュール1のまとめ

MINITAB アシスタントホワイトペーパー本書は Minitab 統計ソフトウェアのアシスタントで使用される方法およびデータチェックを開発するため Minitab の統計専門家によって行われた調査に関する一連の文書群を構成する文書の 1 つです ゲージ R&R 分析 ( 交差 ) 概要 測定システ

Microsoft PowerPoint - ch04j

生命情報学

Transcription:

NIST 及び DIEHARD テストによる RPG100 乱数評価 FDK( 株 )RPG 推進室 2003/12/16 導入 RPG100 から生成される乱数を 2 つの有名なテストを用いて評価します 一方は米国機関 NIST により公開されている資料に基づくテストで 他方は Marsaglia 博士により提供されているテストです 乱数を一度テストしただけでは それが常にテストを満足する乱数性を持っていることを確認できないことから ここでは 1Gbit の乱数列を用いてそれぞれのテストを複数回行います そして これらテストの合格率の妥当性と PValue の一様性を調べることで乱数性の評価をします このテストは 電圧 3.3V 温度 25 乱数生成クロック250KHzの条件で RPG100 サンプル一つから取得した乱数について行われています 1.N I S T Special Publication 80022 乱数テスト NIST Special Publication 80022( 以下 NIST SP80022 と略す ) は NIST( 米国商務省標準技術研究所 ) により発行された資料で そのテストプログラムも入手することができます [1] テストに用いられる乱数データ量は 指定された範囲内でユーザーが決めることが出来ますが 本資料では NIST SP80022 を一回行うのに用いる乱数量を1Mbit としています 評価はテスト1000 回で行います 11. テストの種類とパラメータの設定 NIST SP80022 では16 種類の乱数テストが設けられており それぞれのテストの有意水準は1% となっています これらのテストのうち幾つかはパラメータの設定が必要となっており ここでの設定を下記テーブルに示します また 情報処理振興事業協会 (IPA) で採択された資料には たくさんある乱数テストの中からミニマムセットを決めたものがあります [2] 以下 このミニマムセットに該当するテストには * マークを付けます テストは16 種類ありますが そのうちの LempelZiv Compression と Discrete Fourier Transform (Spectral) Test の統計量は NIST で期待した分布とずれていることが判り PValue は一様とならず テストの有意水準も設定値である1% となっていません ([3], 及び [2] の p40 参照 ) したがって 本資料ではこれらのテストを除外し 14 種類のテストをもって乱数性の評価をします 乱数テスト名 (* はミニマムセット ) テストパラメータ Frequency (Monobit) Test *Frequency Test within a Block m=20000 Runs Test *Test for the Longest Run of Ones in a Block M=10000 Binary Matrix Rank Test 1

Discrete Fourier Transform (Spectral) Test Nonoverlapping Template Matching Test m=9, B=000000001 Overlapping Template Matching Test m=9 Maurer s Universal Statistical Test L=7, Q=1280 LempelZiv Compression Test *Linear Complexity Test M=500 *Serial Test m=5, Ψ 2 Approximate Entropy Test m=5 *Cumulative Sums (Cusum) Test Forward Random Excursions Test X= +3, 3 Random Excursions Variant Test X= +3, 3 本資料では NIST テストを1000 回行って得られた PValue の値を用いて乱数性を評価します ただし Random Excursions Test および Random Excursions Variant Test ではランダムウォークのサイクル数が J<500であった場合にテストが中止されます そのため1000 回の NIST テストを行っても これらのテストが行われるのはそれより少ない回数なります ( テストが中止される確率は理論的に38% となっています ) テストの標本数を1000に統一するため これら 2 つのテストでは X= +3 の PValue500 個と X= 3の PValue500 個を合わせて1000 個の標本とします 12. 各テストの合格率評価 NIST SP80022 では 各々のテストについて有意水準を1% としています これは理想的な乱数をテストした場合に合格と判断される確率が99%( 不合格 1%) であるということです ここではテストを1 000 回行い RPG100の乱数がこれら有意水準 1% のテストに合格する割合の妥当性について評価します 標本数を n テストに合格する確率を p 合格した回数を x とします 合格数 x は試行回数 n 確率 p の二項分布に従いますが n が大きいときは近似的に期待値 m = np 標準偏差 σ = np( 1 p) の正規分布 とみなすことができます ここで z ( x m) / σ と置くと この変数 z は期待値ゼロ 標準偏差 1 の標 準正規分布 N(0,1) に従います 合格数 x を標準化変数 z をつかって書くと x = m + zσ となり 両辺を n で割ると p x / n = p + z p(1 p) / n (1) となります 式から明らかですが p は測定による合格率となっています NIST では 3 z 3 となる 範囲に p が入った時に 合格率は妥当 もしくは テストされた乱数の質は適正 と判断することが推奨 されており これは有意水準が約 0.27% のテストとなっています 各テストに合格する確率は p=0.99 であり 標本数は n=1000 なので 乱数の質が適正であると判断される p の範囲は p = 0.99 ± 3 0.99 0.01/1000 = 0.99 ± 0.0094392 (2) で与えられます 結果は次の通りです 2

標本数 n=1000 採択域 0.980561 p 0.999439 乱数テスト名 (* はミニマムセット ) 合格率 p 結果 Frequency (Monobit) Test 0.994 SUCCESS *Frequency Test within a Block 0.983 SUCCESS Runs Test 0.992 SUCCESS *Test for the Longest Run of Ones in a Block 0.989 SUCCESS Binary Matrix Rank Test 0.989 SUCCESS Nonoverlapping Template Matching Test 0.993 SUCCESS Overlapping Template Matching Test 0.988 SUCCESS Maurer s Universal Statistical Test 0.991 SUCCESS *Linear Complexity Test 0.991 SUCCESS *Serial Test 0.989 SUCCESS Approximate Entropy Test 0.991 SUCCESS *Cumulative Sums (Cusum) Test 0.985 SUCCESS Random Excursions Test 0.990 SUCCESS Random Excursions Variant Test 0.995 SUCCESS 13. 各テストの PValue 一様性評価乱数が理想的であれば 各テストのアウトプットである PValue は [0,1) の間で一様に出現することが期待されます ここでは1000 回のテストで得られた PValue を等確率 1/10となるような10 区間に分け それぞれの度数についてχ 2 検定を行います ( 一様分布に対する適合度の検定 ) この場合 χ 2 分布の自由度は9となります ここで F i を i 番目の区間に入った PValue の個数とすると χ 2 統計量は 次式で与えられます 10 2 2 ( Fi n /10) χ = (3) n /10 i= 1 NIST では 有意水準 0.01% での判断を推奨しており 対応するχ 2 値の範囲は χ 2 33.72 です 採択域 χ 2 33.72 乱数テスト名 (* はミニマムセット ) χ 2 値 結果 Frequency (Monobit) Test 5.20 SUCCESS *Frequency Test within a Block 10.51 SUCCESS Runs Test 2.64 SUCCESS *Test for the Longest Run of Ones in a Block 10.33 SUCCESS Binary Matrix Rank Test 17.84 SUCCESS Nonoverlapping Template Matching Test 5.18 SUCCESS Overlapping Template Matching Test 9.40 SUCCESS 3

Maurer s Universal Statistical Test 20.53 SUCCESS *Linear Complexity Test 13.87 SUCCESS *Serial Test 9.978 SUCCESS Approximate Entropy Test 14.02 SUCCESS *Cumulative Sums (Cusum) Test 4.67 SUCCESS Random Excursions Test 5.64 SUCCESS Random Excursions Variant Test 6.18 SUCCESS 14. テスト全体の合格率評価 12 では テスト毎に合格数を集計して 乱数の良し悪しを判断しましたが ここではテスト全体での合格率について評価します 方法は同じですが 標本数が n=14000 となります 乱数の質が適正であると判断される p の範囲は式 (1) より p = 0.99 ± 3 0.99 0.01/14000 = 0.99 ± 0.0025228 (4) となります 標本数 n=14000 採択域 0.987477 p 0.992523 乱数テスト名合格率 p 結果 NIST SP80022 0.990 SUCCESS 15. テスト全体の PValue 一様性評価 13 では テスト毎に PValue 一様性を調べましたが ここではテスト全体の PValue についてその一様性を調べます 統計量は式 (3) で与えられますが その際の標本数は n=14000 となります 採択域 χ 2 33.72 乱数テスト名 χ 2 値結果 NIST SP80022 12.85 SUCCESS 2.DIEHARD 乱数テスト フロリダ州立大学統計学部の Marsaglia 博士による乱数テストです [4] 18 種類の統計テストで構成されており 乱数が理想的であれば PValue が [0,1) の間に一様に分布するとしていますが NIST 80022 の様に明確な判定基準は設けられていません テストに必要な乱数データ量は80Mbit で 本資料ではこれを1 2 回行って評価を行います 21. テストの種類と PValue の数 DIEHARD では18 種類の乱数テストが設けられておりますが 各テストで出力される PValue は複数あり その数もテスト毎に異なります テスト種と PValue の個数は以下の通りです DIEHARD から出力される PValue は220 個あり テストは12 回行われていますので 全 PValue 数は2640 個となります 4

乱数テスト名 (* はミニマムセット ) PValue の数 *The Birthday Spacings Test 10 *The Overlapping 5Permutation Test 2 The Binary Rank Test for 31x31 Matrices 1 The Binary Rank Test for 32x32 Matrices 1 The Binary Rank Test for 6x8 Matrices 26 *The Bitstream Test 20 *The OverlappingPairsSparseOccupancy Test 23 *The OverlappingQuadruples 28 SparseOccupancy Test The DNA Test 31 *CountThe1 s Test on a Stream of Bytes 2 *CountThe1 s Test for Specific Bytes 25 The Parking Lot Test 11 The Minimum Distance Test 1 The 3DSpheres Test 21 The Squeeze Test 1 The Overlapping Sums Test 11 The Runs Test 4 The Craps Test 2 23. テスト合格率評価各テストの有意水準を NIST と同じく1% とし テスト合格率について全 PValue を用いて評価します 標本数は n=2640 となります 判断基準となる合格率 p の範囲は式 (1) より p = 0.99 ± 3 0.99 0.01/ 2640 = 0.99 ± 0.0058094 (5) となります 標本数 n=2640 採択域 0.984191 p 0.995809 乱数テスト名合格率 p 結果 DIEHARD 0.989 SUCCESS 次に 0.025 PValue 0.975 を合格とした場合についても評価します この場合の有意水準は5%( 合格率 p=95%) なので 判断基準となる合格率 p の範囲は式 (1) より p = 0.95 ± 3 0.95 0.05 / 2640 = 0.95 ± 0.0127252 (6) となります 標本数 n=2640 採択域 0.937275 p 0.962725 乱数テスト名合格率 p 結果 DIEHARD 0.950 SUCCESS 5

24. PValue 一様性評価 得られた PValue について一様性を調べます 統計量は式 (3) で与えられますが その際の標本数は n=2640 となります 採択域 χ 2 33.72 乱数テスト名 χ 2 値 結果 DIEHARD 4.57 SUCCESS 3. 評価まとめ NIST 80022 および DIEHARD テストを複数回行い その合格率と PValue の一様性についてテストを行いました 合格率のテストは有意水準 0.27% PValue の一様性のテストは有意水準 0.01% で評価し RPG100の乱数はこれらのテストに不合格となるものはありませんでした RPG100の乱数は十分な乱数性をもっていると考えられます 参考文献 [1] NIST, Special Publication 80022, A STASTICAL TEST SUITE FOR RANDOM AND PSEUDO RANDOM NUMBER GENERATORS FOR CRYPTOGRAPHIC APPLICATIONS, 2001. ( http://csrc.nist.gov/rng/ ) [2] IPA, 調査報告書, 疑似乱数検証ツールの調査開発, 2003. ( http://www.ipa.go.jp/security/fy14/crypto/pseudo_rundum/rundum_inve.pdf ) [3] 金成主, 梅野健, 長谷川晃朗, NIST のランダム性評価テストについて, 電子情報通信学会信学技報, Vol.103, No.449, pp2127, 2003. [4] G. Marsaglia, DIEHARD. ( http://stat.fsu.edu/~geo/diehard.html ) 6