第三回 QISS シンポジウム 宇宙線によるソフトエラー : 社会的インパクトと評価技術 2019 年 12 月 07 日 ( 株 ) ソシオネクスト松山英也 Copyright 2019

Similar documents
Isotope News 2015年7月号 No.735

(Microsoft PowerPoint _RCNP\214\244\213\206\211\357_\214\366\212J\216\221\227\277.ppt)

Microsoft Word - TC4011BP_BF_BFT_J_P8_060601_.doc

Microsoft Word - TC4013BP_BF_J_P9_060601_.doc

TC74HC00AP/AF

Microsoft Word - TC4017BP_BF_J_P10_060601_.doc

TC74HC14AP/AF

Microsoft Word - TC74HCT245AP_AF_J_P8_060201_.doc

Microsoft Word - TC74HC245_640AP_AF_P8_060201_.doc

Microsoft Word - TA79L05_06_08_09_10_12_15_18_20_24F_J_P11_070219_.doc

Microsoft Word - TC4538BP_BF_J_2002_040917_.doc

2SK2313

Microsoft Word - TC74HC107AP_AF_J_P9_060201_.doc

uPC1093 DS

uPC258,4558 DS

富士通セミコンダクター株式会社発表資料

TC7WT126FU

TLP521-1,TLP521-2,TLP521-4 東芝フォトカプラ赤外 LED + フォトトランジスタ TLP521-1,TLP521-2,TLP521-4 電子計算機の I / O インタフェース システム機器や計測器のノイズカット 各種コントローラ 複写機 自動販売機 電位が異なる回路間の信

EC-1 アプリケーションノート 高温動作に関する注意事項

目次 1: 安全性とソフトウェア 2: 宇宙機ソフトウェアにおける 安全 とは 3:CBCS 安全要求とは 4: 宇宙機ソフトウェアの実装例 5: 安全設計から得た新たな知見 6: 今後 2

TC7SET08FU_J_

TC74HCT245AP/AF

TC74HC245,640AP/AF

TC7SET125FU_J_

CSM_XS2_DS_J_11_2

CSM_G5Q_DS_J_1_14

OM

TC74HC4017AP/AF

CSM_G7L_DS_J_1_15

CSM_G6J-Y_DS_J_1_8

QOBU1011_40.pdf

TC7SHU04FU_J_

TC74HC109AP/AF

TC74HC112AP/AF

統合的高信頼化設計のためのモデル化と検出 訂正 回復技術 研究代表者安浦寛人九州大学大学院システム情報科学研究院 DVLSI 領域会議 (2011/7/2) DVLSI 安浦チーム 1 研究の目標 さまざまな種類のエラー ( 製造故障 ソフトエラー タイミングエラー 設計誤り 不完全な仕様に基づく誤

TC7SZU04AFS_J_

RS-422/485 ボード取扱説明書 RS-422/485 ボード取扱説明書 Revision 0.3 コアスタッフ株式会社技術部エンジニアリング課 Copyright 2009 Core Staff Co.,Ltd. All Rights Reserved - 1 of 17

A23 A24 A25 A26 A27 A28 A38 A39 燃料再処理 A40 A41 A42 A43 第 3 日 休 憩 総合講演 報告 3 日本型性能保証システム 燃料再処理 A29 A30 A31 A32 A33 A34 A35 燃料再処理 A36 A37 燃料再処理 A44 A45 A4

重イオンビームを用いたシングルイベント効果の評価技術

ムーアの法則に関するレポート

<4D F736F F D2097CA8E718CF889CA F E F E2E646F63>

日程表 mcd

The DatasheetArchive - Datasheet Search Engine

Microsoft Word - 80c08d3be78df73e f4a4e8a8940ab000fdaa2e doc

Microsoft PowerPoint - SDF2007_nakanishi_2.ppt[読み取り専用]

HD74HCT564, HD74HCT574

平成22年度「技報」原稿の執筆について

4Kチューナー(録画)_TU-BUHD100

Microsoft PowerPoint - 3.3タイミング制御.pptx

国土技術政策総合研究所 研究資料

Microsoft Word - f203f5da7f8dcb79bcf8f7b2efb0390d406bccf30303b doc

Microsoft Word - プレス原稿_0528【最終版】

Microsoft PowerPoint - 9.Analog.ppt

首都大学東京 新技術説明会 日時 : 平成 27 年 9 月 25 日 ( 金 ) 場所 :JST 東京別館ホール ノイズ耐性フリップフロップの開発と 信頼性要求電子機器への応用可能性 首都大学東京システムデザイン研究科情報通信システム学域 教授 三浦幸也

TC4093BP/BF

Microsoft Windows Windows Server Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Oracle と Java は Oracle Corporation 及びその子会社 関

"ソフトウェア カフェテリアサービス向けソフトウェア説明書

Microsoft PowerPoint - 6.memory.ppt

<30345F D834F E8F48816A2D8AAE90AC2E6D6364>

ISO9001:2015規格要求事項解説テキスト(サンプル) 株式会社ハピネックス提供資料

Microsoft PowerPoint - semi_ppt07.ppt

基本的なノイズ発生メカニズムとその対策 電源 GND バウンス CMOS デジタル回路におけるスイッチング動作に伴い 駆動 MOS トランジスタのソース / ドレインに過渡的な充放電電流 及び貫通電流が生じます これが電源 GND に流れ込む際 配線の抵抗成分 及びインダクタンス成分によって電源電圧

第 2 日 放射性廃棄物処分と環境 A21 A22 A23 A24 A25 A26 放射性廃棄物処分と環境 A27 A28 A29 A30 バックエンド部会 第 38 回全体会議 休 憩 放射性廃棄物処分と環境 A31 A32 A33 A34 放射性廃棄物処分と環境 A35 A36 A37 A38

Microsoft PowerPoint - 集積回路工学(5)_ pptm

24-28 FAS14 技術相談.indd

Microsoft PowerPoint - TLP184,185_TLP290,291 比較表 ppt

16-40.indd

Microsoft Word - DS50-N A.doc

降圧コンバータIC のスナバ回路 : パワーマネジメント

<93FA92F6955C2E6D6364>

事例2_自動車用材料

TTD1415B_J_

Layout 1

Microsoft PowerPoint - 集積デバイス工学7.ppt

Microsoft PowerPoint - H30パワエレ-3回.pptx

富士通セミコンダクタープレスリリース 2009/05/19

"ソフトウェア カフェテリアサービス向けソフトウェア説明書

Microsoft Word - 翻訳ファイル for AN-1154J_JP校正版.doc

< D834F E8F48816A2D8AAE90AC2E6D6364>

(Microsoft PowerPoint - \224z\225z\227p_\217\343\221\272.ppt)

<4D F736F F F696E74202D2091E63389F15F8FEE95F1835A834C A CC B5A8F FD E835A835890A78CE C CC835A834C A A2E >

PowerPoint プレゼンテーション

ACモーター入門編 サンプルテキスト

S-89210/89220シリーズ コンパレータ

TC74HC4511AP/AF

記者発表開催について

報道機関各位 平成 30 年 5 月 14 日 東北大学国際集積エレクトロニクス研究開発センター 株式会社アドバンテスト アドバンテスト社製メモリテスターを用いて 磁気ランダムアクセスメモリ (STT-MRAM) の歩留まり率の向上と高性能化を実証 300mm ウェハ全面における平均値で歩留まり率の

< D834F E8F74816A2D8AAE90AC2E6D6364>

RD2.0S~RD150S DS

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

2SC1213, 2SC1213A データシート

(案)

CSM_E2K-F_DS_J_5_7

CSM_K2ZC-N_DS_J_2_17


2019 年 3 月期決算説明会 2019 年 3 月期連結業績概要 2019 年 5 月 13 日 太陽誘電株式会社経営企画本部長増山津二 TAIYO YUDEN 2017

TPC8107

Microsoft Windows Internet Explorer は 米国 Microsoft Corporation の 米国およびその他の国における登録商標または商標です Linux は Linus Torvalds 氏の日本およびその他の国における登録商標または商標です Red Hat

Transcription:

第三回 QISS シンポジウム 宇宙線によるソフトエラー : 社会的インパクトと評価技術 2019 年 12 月 07 日 ( 株 ) ソシオネクスト松山英也

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 1

1. はじめに デバイスの社会への役割の変化 あらゆるものがネットにつながる IoT 社会の到来 2020 年にはネットにつながるデバイス数が約 400 億個 [1] 2020 年前後にあらゆるインフラがセンサーにつながる 1 兆個のセンサー ( トリリオンセンサー ) 時代の到来を予測する試算もある [2] [1] 令和元年版情報通信白書 [2] IoT がもたらす我が国製造業の変容と今後の対応に関する調査研究報告書 一般財団法人企業活力研究所平成 28 年 3 月 2

1. はじめに デバイスの社会への役割の変化 高成長が見込まれる分野コネクテッドカーの普及によりIoT 化の進展が見込まれる 自動車 輸送機器 デジタルヘルスケアの市場が拡大している 医療 スマート工場やスマートシティが拡大する 産業用途 ( 工場 インフラ 物流 ) などで [1] 令和元年版情報通信白書これらはいずれも高信頼性用途である 3

1. はじめに デバイスの社会への役割の変化 Society5.0 IoT のよる IT と密接にかかわる便利な社会に変貌をしようとしている [1] [1] 内閣府 Society 5.0 で実現する社会 http://www8.cao.go.jp/cstp/society5_0/index.html 4

1. はじめに デバイスの社会への役割の変化 経産省 Webより[5] 自動運転も大変便利 数だけではなく 日本では2030年までに完全自動走行化の計画[4] [4]官民ITS構想 ロードマップ2019 高度情報通信ネットワーク社会推進戦略本部 官民データ活用推進戦略会議 2019年6月7日 [5] 経産省Webより http://www.meti.go.jp/main/60sec/2017/20170301001.html 5

1. はじめに デバイスの社会への役割の変化 携帯電話や パソコンで誤動作やロックをして 再起動した経験はないですか? 事故! しかし社会に密接に関わり 便利な反面命をも電子デバイスにあずける社会エラーが出たからと言ってRESETが効かない世界! ソフトエラーが大切なデバイスの信頼性を脅かす 6

1. はじめに デバイスの社会への役割の変化 1. 半導体デバイスはその進化とともにその役割 出荷数が急拡大し我々の社会と密接なつながりを持つようになってきた 2. 社会に密接に関わり 便利な反面 命をも電子デバイスにあずける社会になっている 高信頼性用途のデバイス アプリケーションの増加 3. ソフトエラーが大切なデバイスの信頼性を脅かす 高信頼性用途のデバイスでは対策が非常に重要である 7

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 8

2. ソフトエラーとは まずトランジスターについて ゲートに正電圧が印加された場合 P型の基盤と絶縁層の境界に 電子を引き寄せ反転層 n型 チャネルを作り上げる事でソース -ドレイン間に電子を流す PMOSの場合は正孔 電子 エレクトロン や正孔 ホール の働きで電圧 信号 データ を 伝えるスィッチの役割を果たす シリコン NMOSFET の模式図 NMOSFET 記号 9

2. ソフトエラーとは まずトランジスターについて ゲートに正電圧が印加された場合 P型の基盤と絶縁層の境界に 電子を引き寄せ反転層 n型 チャネルを作り上げる事でソース -ドレイン間に電子を流す PMOSの場合は正孔 電子 エレクトロン や正孔 ホール の働きで電圧 信号 データ を 伝えるスィッチの役割を果たす 容量を付加する もしくは回路 Flip Flop の形にしてデータ(1or0)を保持できる 10 容量を付加or回路にし てデータを保持できる

2. ソフトエラーとは メモリーや CPU などの電子デバイスのビット ( 情報 ) が何の前触れもなく反転してしまう現象 図は Taiki Uemura A Study on Soft Error Mitigation for Microprocessor in Bulk CMOS Technology Osaka,Japan Osaka University, 2015,Ph.D.thesisp6 Fig.1.3より引用 11

2. ソフトエラーとは 集積化の影響 ( 寄生バイポーラ効果 ラッチアップ ) 寄生バイポーラー効果 中性子線では寄生バイポーラー効果と呼ばれる故障メカニズムで複数ビットが発生しやすくなった また確率は小さいがラッチアップという大電流が流れてしまう障害も現れるようになった SEL( シングルイベント ラッチアップ ) 機構図は Taiki Uemura A Study on Soft Error Mitigation for Microprocessor in Bulk CMOS Technology Osaka,Japan Osaka University, 2015,Ph.D.thesisp6 Fig.1.3 より引用 12

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 13

3. 原因と特徴 原因1: α線発生源(材料起因 パッケージ基盤 半導体チップ 半導体デバイスの断面 パッケージ材料のモールド樹脂中に含まれる微量のウラン トリウム はんだバンプに含まれるポロニウムからα線発生(材 料起因 中性子線のような高度 緯度などの地理依存は ない 14

3. 原因と特徴 原因 2: 中性子線 ( 二次宇宙線 ) 図は Taiki Uemura A Study on Soft Error Mitigation for Microprocessor in Bulk CMOS Technology Osaka,Japan Osaka University, 2015,Ph.D.thesisp6 Fig.1.3 より引用 地球に降り注ぐ宇宙線 ( 陽子やHe 原子核など ) が大気中に入射し窒素などの原子と衝突し核破砕反応を起こすことで生じる 高度が高いほど多くなる 15

2. ソフトエラーとは 特徴 1: 電源を入れなおせば正常動作するため再現性がなく故障個所に痕跡が残らない そのためソフトエラーと呼ばれる 故障 正常 正常 特徴 2:[ 空間的にランダム ] ソフトエラーの反転ビットは場所的に偏りなくランダムに発生 16

3. 原因と特徴 ソフトエラーは再現性がない 痕跡が残らない 問題が起きた場合原因を特定するのが困難 - ハードエラーの場合 痕跡が残り 再現性があるため 原因を絞り込むことができる 原因さえ明確になれば難題で あっても解決方針が立てられマン パワーをそこに集中し解決に結び つけられる 17 電子デバイスの配線の障害例 ボイドという空間が発生し オープン故障に

2. ソフトエラーとは - ソフトエラーの場合 痕跡が残らない上に現象的にはノイズの発生 ノイズの発生要因は電磁ノイズ 静電気 落雷など多くあり切り分けが難しい 再現実験で確認するなら 例 1000FIT の場合デバイス 1000 ケを駆動して 1000 時間 ( 約 1.5 ケ月 ) に 1 回 統計的に有意なデータを取るには半年はかかる 以上の理由より原因を特定するのが困難な現象である 18

3. 原因と特徴 特徴3 時間的にもランダムに発生 ハードエラーとの比較 電子デバイスのハードエラー発生の特徴 は通常下記のように時間変化する (形状からバスタブ 浴槽 カーブと言われる ) 故障率(*) バスタブカーブ 摩耗故障モード 初期故障モード (時間とともに発生率が増加 (時間とともに発生率が減少 配線の 切りキズ (*)故障の 発生しやすさ Agingや試験で 故障率を下げる 時間 ハードエラーの場合ほとんどが初期故障モード 時間ととともに発生率 が低減 出荷前の加速試験や試験で発生率を抑え込める 19

3. 原因と特徴 特徴2.時間的にもランダムに発生 ソフトエラーの場合偶発故障モード 原因が外から来 る ため時間的変化なし 故障率(*) バスタブカーブ 初期故障モード 摩耗故障モード (時間とともに発生率が増加 (時間とともに発生率が減少 偶発故障モード ソフトエラー 試験をしても故 障率変わらない 時間 偶発故障のソフトエラーには出荷前試験 デバイスの交換は 全く効果なし 事前に評価し十分な対策を行う必要がある 20 (*)故障の 発生しやすさ

3. 原因と特徴 1. 原因は放射線 (α 線 中性子線 ) である 中性子線の影響で複数 bit が反転する場合も増加してきている 2. 電源を切れば元に戻り 再現性が無く 故障発生箇所には何の痕跡も残らない 3. 空間的にランダムに発生 : 反転ビットは場所の偏りなくランダムに発生 現象的にはノイズの発生なので他の原因 ( 電磁ノイズ 静電気 落雷など ) と切り分けが難しく原因特定に時間がかかることが多い 4. 時間的にランダムに発生 : 試験や部品交換も効果なし 高信頼性用途では事前の評価と対策を取らねばならない 21

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 22

4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) Sun 2000 年 - ソフトエラーによるシステムクラッシュ多発 - L2 キャッシュに ECC が無かった - AOL, Ebay, Verisign, Baby Bell(Atlanta) などの業務に影響 Computerworld December 03, 2001 McNealy Blames IBM for Sun's Server Memory Flaws Says faulty SRAM was 'biggest source' of system crashes We're no longer buying IBM SRAM [static RAM]. They were the biggest source of the problem for us. They knew about it before, and they didn't tell us... But IBM sure made a big point of telling all of our customers about it a year and a half ago. But we don't have that issue anymore. We designed IBM out and put [error checking and correcting logic] across the entire cache architecture. 原因究明対策までに約 1 年 ( そのために被害拡大 ) https://www.computerworld.com/article/2585216/mcnealy-blames-ibm-forsun-s-server-memory-flaws.html から引用コメントは松山が追加 23

4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) A 社 : ソフトエラー対策のため 30 億円の特別損失 2020 年 3 月期第一四半期 特別損失 FY19_1Q 実績 32 億円 ソフトエラー対策強化引当金繰入額 30 億円 A 社 2020 年 3 月期第 1 四半期決算説明会資料より ソフトエラー障害は原因究明に時間がかかり プロセス 回路変更以外対策効果がなく費用もかかる そのためソフトエラー障害は企業に大きな損害をもたらす 24

4.1 ソフトエラーが原因と疑われている例 カンタス航空72便急降下事故(2008年10月7日) 2008年10月7日 Qantas72便がシンガポールからパース 西オー ストラリア に向けて出発 高度37,000ft 11,278m を航行中 ADIRU 1 慣性基準 装置 1 が断続的に誤データ Angle of attack, 迎え角 を発信 この誤データにより FCPC フライト制御コンピュータ が下降を命令 2秒 72便は急降下した シートベルトをしていなかった乗客のほとんどが 天井に投 げつけられる事態となった オーストラリア運輸安全局ATSB TRANSPORT SAFETY REPORT Aviation Occurrence Investigation AO-2008-070 Final In-flight upset 154 km west of Learmonth, WA 7 October 2008 VH-QPA Airbus A330-303 p170 Figure 50を引用 25

4.1 ソフトエラーが原因と疑われている例 カンタス航空72便急降下事故(2008年10月7日) 事故調査レポート (Webで閲覧可能) 表紙 全313ページ オーストラリア運輸安全局ATSB TRANSPORT SAFETY REPORT Aviation Occurrence Investigation AO-2008-070 Final In-flight upset 154 km west of Learmonth, WA 7 October 2008 VH-QPA Airbus A330-303 レポート p.150の表 SEE以外は unlikely(ありえない) もしくはvery unlikely 非常にありえない ソフトエラー ありうる(not unusual) が証拠不十分 報告ではソフトエラーはありうる ただし証拠不十分とし て断定されていない また機器のソフトエラー対策の不 十分さが指摘されている ソフトエラーが人身事故につな Copyright 2019 26 がる可能性があるとして大きな警鐘になった

4.2 ソフトエラーが同様の障害を起こす可能性がある例 記憶に新しい新横浜シーサイドライン逆走事故 2019年6月1日(土)20時15分頃 新杉田駅発並木中央駅行き第2009B 列車 5 両編成 が新杉田駅を出発 したところ 本来の進行方向と反対の方向に進行し 線路終端部の車止めに衝 突し停止した この事故により乗客14 名が負傷した 運輸安全委員会Webより 出典 株式会社横浜シーサイドライン新杉田駅において発生した鉄道人身障害事故に関する情 報提供 令和元年6月14日 国土交通省 運輸安全委員会 Press Release http://www.mlit.go.jp/jtsb/iken-teikyo/seasideline20190614.pdf 運輸安全委員会の調査によりF線(前進指令をモータに 伝える配線)の断線が報告されている (詳細はさらに調 査中)確率は低いがコンピュータが誤作動を起こせば同様 の事故を起こしかねない 将来の過密路線 電子デバイ スに頼り切った社会ではソフトエラーに注意が必要 Copyright 2019 27

4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 1. ソフトエラーはネットワークなど社会インフラにもかかわり障害を起こすと波及範囲が広く 企業にも甚大な損害をもたらす 2. 原因追及に時間がかかり かつ試験で除けないためプロセスや設計改版など時間と費用を要することが多いためである 3. 事前に評価し しっかり対策を立てることが必要である 特にインフラや人命にかかわる高信頼性用途品では必須 28

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 29

5. ソフトエラー評価技術 ソフトエラー研究の歴史 1975 人口衛星の電子デバイスの異常の原因として宇宙空間の Fe や C などの重粒子が原因であると報告 1978 1996 intel から DRAM における α 線起因のソフトエラーが報告 地上でのソフトエラーが広く知られるようになった IBM 富士通などの報告で二次宇宙線である中性子線の影響でソフトエラーが発生が知られるようになってきた 2001 2005 2010 JEDEC 基準 (JESD89) JEITA 基準 (EDR-4705) ミューオンによるソフトエラーが示唆 歴史を見ると集積化が進み それとともにソフトエラーが問題になる環境 ( 宇宙空間から地上 ) 原因 (α 線に加え中性子線 ) が拡大していることがわかる 30

5. ソフトエラー評価技術 1980 年代 31

5. ソフトエラー評価技術 1970 80年代 α線ソフトエラー 発生源(材料起因 パッケージ基盤 半導体チップ 半導体デバイスの断面 70年代に最初に問題になったのはLSIデバイスのパッケージ材料 に微量に含まれる同位元素からのα線 32

5. ソフトエラー評価技術 1970 80年代 α線ソフトエラー評価技術 241Am JEDEC基準 JESD89Aより α線加速試験方法 放射性同位元素241Amによる加速試験 Packageの表面に配置して加速試験を実施 ランニング試験 デバイスを実動作させ故障率を測定する α線ソフトエラーの評価は2種類 1.加速試験 放射線方位元素をChip直上に配置して加速 2.ランニング試験 デバイスを実動作させ故障率を測定 デバイス1000ケ 半年程度のランニング試験で確認した この当時のソフトエラーの基準は33 1000FIT/device

5. ソフトエラー評価技術 1990~10 年 34

5. ソフトエラー評価技術 90年代以降 中性子線ソフトエラー 発生源(二次宇宙線 JEDEC基準 JESD89Aより 中性子の加速評価はリングサイクロトンなど加速器での評価が 必要になった 評価施設が限定される 35

5. ソフトエラー評価技術 90年代以降集積化の影響 (多ビットエラーの発生 現象が複雑になってきた) 図1.微細化に影響により多ビットエラーのエ ラーの発生も起きるようになってきた ソフトエラーシュミレータ核物理に基づきソフトエ ラーを計算 筐体の影響なども計算できる 集積化により単ビットから 複数ビット より修正が困難 が 発生しやすくなる(放射線の影響範囲は微細化されない) 筐体や建物の影響も受けるようになりシュミレーションによる 計算も必要になってきた 36

5. ソフトエラー評価技術 近年 37

5. ソフトエラー評価技術 ソフトエラーに求められる信頼度が向上 ISO26262(自動車向け機能安全規格) 目標値 累積故障確率の目標[FIT] シングルポイント フォールト(*1)の対策目標 レイタント フォールト(*2)の対策目標 (*1)シングルポイントフォールト 単独で安全を侵害する危険のある故障で安 全機構がないもの (*2)レイタントフォールト 診断などの安全機構で検知できない故障 ASIL(Automotive Safety Integrity Level) A B C D - <100 <100 <10-90% 97% 99% - 60% 80% 90% 経産省Webより http://www.meti.go.jp/main/60sec/2017/201703 01001.html ISO26262(自動車分野の機能安全規格)の最高位の ASIL-Dではシステムへ10[FIT]の要求 ここでFITとは109 時間(=約11万年)あたりのデバイス1ケの平均故障率 Copyright 2019 38

5. ソフトエラー評価技術 ソフトエラーに求められる信頼度 10[FIT] とは デバイス1ケでみると 10 9 時間 (= 約 11 万年 )10 回故障 10 8 時間 (= 約 1.1 万年 )1 回故障 デバイス10ケでみると 10 7 時間 (= 約 1100 年 )1 回故障 100 (= 約 110 年 ) 1 回故障 1000ケ (= 約 11 年 ) 1 回故障 10000ケ (= 約 1.1 年 ) 1 回故障 10 万ケ (= 約 0.1 年 ) 1 回故障 100 万ケ (= 約 0.01 年 =4 日 ) 1 回故障 現実の世界 ( 国内自動車台数 2018 年度 526 万台 ) と比較すると決して厳しすぎる数字ではない 39

5. ソフトエラー評価技術 ソフトエラーに求められる信頼度 10[FIT] をランニング試験で保証しようとすると 100 万ケデバイスを 100 時間稼働 10 万 1000 時間 ~ 1000ケ デバイス 11 年稼働 100 110 年 10 1100 年 ランニング試験では評価不可能! 加速試験による評価がより重要にシュミレーションの開発と併せて企業単独では困難大学 研究機関との共同研究が不可欠な時代になった 40

白色 中性子 RCNP 白色中性子照射場 30 陽子ビーム 10 400MeV エネルギー 減衰装置 タングステン ターゲット 半導体 デバイス 中性子 阪大RCNP様での加速試験 で数個 数10時間で必要 なデータが取れる RCNPの白色中性子源の強度は 30秒で自然界の100年分相当 1年後に10倍に増強 41

5. ソフトエラー評価技術 RCNP での評価例 : デバイスおよびシステムレベルの加速試験 H. Ando, et al, Validation of hardware error recovery mechanisms for the SPARC64 V microprocessor, in IEEE International Conference on Dependable Systems and Networks With FTCS and DCC, 2008, pp. 62 69. 富士通のサーバ部門とデバイス部門 ( 現ソシオネクスト社 ) でスーパーコンピュータ開発にてソフトエラー対策に挑んだ 前世代のサーバーで加速試験を実施 コンピュータ動作における信頼性が求められる動作 回路網を割り出した 42

5. ソフトエラー評価技術耐放射線回路の開発 1) Particle hit 2) ー + + + ー 放射線耐性回路 1) メモリーで発生しうる多ビットエラーをRCNPでの加速実験から算出し対応できる訂正回路 (ECC) を採用 2) 信頼性が求められる回路向けに耐放射線回路を開発富士通サーバー部門が装置レベルの評価 デバイス部門 ( 現ソシオネクト ) がデバイスを評価する協力体制だからこそできた開発 43

5. ソフトエラー評価技術 1. 70~80 年 α 線ソフトエラーが問題になった 放射性同位元素 ( 241 Am) による加速試験とデバイスを実動作させるランニング試験で評価した 2. 90 年代に入り中性子によるソフトエラーも問題になりリングサイクロトロンなど加速器での加速試験で評価をおこなった 現象に複雑化にともないシュミレーションでの評価も必要になった 3. 近年はデバイスに対する高信頼性要求に伴い加速器での評価がより重要になった シュミレーションの開発も含め大学 研究機関との共同研究が不可欠な時代になった 4. 富士通サーバー部門とデバイス部門 ( 現ソシオネクスト )RCNP にて装置およびデバイスの評価を分担して行い情報を share して高信頼性サーバーの開発に成功した 44

目次 1. はじめに デバイスの社会への役割の変化 2. ソフトエラーとは 3. 原因と特徴 4. 社会的インパクト ( ソフトエラーが引き起こした障害例 ) 5. ソフトエラー評価技術 6. 今後に向けて 45

6. 今後に向けて QISS 産学連携 (1) 現状は加速試験はほとんどデバイスメーカーが行っている 富士通サーバー部門がサーバーで評価しソシオネクトがデバイスの評価を行い成果をあげたように ボード 装置レベルの評価を行い お互いノウハウを共有 評価の裾野を広げる必要がある 46

6. 今後に向けて QISS 産学連携 (2) 将来デバイスではミュオンの影響が懸念されている 加速には加速器が必要 現象も難しい 産学の英知を結集すべき課題 47

6.今後に向けて QISS 産学連携 3 211Atの製造が可能 白色中性子の照射が可能 ミューオンの利用が可能 JCANS(日本加速器中性子源協議会)web http://phi.phys.nagoya-u.ac.jp/jcans/indexj.html OPERA QiSS - 大阪大学 核物理研究センター 安心 安全 スマートな長寿社会実現のための高 度な量子アプリケーション技術の創出 https://www.rcnp.osaka-u.ac.jp/~qiss/ 日本は幸いにして多くの加速器が狭い国内にある しかも加 速器間の連絡が良好 この連結をさらに強化してソフトエラーの問題に取り組むべき 品質は日本のお家芸でありオールジャパン体制で取り組むべ きQISSの役割は重要 48

6. 今後に向けて 1. 現状は加速試験はほとんどデバイスメーカーが行っている 富士通サーバー部門とソシオネクトがおこなったように ボード 装置レベルの評価デバイスメーカーで行い お互いノウハウを共有 評価の裾野を広げる必要がある 2. 今後もミュオンなど新しい粒子によるソフトエラーが懸念されている 現象的にも難しく大学 研究機関の協力が不可欠 4. 品質は日本のお家芸である QISS でデバイスメーカー 装置メーカー 研究機関のオールジャパン体制でこの問題に取り組み このソリューションを見出すべき 49