NEC Express5800/ftサーバの紹介

Similar documents
CLUSTERPRO MC ProcessSaver 1.2 for Windows 導入ガイド 第 4 版 2014 年 3 月 日本電気株式会社

Express5800/ftサーバ

CLUSTERPRO MC ProcessSaver 2.3 for Windows 導入ガイド 第 5 版 2018 年 6 月 日本電気株式会社

FUJITSU Software Systemwalker Centric Manager Lite Edition V13.5 機能紹介資料

LANスイッチブレード活性交換作業時の確認事項およびその付随作業

サーバプラットフォーム「BladeSymphony」、「HA8000シリーズ」の新モデルを販売開始

クラウド基盤向けに処理性能や拡張性を強化した「HA8000シリーズ」の2プロセッサーサーバを販売開始

日立アドバンストサーバ「HA8000シリーズ」の2プロセッサーモデル3機種を強化

LANカード(PG-2871) 取扱説明書

MAGNIA Storage Server Configuration Guide

CLUSTERPROXSingleServerSafe SingleServerSafe ご紹介 2007 年 10 月

アドバンストサーバ「HA8000シリーズ」において最新テクノロジーを採用しシステム性能を強化

アドバンスト・フォーマットディスクのパフォーマンス

【Cosminexus V9】クラウドサービスプラットフォーム Cosminexus

ビッグデータやクラウドのシステム基盤向けに処理性能を強化した「BladeSymphony」および「HA8000シリーズ」の新製品を販売開始

サーバに関するヘドニック回帰式(再推計結果)

Microsoft Word - XPC4ソフトマニュアル.doc

クラスタ構築手順書

CLUSTERPRO MC StorageSaver 1.1 for Linux リリースメモ 2015(Jun) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

1.3 ソフトウェア体系および対応表 (1) istorage ソフトウェアは istorage シリーズのディスクアレイを管理 および ディスクアレイが有する機能を制御するソフトウェア群です このソフトウェア群が提供するストレージ管理 制御機能を利用すると 様々なストレージソリューションを実現でき

Quad port LANカード(10GBASE-T) 取扱説明書

マイクロソフトの最新OS「Windows Server® 2008 R2」、「Windows® 7」プレインストールモデルを販売開始

共通マイクロアーキテクチャ 富士通はプロセッサー設計に共通マイクロアーキテクチャを導入し メインフレーム UNIX サーバーおよびスーパーコンピューターそれぞれの要件を満たすプロセッサーの継続的かつ効率的な開発を容易にしている また この取り組みにより それぞれの固有要件を共通機能として取り込むこと

ライセンスの注意事項 サーババンドル版のライセンスについてサーババンドル版では 通常のサーバライセンスおよび 4 コアライセンスを ベースライセンス 追加サーバライセンスおよび追加 2 コアライセンスを 追加ライセンス と呼びます 1 台の物理サーバに対してベースライセンスは 1 つしか購入すること

Microsoft PowerPoint Quality-sama_Seminar.pptx

User Support Tool 操作ガイド

SigmaSystemCenter ネットワークアダプタ冗長化構築資料 第 3 版

「BladeSymphony」「HA8000 シリーズ」において最新OS Windows Server 2008 プレインストールモデルを販売開始

SASカード (PG-228B/BL, PG-224B) 取扱説明書 追補版

クローン機能について 保存先が HDLH シリーズの場合マスタースレーブファイル 設定のコピー HDLH シリーズ 台をそれぞれマスター / スレーブとして構成し マスターの設定やファイルをスレーブに保存します ファイルの保存はレプリケーション機能を利用しておこなわれます 社内 LAN マスター故障

改版履歴 版数改版履歴改版年月日 1 新規作成 2013/3/29 2 TESTIO_MODE を追加 OVER_ACTION VG_STALL_ACTION の設定値を変更 2013/9/30 3 CLUSTERPRO MC StorageSaver for BootDisk (for Linux

ESMPRO/ServerManager サーバ死活監視機能

PRIMERGYの遠隔管理 リモートマネジメントご紹介

CLUSTERPRO MC StorageSaver 2.2 for Linux リリースメモ 2017(Apr) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル 補足事項 注意事項

White Paper 高速部分画像検索キット(FPGA アクセラレーション)

サーババンドル版ライセンス NX7700x シリーズ Express5800 シリーズのサーバと同時に購入することで パッケージ製品よりも安価 に導入することのできるライセンスも提供しています ライセンスの注意事項 サーババンドル版のライセンスについてサーババンドル版では 通常のサーバライセンスおよ

仮想化基礎演習テキスト Ⅰ 第 1.0 版 演習で学ぶ仮想化基礎 ( クライアント仮想化編 ) 九州ラーニングネット株式会社 特定非営利活動法人パソコン整備士協会

スライド 1

別紙 2 ハードウエア詳細仕様 (1 ハードウェア一覧 ) No. 設置場所 物理 HW/ サーバ番号 物理 HW/ サーバ名称 台数 台数 備考 想定製品 ( 型名 ) 想定製品 ( 品名 ) 菊水分庁舎 P-SVR001 APサーバ #1 1 1 アクティブ PYR2544R2N PRIMERG

OS バージョンアップ実行後のご注意 OS バージョンアップ後 更新完了通知が自動的にNECカシオモバイルコミュニケーションズ株式会社の運用するサーバへ送信されます なお NECカシオモバイルコミュニケーションズ株式会社は送信された情報を OS バージョンアップ以外の目的には利用いたしません また

NEC Hyper Converged System の機能 サービス提供内容 NEC Hyper Converged System 構築サービス : 本サービスを利 する事で すぐに仮想マシンの作成を開始できる仮想化基盤を導 できます お客様はシステム導 までの期間を短縮 業務の構築に集中すること

Red Hat Enterprise Linux Server 7 動作確認表

Microsoft Word - ESX_Restore_R15.docx

- 主な機能 - 設定機能キャッシュメモリをキャッシュセグメントに分割し 業務で使用する論理ディスクを割り付けるための設定を行います WebSAM istoragemanager のクライアント画面から操作が可能です キャッシュセグメント作成 削除機能キャッシュセグメントの作成 削除を可能にします

クラスタ環境でのデータベースのアップグレード手順

CLUSTERPRO MC RootDiskMonitor 1.1 for Linux リリースメモ 2013(Sep) NEC Corporation ライセンス パッケージのインストール セットアップ マニュアル

CLUSTERPRO MC StorageSaver 2.0 for Windows 導入ガイド 第 1 版 2015 年 3 月 日本電気株式会社

Slide 1

Windows Server 2003 Service Pack 適用手順書

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ _r2.pptx

Quad port LANカード(10GBASE) 取扱説明書

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ pptx

AGT10(Android (TM) 2.3) ファームウェア更新方法

Express5800 WSUS 導入セットご紹介資料

2. 生田仮想デスクトップ PC の接続方法 生田仮想デスクトップ PC に接続する方法は 次の 2 通りです 1. HTML アクセス Internet Explorer や Safari などのブラウザを用います PC に特別なソフトウェアをインストールす る必要が無いので 管理者権限をもってい

ActiveImage Protector 2016 R2 for Express5800 / ftサーバ

ビッグデータ分析を高速化する 分散処理技術を開発 日本電気株式会社

スライド 1

Microsoft Word - (171124_v1.30)NTTCom-Jpki_インストールマニュアル.doc

改版履歴 版数 改版 内容 新規作成 Microsoft.NET Framework のダウンロード先 URL を追記 バージョンアップに伴い改版 i

1. はじめに Systemwalker Desktop Patrol V 以降でセキュリティ監査として BIOS パスワード設定の監査 を提供しています しかし Systemwalker Desktop Patrol メインメニュー のセキュリティ情報に表示される起動パスワード 設定パ

Microsoft Word - USB2-PCI…V…−†[…Y_04†iWinNt40_PDFŠp†j.doc

CLUSTERPRO X 4.1 for FileMaker Server ご紹介資料

HP Serviceguard Solution for Linux(11.20) の MIRACLE System Savior バックアップ検証報告書 MIRACLE System Savior を使用した HP Serviceguard Solution for Linux(11.20) 環境

Microsoft Word - (171118_v4250)ACS_インストールマニュアル.doc

0423表_表紙

<4D F736F F F696E74202D204E505F8E9F90A291E E815B CFC82AF B838B B838B C5E B8D5C91A E E4E41532E7

Microsoft Word - esm_update_jp.doc

『テクノス』V2プログラムインストール説明書

CLUSTERPRO MC RootDiskMonitor 1.0 for Windows FAQ 集 2013(Mar) NEC Corporation 導入に関する質問 運用に関する質問 動作環境に関する質問

V8_教育テキスト.dot

目次 1. はじめに 3 2. システム要件 4 3. HDD Password Tool のインストール 5 Windows の場合 5 macos/os X/Mac OS X の場合 8 4. HDD Password Tool の使い方 HDD Password Tool を起動

Microsoft PowerPoint - ソフトウェア更新手順書_DAN-W62_mac_ _1.ppt

目次 はじめに... 3 仮想化環境上の仮想マシン保護方法... 4 ( 参考 )Agent for Virtual Machines での仮想マシンのバックアップ... 8 まとめ 改訂履歴 2011/04 初版リリース 2012/10 第 2 版リリース このドキュメントに含まれる特

Microsoft PowerPoint - (WEB)01-0_iStorage_M_ pptx

1 本体 2.5 型ドライブモデル ( フレームモデル ) 製品名称 / 概要 Express5800/R110i-1(4C/E3-1220v6) 1 x インテル Xeon プロセッサー E3-1220v6 (3GHz, 4C/4T, 8 MB), メモリセレクタブル, ディスクレス, ODD レ

PRIMERGYマネジメントブレード

PowerPoint プレゼンテーション

ワイヤレスバーコードリーダー CM-520W1 設定資料 Bluetooth SPPの設定

604HW FAQ(CN) 文書レベル 604HW FAQ(JP) V1.0 Huawei Technologies Co, Ltd. All Rights Reserved 华为机密, 未经许可不得扩散第 1 页, 共 12 页

シナリオ6:自動再起動(ServerView ASR&R)

BIGLOBEクラウドホスティングAPIリファレンス

RW-5100 導入説明書 Windows7 用 2017 年 7 月 シャープ株式会社

変更履歴 項番版数内容更新日 版新規作成 2013 年 11 月 18 日 1

1. はじめに (1) 本書の位置づけ 本書ではベジフルネット Ver4 の導入に関連した次の事項について記載する ベジフルネット Ver4 で改善された機能について 新機能の操作に関する概要説明 ベジフルネット Ver4 プログラムのインストールについて Ver4 のインストール手順についての説明

改版履歴 版数 改版日付 改版内容 /11/08 新規作成 /07/17 RAID 種別の確認方法の RAID5 についての文言修正 DPM6.1 ユーザーズガイド参照先の追加 /04/13 DPM6.4 までのユーザーズガイド参照先の追加 2

SetupVerup_dl_M


UPS管理システムSAN GUARD IV

(1) 下記モデルの場合のイベントコード表示 HA8000/RS210 <AJ/BJ/FJ/HJ/JJ/KJ/LJ/ AK/BK/FK/HK/JK/KK/LK/ AK1/BK1/FK1/HK1/JK1/KK1/LK1/NK1/ AL/BL/CL/EL> モデル HA8000es/RS210 <CJ/

Microsoft Word - (151201_v1.29)NTTCom-Jpki_インストールマニュアル.doc

目次 概要 S/4HANAの導入方式 NECがご提供するサービス S/4HANA 導入ロードマップ策定支援サービス

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

Microsoft PowerPoint 年度サーバクライアント管理実態調査リリー

延命セキュリティ製品 製品名お客様の想定対象 OS McAfee Embedded Control 特定の業務で利用する物理 PC 仮想 PC や Server 2003 Server 2003 ホワイトリスト型 Trend Micro Safe Lock 特定の業務で利用するスタンドアロン PC

Symantec System Recovery 2013 R2 リカバリディスク起動時のドライバ対応一覧表 ( 第 3 版 ) 2016 年 7 月 15 日 日本電気株式会社

Windows パソコンに接続する 画面表示は Windows 7 を例としています 1. EM chip を取り付けた本製品の USB コネクタに USB ケーブルを接続します 2. USB ケーブルのもう一方のコネクタをパソコンの USB ポートに接続します パソコンがデータ通信カード ( 本製

SetupVerup_dl_M

2 サーバマネージメント機能 ( 管理ソフトウェア未使用時 ) A2010L-60,A2010M-60, A2010M-30,A2010M-15 A1020b A1080a-S/D/E,A1040a : サポートエンジン SP3 エンジン 3 拡張時エンジン SP2 : 未サポートサーバ監視機能電源

Transcription:

Express5800/ft サーバのご紹介 White Paper 目次 はじめに 2 Express5800 シリーズの信頼性 3 Express5800/ft サーバの開発 4 Express5800/ft サーバの特長 6 故障しても止まらない ft サーバシステムを止めない修理交換既存 OS / アプリがそのまま動作 99.999% を超える可用性 Express5800/ft サーバの基本アーキテクチャ 10 I/O フェイルオーバサプライズ リムーバルとエラーの隠蔽ロックステップ GeminiEngine とハードウェア二重化技術 14 デターミニズムの確保とロックステップの実現 CPU コンテキストとメモリ内容の同期化エラー検出と切り離し制御おわりに 18 1

はじめに IT 技術の驚異的な進歩は 私たちの生活やビジネス基盤にも大きな変化をもたらしてきました 近年ではクラウド コンピューティング技術を活用したクラウド サービスが大きく成長しており 社会のあらゆるサービス ビジネスがネットワークを介して結合されています また 様々な IT 機 器やネットワーク インフラが私たちの生活空間の至るところに浸透しており これらなくしては 我々の生活が成り立たなくなってきています IT 機器をライフラインとして利用する上で それら が使い易いだけでなく 安全 確実であることが強く求められており 社会インフラとしてのサーバ の信頼性が益々重要になってきています 一方 サーバ ベンダーの競争によりサーバ製品が安価に供給されるようになったことで 新たな 問題も発生しています それは サーバが容易に導入できることで 企業の各部門が必要なときに 必要なシステムを構築し その都度サーバを増やし続けたことです 結果的に企業は大量のサーバ を抱える事になり 維持 管理に要する費用 TCO (Total Cost of Ownership)が増大するという問 題に直面しています これを解決する手段として VMware や Microsoft Hyper-VTM といった仮想化技術を用い 一 台のサーバで複数の OS を稼動させ それぞれで複数のサービスを提供する サーバ統合が盛んに行 われています これによりサーバの管理だけでなく 内部統制も容易になり 大幅な TCO の削減が 2

可能となります しかし サーバ統合は別の課題も提起しています それは一台のサーバが担うサービスが増加し それに伴い そのサーバに依存する利用者も大きく増加するということです つまり一台のサー バ トラブルによって引き起こされる障害や 損失の規模が 従来に比べ飛躍的に高くなっているの です これは リスク分散の格言 卵は一つのカゴに盛るな とは逆の方向に進んでいることを意 味します 卵は一つのカゴに盛るな 卵を複数のカゴに分散して盛ってお けば 万が一どれか一つのカゴを落 としてしまっても 他の卵は無事だと いう意味 もともとは分散投資が大切であること を教える イギリスの格言 この様な状況から 仮想化技術が広く普及するにつれ 耐故障性に優れた 高可用性サーバの要求 が高まっています Express5800 シリーズの信頼性 スペックの高度化に伴い処理能力が飛躍的に向 上し PC サーバがビジネスに果たす役割も拡大し 続けています 一方 高度な処理を行うためにサー バの構成コンポーネントには大きな負荷がかかり 故障の発生確率も高まっています 一般的に PC サーバは 右図に示すように HDD 冷却ファン 電源ユニット PCI カード CPU チッ プセット メモリなどのコンポーネントから構成さ れています NEC の PC サーバ Express5800 シリーズは製品セグメント毎に 信頼性に対するタ ーゲットが設定されており 上位機種になるにつれ 各コンポーネントの冗長性が向上していきま す 例えば 一番廉価な 1-Way(CPU を 1 個搭載可能)モデルの Express5800/R110 では HDD(RAID 構成) 電源ユニット 冷却ファンなど回転部品およびメモリの冗長化 さらに HDD 電源ユニットの ホットスワップ(活線挿抜)に対応していますが それ以外のコンポーネントの故障時は システム ダウンを引き起こす可能性があります 3

2-Way モデルの Express5800/R120 では 回転部品とメモリの冗長化に加え 冷却ファンのホットスワップに対応し 耐故障性を高めています 4-Way モデルの Express5800/R140 では 1-Way/2-Way ではシステム ダウンとなってしまうような CPU メモリ チップセットの訂正不能なハードウェア不具合時にも OS と連携した故障箇所の閉塞を行う機能 (MCA リカバリ ) に対応することで システムの安定稼動を確保できます 可用性という観点では さらに上位に位置するのが ftサーバです ftサーバでは 主要なコンポーネントを全て二重化しており 2-Way サーバ丸ごと二台分に相当する冗長化を実現しています Express5800/ft サーバの開発 以前から銀行の勘定系システムや ライフラインの制御システムのように非常に重要なシステムでは メインフレーム コンピュータやクラスタ システムによって 高い可用性を実現しています これらは今後も利用され続けていくでしょうが 社会のあらゆるサービス ビジネスがネットワークを介して結合されている現在では これらの限定された範囲に限らず より身近なところにある IT 機器にも高可用性が求められるようになります しかし 高価なメインフレームや 運用の複雑なクラスタ システムはそのような用途には必ずしも向いておらず 低価格で誰にでも簡単に扱える 高い可用性を有する製品が求められていました この期待に応えて NEC は 2001 年 6 月に米国 Stratus 社と共同で以下のコンセプトに基づき IA サーバ ( インテル アーキテクチャに基づくサーバ ) をベースとして可用性を飛躍的に高めた FT サーバ (Fault-Tolerant Server) を製品化しました (1) 無停止型運用ハードウェアを二重化することで 何れか一方が故障しても動作継続 4

(2) 無停止保守システムの稼動を継続したまま 故障した部品を交換 (3) 汎用 OS/ ソフトウェアの利用誰でも容易に使えるように Windows / Linux / VMware といった汎用の OS を搭載し 一般サーバと同様の運用操作性を実現 ft サーバの市場での認知が進むにつれ NEC の IA サーバのフラグシップとして ft サーバを推す声が高まり この勢いをさらに加速するために 2003 年から自社技術による ft サーバの研究開発をスタートしました それまでは Stratus 社との協業契約のもと 共同で開発した技術をベースに製品化してきましたが 最新の技術トレンドへの追従 価格低減 お客様からの多様な要求に応えるために NEC の強みであるハードウェアの開発技術力を活かした自社開発製品が必要との判断によるものです 2 年半の開発期間を経て 2006 年 2 月に ft 制御 LSI GeminiEngine を搭載した自社開発 ft サーバ Express5800/320Fa が出荷されました これ以後 NEC はインテルの最新 CPU / チップセットにタイムリーに追随した ft サーバを開発しており Stratus 社 1 へもハードウェアを提供しています また NEC の開発する ft サーバ制御用 LSI は 2017 年現在 5 代目 GeminiEngine が出荷されており 後継機種に向けて 6 代目も開発中です GeminiEngine HW の二重化を実現する中核 LSI で NEC によって開発されています 1 現在 NEC は Stratus 社と ft サーバを共同開発しており ハードウェアは NEC が開発し ソフトウェアは Stratus 社が開 発しています 5

Express5800/ft サーバの特長 前ページのコンセプトに示した通り ft サーバとは ハードウェア故障でも止まらない 止めずに修理 交換が可能 既存 OS/アプリがそのまま動作 を達成する ノンストップを追及したサーバです この ため 一般的な PC サーバとは大きく異なる構造を持って います 右は ft サーバの模式図ですが 筐体の中に全く同一の 固まり(これを CPU/IO モジュールと呼びます)が2個入 っています それぞれの CPU/IO モジュールは 中央に 位置する専用 LSI 以外は 一般サーバとほとんど同じ部品で構成されており モジュール単体でサー バとして動作することが可能です 中央の専用 LSI は NEC の開発する GeminiEngine であり ft サーバを特徴づける最も重要な部 分です ft サーバは これらハードウェアによる二重化機能と ソフトウェアによる二重化制御の双 方の技術を組み合わせ ノンストップを実現しています 以下 その特徴を詳しく説明します 故障しても止まらない ft サーバ 右図は ft サーバ システムに おけるソフトウェアとハードウ ソフトウェアによるフェイルオーバ 運用系デバイス ェアの関係を概念的に示してい Ether ます CPU やチップセットといっ た主要コンポーネントがシステ ムの土台として全体を支えてお HDD (SAS/FC) メモリ 待機系デバイス 障害 CPU チップセット 故障 OS デバイス ドライバ ft制御lsi GeminiEngine Ether HDD (SAS/FC) ft制御lsi チップセット CPU メモリ GeminiEngine ロックステップ動作 ロックステップ動作 ハードウェアによる故障箇所の論理的切り離し り その上に OS が動作しています また Ether(イーサーネット)や SAS (シリアル アタッチ SCSI) FC (ファイバ チャネル)で制御される HDD といった I/O コンポーネントもこの土台上にあ り OS やドライバから命令を受けて動作しています 土台として CPU やメモリが二組存在していますが これらは後述するロックステップ技術により 完全に同一の動作を行っており OS はどちらのハードウェアで動作しているかを意識しておらず またシステムとしては一つの OS インスタンスのみが動作しているのと等価です ft サーバでは全てのコンポーネントが二重化されており I/O コンポーネントの故障発生時には ソフトウェアによって使用デバイスの切り替え(フェイルオーバ) が行われ 動作を続行します 一 6

方 CPU やチップセットは ソフトウェア自身が動作する土台であるため 通常時は 両者をロック ステップ技術により全く同一の動作をさせ 故障時にはハードウェアによって故障箇所が論理的に 切り離され 動作を続行します 以上の仕組みにより ft サーバは故障しても止まらない運用を可能 としています システムを止めない修理交換 右図は最新の ft サーバ Express5800/R320e,f の模式図です 赤い枠で示される CPU/IO モジ ュールと CPU メモリ 電源ユニット HDD バッ クプレーン フロントパネルの各コンポーネント は交換可能単位であることを示しています ま たこのうちバックプレーン2を除く全てのコン ポーネントは システムを止めずに交換すること が可能です この実現のため ft サーバの筐体は 下図に示す通り 徹底したモジュール構造となっ ており 各コンポーネントを容易に交換すること が可能です なお CPU/IO モジュールには EXPRESSSCOPE と呼ばれる LED が搭載され 故障発 生時には どのコンポーネントを交換すべきかが 一目で分かるようになっており 迅速な故障箇所 の判断 交換 復旧を可能としています 以下に CPU が故障した場合を例にとって 実際のモジュール交換の流れを示します 2 バックプレーンにはコネクタと配線しか存在しておらず 故障の可能性はほとんどありません 7

1. 正常運転時 ft サーバは二重化状態で動作 2. 故障が発生(仮に CPU が故障)すると GeminiEngine が故障モジュールの CPU 部位を切り 離し 残ったモジュールで動作を継続(この際 故障モジュールの EXPRESSSCOPE には CPU が故障したことを示す LED がアンバー点灯) 3. 故障モジュールを引き抜き 故障コンポーネント(この場合 CPU)を交換 ft サーバは残った モジュールで引き続き動作を継続 4. 交換修理済みのモジュールを ft サーバに戻すと GeminiEngine が自動的に再同期化処理 を行い 二重化状態に復旧 以下 [1]に戻る 二重化動作 1 再二重化処理 動作継続 2 4 動作継続 故障CPU 交換 故障箇所切 り離し 3 モジュール 引き抜き 既存 OS/アプリがそのまま動作 無停止型のフォールト トレラント(FT)サーバは過去にも幾つかのメーカーが開発しており 非 常に高い可用性を有していましたが いずれも専用 OS を搭載した FT 専用装置であり 限られた領 域でしか使用されませんでした その後 Windows や Linux など いわゆるオープン システムを 使用する クラスタ システムが登場しました クラスタ システムはハードウェアだけでなく ソ フトウェアの障害にも対処できるため 高い可用性を有するシステムを構築可能ですが 故障時の 切り替えはソフトウェアに負うところが多く また使用するアプリケーションも バックアップ サーバへ切り替わって継続稼動することが前提となるため 既存のどんなアプリケーションもその ままクラスタ システムで使用できるわけではありません クラスタ システムの使用が前提では 8

ないアプリケーションでは ほとんどの場合 処理引継ぎのための改造が必要となります 一方 Express5800/ft サーバは システム上は 1 つの OS が稼動する 1 台のサーバとして動作しています 3 そのためシステム構築は 二重化されたハードウェアを意識する必要がなく 通常のサーバと同様に行えます ミドルウェアやアプリケーションに特別な設定を行わずに そのまま利用可能ですので 通常のサーバから Express5800/ft サーバに置き換えるだけで システム全体の可用性を向上させることができます 既存 OS/ アプリケーション動作のポイント ネットワーク上では 通常の 1 台のサーバとして存在し 二重化を意識することなく利用可能 アプリケーションの二重化設定は不要 利用アプリケーションの制御もなし シングル サーバのように運用できるので 管理は容易かつ低コスト 99.999% を超える可用性可用性とはシステムが継続して稼動できる能力のことをいいます 混同されやすい言葉に信頼性がありますが 厳密な意味では可用性と信頼性は異なります 信頼性は故障する頻度が少なく 結果として故障している期間が短いことを指します 一方 可用性は利用者がシステムを利用し続けられる能力のことを指します 一般には故障が多ければ信頼性が低く 可用性も低くなります しかし故障が発生しても冗長化されて 実際の使用には影響が無い場合 可用性は高く保たれます よく ft サーバは故障しないという誤解がありますが 実際には各種コンポーネントがほぼサーバ 2 台分あるため 故障率は一般サーバの約 2 倍あります ft サーバは故障しないのではなく 故障してもシステムを使用し続けることが可能 つまり高可用性サーバを目指しています 可用性を数値として表す場合 稼働率を用います 稼働率とは修理可能なモジュール コンポーネントが 規定の時間内に機能を維持している確率のことをいいます 3 VMware 及び Windows Server 2016,2012R2,2008R2 Hyper-V TM 対応モデルでは仮想化による複数 OS の稼動が 可能です 9

稼働率 99.9999% 99.999% 99.99% 99.9% 99% 年間停止時間 32 秒 5 分 15 秒 52 分 34 秒 8 時間 46 分 3 日 15 時間 36 分 NEC の Express5800/ft サーバ シリーズは稼働率 99.999% 以上を達成しており 適切に運用さ れた場合の年間停止時間は 5 分 15 秒以下と 極めて高い可用性を実現しています ( 年間停止時間は設計値から算出される平均停止時間であり 稼働時間が保証されるものではありません ) Express5800/ft サーバの基本アーキテクチャ ft サーバに求められる機能は非常に多岐に渡っていますが 基本的な思想は至って単純です それは 2 つのハードウェアを用意し 一方が故障して動作を停止しても 正常な方が動作を継続する というものです これを実現するために ハードウェア ソフトウェア共に多くの機能が必要となりますが 大きく分けて以下の 3 つの機能が基本となっています I/O フェイルオーバ サプライズ リムーバルとエラーの隠蔽 ロックステップ ft サーバの 2 つの CPU/IO モジュールは CPU やメモリ チップセットを含む CPU サブシステム部と 各種 IO デバイスを含む IO サブシステム部に分かれており それぞれ二重化の方式が異なります 次ページの図は CPU サブシステム IO サブシステムの範囲と概念を示しています CPU サブシステムは二つのモジュールで全く同じ動作をしており 双方から発行される 2 つのリクエストは GeminiEngine で 1 つにまとめられて処理されるため システムとしては実質 1 個の CPU サブシステムが動作しているのと等価になります 一方 IO サブシステムは バックプレーンを介してモジュール間をまたがって存在しており 二重化状態では 2 モジュール分の IO デバイスが存在します 4 また CPU サブシステムからは両モジュールの IO デバイスが見えており このことから IO サブシステムにおいては ソフトウェアによる二重化制御が可能となっています 4 R320c d e f では DVD や USB などの一部デバイスは 利便性を考慮してシステムで一つしか存在しません なお こ れら単一デバイスが故障してもシステムが停止することはありませんし やはり稼動したままで交換が可能です 10

I/O フェイルオーバ I/O デバイスは両モジュールで同一の構成となっており どちらか一方の I/O デバイスがアクテ ィブ側として通常使用され もう一方はスタンバイ側として待機状態になります5 使用しているア クティブ側デバイスで故障が発生した場合 これをソフトウェア(デバイス ドライバ)で検出し 直 ちにスタンバイ側に切り替えます この代替処理(フェイルオーバ)方式は 一般的な PC サーバの I/O デバイス冗長化技術として開発されたものであり さらに ft サーバでは システムの稼働中にも 故障デバイスを交換可能とする独自のモジュール構造により 一層の機能強化がなされています 5 設定により 両方の I/O デバイスを使用することは可能ですが 二重化動作時と単体動作時の I/O 性能を平準化するた めに アクティブ/スタンバイでの使用を想定しています 11

例えば ネットワークにおいては チーミング (Windows ) やボンディング (Linux ) と呼ばれる方法が用いられます これは 複数の物理ネットワーク ポートを束ねて一つの仮想ネットワーク ポートを生成し ネットワークの障害発生時には 別の物理ポートに切り替えて動作を継続するため 仮想ネットワーク ポートとしては障害の影響が及びません 同様にファイバ チャネルや SAS 等のストレージ系ではマルチパス I/O ドライバと HDD のミラーリングによって I/O フェイルオーバを実現します サプライズ リムーバルとエラーの隠蔽デバイスの故障は 予期せぬ動作を引き起こし システムを巻き込んだ障害に発展する場合があります 典型的な故障の例として I/O デバイスとチップセットとの接続に使用されている PCI Express で何らかの訂正不可能な致命的なエラー (Fatal Error) が発生した場合を考えます ( 下図 - 左 ) この場合 一般的な PC サーバでは致命的なハードウェア エラーとして OS に通知され その ままリカバリできずにシステム ダウンに至ってしまいます 一方 ft サーバでは 全ての I/O デバイスは GeminiEngine に接続されており I/O デバイスで発生している事象を全て把握しています 仮に同様に PCI Express で致命的なエラーが発生した場合 GeminiEngine は該当部分を論理的に切り離し 該当 I/O デバイスをシステムから見えない状態にします また OS へはそのままエラー通知をせずに Hot-Plug 6 で使用される割込みを使用し デバイスが突然引き抜かれたことを示す サプライズ リムーバルとして通知を行います これにより OS には実際のハードウェア エラーが隠蔽され システム ダウンを防ぐことが可能となっています なお サプライズ リムーバル通知を受けた OS は該当デバイス ドライバにその旨通知を行い デバイス ドライバ側はその通知により I/O フェイルオーバを発生させ 代替デバイスで運用を続行します 何の前準備 通知もなく突然デバイスが抜かれた場合を想定した サプライズ リムーバル 6 Hot-Plug とはシステムを稼動させたまま PCI カードや PCI Express カードを抜き挿しすることを可能にする方式 12

は Windows や Linux で使用されている Hot-Plug で規定された機能の一つですが オプション扱いのため 全てのデバイス ドライバやアプリケーションがこの機能をサポートしている訳ではありません ft サーバではこのサプライズ リムーバル機能のサポートが必須のため どんな I/O デバイスも使用可能という訳にはいかず 一般サーバに比べサポートできるデバイスに制限があります 現状下記のデバイス ドライバに対してサプライズ リムーバル機能を追加し サポート対象 I/O デバイスとしています イーサーネット SCSI / SAS ファイバ チャネル ビデオ ディスプレイ USB ( 但し I/O フェイルオーバの際は 一旦デバイスの挿抜が発生します ) サプライズ リムーバルをサポートしない 不適切なドライバを使用した場合 正しく I/O フェイルオーバが行われず システム障害を引き起こす場合があります 特定のアプリケーションにおいてはドライバにフィルターをかけたり ハードウェアに直接アクセスするものがあり 使用には注意が必要です ご不明の際は NEC ファースト コンタクト センターへお問い合わせ下さい http://www.nec.co.jp/products/express/question/top_sv1.shtml ロックステップロックステップは ft サーバの最も重要な機能であり NEC が世界に誇るオンリー ワン技術でもあります CPU やチップセット メモリなどのサーバの基幹コンポーネントが存在する CPU サブシステムは それ自身上で OS や制御ソフトウェアが動作しています このため CPU サブシステム内のコンポーネントが故障してしまうと OSは動作続行不可能な状態となり さらにサブシステム内のデータは全て不正状態 または消失してしまいます 従って CPU サブシステムにおいては I/O サブシステムのような稼動系 / 待機系によるフェイルオーバは不可能です ft サーバでは 2 つのモジュール間の CPU サブシステムをクロック単位で完全に同期させて動作させており これをロックステップと呼びます 両方とも全く同じ 13

動作をしているので 故障発生時は対象となる CPU サブシステムを論理的に切り離し 正常な方で 動作を続行させます 従い CPU サブシステムには稼動系 / 待機系の概念はありません ロックステップの実現には最先端のテクノロジが必要となります NEC のハードウェア開発陣は 様々な独創的アイデアを GeminiEngine に搭載することにより 常に最新ハードウェアでのロックステップを実現させています その困難さから 現在ではインテル アーキテクチャを使用したロックステップ型 FT サーバのハードウェア開発は 世界でも NEC のみとなりました GeminiEngine とハードウェア二重化技術 GeminiEngine は ft サーバを実現するための中核 LSI で 主に以下の役割を担っています デターミニズムの確保とロックステップの実現 CPU コンテキストとメモリ内容の同期化 エラー検出と切り離し制御 以下 それぞれについて詳細に説明します デターミニズムの確保とロックステップの実現ロックステップは ftサーバ実現の最も重要な要素です 具体的には LSI に外部から全く同じクロック信号を入力し 同じタイミングでリセットを解除すれば 何回やっても毎回必ず同じ動作をするはずです この特性を デターミニズム と呼びます また 全く同一の LSI を二つ並べ 同一のクロック信号を入力して同時に動かし始めると デターミニズムが確保されている場合 2 つの LSI は全く同じ動作をします この状態を ロックステップ と呼びます 過去にはこの概念でロックステップによる FT サーバを開発していたベンダーも多くありましたが 最近ではあらゆるコンポーネント インタフェースが高速化し さらにアナログ特性に依存する部分も増大しており デターミニズムを利用した FT サーバの開発は困難を極めています 例えば CPU 動作周波数の高速化に加え 温度 / 消費電力による CPU 動作周波数 電圧の調整機能などは多分にアナログ的な要素が関与しており デターミニズムの維持を困難にしています またインタフェースも CPU を接続するインテル QPI ( インテル QuickPath Interconnect ~ 8.0GT/s 動作 ) や I/O デバイスを接続する PCI Express (5.0GT/s 動作 ) など 高速シリアル伝送が主流となっており 僅か数百ピコ秒 7 タイミングがずれただけでもロックステップ出来ないという状況にあり FT サーバの開発には極めて高度な技術が要求されています 7 1 ピコ秒は 1 秒の 1 兆分の 1 の長さ 0.000000000001 秒 psec と表記 14

特にロックステップの実現が難しい CPU とチップセットにおいては インテルと協力してロックステップ技術の開発を行っています ft サーバは一般のサーバと同じ インテルが開発する CPU チップセットを採用していますが これらにはロックステップを可能とする 特殊な動作モード というものは存在しません このため CPU チップセット内部 PCI Express インタフェースのそれぞれで ロックステップを可能とする技術をインテルと協力して開発する必要がありました また ロックステップを実現する上で必要なクロック信号の位相調整 クロック源振の二重化などはクロック チップ ベンダーとの緊密な連携により開発 実現されています このように様々なコンポーネント ベンダーとの協力体制の下で ロックステップ技術が開発されており その技術の全てが GeminiEngine に搭載されています Express5800/R320e,f においては GeminiEngine により 100 ピコ秒レベルでのクロック位相調整やリセットのタイミング調整が行われており CPU やチップセットをはじめ 多数の LSI のデターミニズムが確保され ロックステップを実現しています CPU コンテキストとメモリ内容の同期化 ft サーバ起動時や ボード交換による CPU サブシステムの二重化の際は 全てのメモリ内容を もう一方の CPU/IO モジュールにコピーします コピーのほとんどは Brownout Copy と呼ばれる方式で行われ 稼働中のサービスが止まることはありません 8 コピーの最終段階では 一旦システム 8 Windows Server 2016,2012R2 2008 R2 で Hyper-V TM 使用の場合 メモリ コピーは全て Blackout Copy 方式で 15

を停止させる Blackout Copy 方式で CPU の内部情報 ( コンテキスト ) とキャッシュ内容がコピーさ れます この際 僅かにサービス停止が発生しますが 極めて短い時間のためシステムに影響を及 ぼすことはありません Brownout Copy 時の動作図中 左側が稼働中の CPU/IO モジュールを示し 右側は被二重化対象モジュールを示しています メモリ コピーは GeminiEngine 内部のデータ ムーバ ( 図中 DM) で行われます 但し この間も CPU I/O デバイスは動作し続けており メモリの内容も刻一刻と変化しています コピー済みのメモリ領域が更新された場合 再度その部分のみコピーを行います なお これらコピー制御は ft 制御ソフトウェアで行われます Blackout Copy 時の動作 Brownout により 全メモリ エリアのコピーが完了すると 全ての I/O 及び OS の動作を HW 的に一旦停止させます そして ft 制御ファームウェアにより CPU のコンテキストとキャッシュ内容がメモリ上にフラッシュされ データ ムーバは該当するメモリ内容をコピーします 両モジュールをロックステップさせるために 両 CPU に同期リセットを掛けます これ以降 両モジュールの CPU は全く同じ動作をします 最後に CPU に停止直前のコンテキストを復帰させ I/O 及び OS の動作を再開させます これらの Blackout 処理は短い時間で行われ 稼働中サービスにインパクトを与えることはありません エラー検出と切り離し制御 ft サーバにおいては エラーの検出能力と エラー発生箇所を特定する分解能を上げることが大変 行われます 実装メモリ量に応じ 数秒 ~ 数十秒のシステム停止時間が発生します システム構成ガイドを参照のうえご 注意願います 16

重要です また エラー箇所を論理的に切り離して動作を続行することが求められるため 不正動作が伝搬しない工夫も必要となっています Express5800/ft サーバではシステムを 4 つのサブシステムに区切って管理しており エラー検出の際はこの 4 サブシステム単位で切り離し制御が行われます この各サブシステムにまたがって存在する GeminiEngine は システム中の全てのトランザクションと チップセットからのエラー信号を監視しており ひとたびハードウェア的なエラーが検出されると即座に該当部位を論理的に切り離します しかし 切り離したサブシステムを含むモジュールは直ちに修理交換が必要と判断される訳ではありません それは ハードウェアのエラー発生原因は多岐に渡っており 一概に故障と判断できないからです ハードウェアのエラー要因は主に以下のものが挙げられます 1. 故障によるエラー発生 2. 外部からの電気的ノイズによる一時的な誤動作 3. 宇宙線やその他放射線によるメモリ化け この中で [2] は稼働環境に依存して [3] は通常状態において ある一定の確率で発生する一時的なエラーであり 交換を要するものではありません この判断のため ft サーバではエラー検出で切り離した後 サブシステム内のハードウェアを診断チェックし 明らかな故障が見つからない場合 再度二重化して使用を継続します 但し 診断チェックでは簡単に見つからない故障の可能性も排除できないため サブシステム毎にエラーの発生回数をカウントしておき ある閾値を超えてエラーが発生した場合 再組み込みを停止し EXPRESSSCOPE の LED 点灯などのエラー通知を行なうとともに 通報機能による保守サービス会社への自動通報 ( 要登録 ) によりモジュールの交換を促します 17

これらは具体的には MTBF と呼ばれる値を用いて制御しています MTBF とはコンポーネントで故障 ( エラー ) が発生するまでの時間の平均値を意味し 平均故障間隔とも呼びます 例えば MTBF が 10 万時間のシステムの場合 確率的に 10 万時間 ( 約 11 年半 ) に一度故障が発生することを意味します 一般的に MTBF はサーバを構成する全ての部品から計算して求めることが出来ます Express5800/ft サーバでは 計算して求められた MTBF 値にさらに 発生頻度を加味した独自の方式を用いてモジュールの切り離し / 再組み込み制御を行っています 切り離し / 再組み込み制御の概要 いずれのケースも 図中下側のモジュールが無停止で動作し続けていることに注意 故障 LSI 宇宙線など Error Error Error Error Error Error Error 以後, 片側モジュールのみで動作 二重化を維持 Error 規定時間 規定時間内にハードウェア エラーがしきい値を超えて発生した場合は故障と判断し モジュールを切り離し 以後 残った片側モジュールのみで動作続行 規定時間 規定時間内のハードウェア エラー回数がしきい値を下回る場合は一時的な誤動作と判断し モジュールを再組み込み このように エラーが発生した場合でも 実際の使用上問題のない 一時的なエラーと判断できる 場合は 可能な限り再二重化を行い 可用性を上げる工夫がなされています おわりに クラウド コンピューティングや仮想化によるサーバ統合を支える 高可用性プラットフォームである ft サーバの機能詳細について その中核となる GeminiEngine を中心に使用されている技術を紹介しました NEC は 一般サーバの可用性を飛躍的に高めるクラスタと ftサーバという 2 つの高可用性の技術を持つ 数少ない企業の 1 つです 今後もこれらの特徴を適材適所で活かし お客様からの様々な要求に応えるソリューションを提供してまいります Intel インテル Xeon は 米国および他の国における Intel Corporation の商標または登録商標です Windows の正式名称は Microsoft Windows Operating System です Microsoft Windows Windows Server 2016,Windows Server 2012 Windows Server 2008 Hyper-V は 米国および他の国における Microsoft Corporation の商標または登録商標です Linux は 米国および他の国における Linus Torvalds 氏の商標または登録商標です VMware は 米国および他の国における VMware, Inc. の商標または登録商標です 記載事項は 2017 年 8 月現在のものです 18