p ü ü p ü ü
} Powe r NW Mem. CPU GPU Base 最大負荷アプリA ペタスケール 最大負荷アプリ A アプリ B ポストペタスケール ( 従来型 ) 最大負荷アプリ A アプリ B ポストペタスケール ( 電力制約適応型 ) } } }
p p p p Blue=EP type Red=With Comm. & Sync. Total nodes Procs. Per Node Cores Per Procs. Power Msrmt. Cab(LLNL) Intel E5-2670 Sandy Bridge 1,296 2 8 RAPL BG/Q Vulcan (LLNL) IBM PowerPC A2 24,576 1 16(compute) EMON Teller (SNL) AMD A10-5800K Piledriver 104 1 4 PI HA8K(Kyushu Univ.) Intel E5-2697v2 Ivy Bridge 965 2 12 RAPL
CPU CPU memory modul e memory modul e memory modul e memory modul e cor e cor e cache MC cor e cor e cor e cor e cache MC cor e cor e memory modul e memory modul e memory modul e memory modul e
出典 : 140"" 120"" Module"(CPU+DRAM)"power" 30% 120# 110# CPU$power$cap CPU#power#cap No#power#constraint Power""[W] 100"" 80"" 60"" CPU$power$ CPU#Power#[W] 100# 90# 80# 40"" 20"" DRAM%power% 70# 60# 0"" 0" 300" 600" 900" 1200" 1500" 1800" Module"IDs 50# 1.0## 1.5## 2.0## 2.5## CPU#clock#frequency#[GHz]
Module#(CPU+DRAM)#Power#[W] 140# 130# 120# 110# 100# 90# 80# 70# No#power#constraint Cm=Target#Average#Power# Cm=110W Constraint#for#Module Cm=100W Cm=90W Cm=80W Cm=70W 60# 64% 50# 40# 0.8## 1.0 1.2## 1.6## 2.0## 2.4## 2.8## 3.2## Normalized#ExecuIon#Time 出典 :
p ü p ü
W/O power-constraint Power W/ power-constraint (Conventional) W/ power-constraint (Proposed) Power variation Mitigate Variability Same total power budget Performance (=CPU Frequency)
f = α( f f ) + f P = α(p P ) + P P = α(p P ) + P (0 α 1) "Module"and"CPU"Power"[W] 120"" 14"" 100"" 16"" *DGEMM Module" MHD 110"" 13"" 90"" Module" 15"" 100"" R²"="0.999" R²"="0.999" CPU" 12"" 80"" 14"" 90"" R²"="0.999" 11"" 70"" 13"" 80"" 10"" 60"" DRAM" 12"" 70"" 9"" 50"" DRAM" R²"="0.991" 11"" 60"" R²"="0.996" 8"" 40"" CPU" 10"" 50"" 7"" 30"" R²"="0.999" 9"" 40"" 6"" 20"" 8"" 1.2"" 1.4"" 1.6"" 1.8"" 2.0"" 2.2"" 2.4"" 2.6"" 1.2"" 1.4"" 1.6"" 1.8"" 2.0"" 2.2"" 2.4"" 2.6"" CPU"clock"frequency CPU"clock"frequency 出典 : "DRAM"Power"[W] f "Module"and"CPU"Power"[W] f "DRAM"Power"[W] f = P, P = f, f = f P P P, P = P, P = P P P P α
Power Variation Table (PVT) Module ID Normalized Power 1 1.0........ k 1.2 Module ID Power Consumption 1 100........ k 120 Module 1 Pwr Pwr Perf. Module 2 Perf. Module 3 N 0.8 N 80 Pwr Perf. Module ID k Power Consumption k 120 Module N Pwr Perf.
Power Capping (Pc) using RAPL Frequency Selection (Fs) using CPUFreqlibs Power Capping (Pc) Frequency Selection (Fs) Power Constraint Guaranteed Not guaranteed Performance Equivalence Not guaranteed Guaranteed
手法名 アプリ依存? モジュール依存? 電力モデル補正 制約手法 Naive No No No Power Cap Pc Yes No Yes Power Cap VaPc Yes Yes Yes Power Cap VaFs Yes Yes Yes Freq. Sel. VaPcOr Yes Yes No Power Cap VaFsOr Yes Yes No Freq. Sel. Va=Variation-Aware, Pc=Power Capping, Fs=Frequency Selection Or=Observed power data are used
naïveha8k 2.0## 1.5## 1.0## 0.5## 0.0## 6.0## 5.0## 4.0## 3.0## 2.0## 1.0## 0.0## 2.0## 5.4x 1.5## 1.0## 0.5## 0.0## 5.0## 4.0## 3.0## 2.0## 1.0## 0.0## 3.0## 2.5## 2.0## 1.5## 1.0## 0.5## 0.0## 3.5## 3.0## 2.5## 2.0## 1.5## 1.0## 0.5## 0.0## 出典 :
Module#(CPU+DRAM)#Power#[W] 140# 130# 120# 110# 100# 90# 80# 70# 60# 50# before after Cs=ApplicaIon#level#power#constraint No#power#constraint Cs=211.2KW Cs=192.0kW Cs=172.8kW Cs=153.6kW 64% Cs=134.4kW 40# 0.8## 1.0 1.2## 1.6## 2.0## 2.4## 2.8## 3.2## Normalized#ExecuIon#Time Module#(CPU+DRAM)#power#[W] 140# 130# 120# 110# 100# 90# 80# 70# 60# 50# No#power#constraint Cs=211.2KW Cs=192.0kW# Cs=172.8kW Cs=ApplicaIon#level#power#constraint Cs=153.6kW Cs=134.4kW 12% 40# 0.8## 1.0 1.2## 1.6## 2.0## 2.4## 2.8## 3.2## Normalized#ExecuIon#Time 出典 :