|
|
Pascal 架構(gòu)帶來巨大的性能飛躍
NVIDIA Pascal 架構(gòu)使 Tesla P100 能為 HPC 和超大規(guī)模工作負(fù)載提供性能,。憑借每秒超過 21 萬億次的 16 位浮點(diǎn) (FP16) 運(yùn)算性能,,經(jīng)過優(yōu)化的 Pascal 為深度學(xué)習(xí)應(yīng)用程序帶來了令人興奮的新可能,。Pascal 還可為 HPC 工作負(fù)載提供超過 5 萬億次的雙精度浮點(diǎn)運(yùn)算和 10 萬億次的單精度浮點(diǎn)運(yùn)算能力。
通過采用 HBM2 的 CoWoS 技術(shù)實現(xiàn)更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術(shù),,Tesla P100 將計算性能和數(shù)據(jù)緊密集成在同一個程序包內(nèi),,提供的內(nèi)存性能是 NVIDIA Maxwell™ 架構(gòu)的三倍以上。這大幅縮短了為數(shù)據(jù)密集型應(yīng)用程序算出解決方案的時間,。
頁面遷移引擎使編程更簡單
頁面遷移引擎可使開發(fā)人員從管理數(shù)據(jù)移動的工作中騰出時間,,將精力更多地放在計算性能的調(diào)整上。應(yīng)用程序現(xiàn)在可以突破 GPU 物理顯存的容量限制,,達(dá)到幾乎無限量的顯存,。
適用于混合型工作負(fù)載 HPC 的 NVIDIA Tesla P100
適用于 PCIe 的 Tesla P100 使混合型工作負(fù)載 HPC 數(shù)據(jù)中心能在節(jié)省資金的同時大幅提升吞吐量。例如,,一個由四個與 PCIe 互聯(lián)的 Tesla P100 驅(qū)動的 GPU 加速節(jié)點(diǎn),,可以替代各種應(yīng)用程序的多達(dá) 32 個通用 CPU 節(jié)點(diǎn)。利用數(shù)量大幅減少而性能強(qiáng)大的節(jié)點(diǎn)完成各種作業(yè),,意味著客戶可以節(jié)省多達(dá) 70% 的整體數(shù)據(jù)中心成本,。
|