NVIDIA Ampere A100 250W TDP GPU PCIe 4.0-n, AI, adattudomány és szuperszámítógép számára készült, ígért 90 százalékos, 400 W-os modelltel

Hardver / NVIDIA Ampere A100 250W TDP GPU PCIe 4.0-n, AI, adattudomány és szuperszámítógép számára készült, ígért 90 százalékos, 400 W-os modelltel 2 perc olvasás

Nvidia



Az NVIDIA hivatalosan is piacra dobta az A100-at, egy PCIe 4.0 kompatibilis GPU-t, amely a következő generációs Ampere architektúrán alapul. Bár alacsonyabb, 250 W-os TDP-profillal rendelkezik, az NVIDIA azt ígéri, hogy a PCIe 4.0 Ampere A100 GPU képes lesz a teljes 400 W-os A100 HGX GPU teljesítményének akár 90 százalékát is felajánlani. A növekvő Ampere A100 GPU-család harmadik változata, az A100 PCIe a mesterséges intelligencia (AI), az adattudomány és a szuperszámítógépes fürtöket futtató szerverek számára készült.

Az NVIDIA felfedte az A100 GPU PCI-Express 4.0 változatát. A GPU a 7 nm-es Ampere mikroarchitektúrán alapul. Ezenkívül a vállalat bejelentett számos A100 meghajtású rendszert a vezető szervergyártóktól, köztük az Asus, a Dell, a Cisco, a Lenovo és még sok más társaságtól. A 250 W-os A100 PCIe 4.0 GPU-gyorsító meglehetősen hasonlít a teljes 400 W-os TDP variánsra, és az NVIDIA szintén közel azonos teljesítményt ígér a TDP-profil jelentős csökkenése ellenére.



NVIDIA A100 Ampere GPU PCIe 4.0 formátumban, ugyanazzal a 400 W-os A100 HGX GPU konfigurációval, de 250 W-on:

Az NVIDIA bejelentette PCIe 4.0 A100 PCIe GPU gyorsítóját. Az Ampere GPU különféle ipari felhasználású esetekhez érhető el, a rendszerek egyetlen A100 PCIe GPU-tól kezdve a két NVP-csatornán egyszerre két kártyát használó szerverekig terjednek, amelyek összesen 600 GB / s összekapcsolási sávszélességet nyújtanak. A 250 W-os TDP A100 PCIe GPU-gyorsító az alapkonfiguráció szempontjából nem sokat változik, összehasonlítva a 400 W-os A100 HGX GPU-val.



A GA100 GPU rendelkezik a 400 W-os A100 HGX változat specifikációival, 6912 CUDA maggal, 108 SM egységbe rendezve, 432 Tensor maggal és 40 GB HBM2 memóriával, amely ugyanazt az 1,55 TB / s memória sávszélességet biztosítja (kerekítve 1,6 TB / s-ra). s). A GPU-csomag telepítése azonban a PCIe 4.0 szabvány megvolt a maga hátránya, amely jelentősen csökkenti a TDP-t. Állítólag ez 10-50 százalékos teljesítménybüntetést jelent a munkaterhelés alapján. Ezenkívül az A100 GPU 250 W-os TDP-változata inkább rövid, mint tartós terhelésekre alkalmas.

NVIDIA A100 Ampere GPU PCIe 4.0 formátumú teljesítményben:

A TDP-profil jelentős csökkenése miatt feltételezhető, hogy a kártya alacsonyabb órákkal rendelkezik, hogy kompenzálja a kevesebb TDP-bemenetet. Az NVIDIA által kiadott teljesítménymutatók azonban valóban meglepőek, mivel meglehetősen közel állnak a 400 W-os TDP variánshoz. Az FP64 teljesítményt továbbra is 9,7 / 19,5 TFLOP-ra, az FP32 teljesítményt 19,5 / 156/312 TFLOP-ra (Sparsity), az FP16 teljesítményt 312/624 TFLOP-ra (Sparsity) és az INT8 624/1248 TOP-ra ( Ritkaság).



Az egyszerű matematika azt jelzi, és az NVIDIA biztosítja, hogy az Ampere-alapú PCIe 4.0 250W A100 GPU az A100 HGX kártya (400W) teljesítményének 90 százalékát képes leadni a legfelső szerveralkalmazásokban. Ez igazolható, mert kevesebb időbe telik, amíg az új változat elvégzi a fent említett feladatokat. A számoknak azonban csak rövid időközönként érvényesnek kell lenniük. Bonyolult helyzetekben, amelyek tartós GPU-képességeket igényeltek, a 250 W-os PCIe 4.0 GPU akár 90% -tól akár 50% -ig képes teljesíteni a 400 W A100 HGX GPU teljesítményét.

Az Ampere mikroarchitektúra biztosan előnyös lesz az új A100 számára. Az NVIDIA legalább 20-szoros teljesítménynövelést ígér a Volta-alapú elődhöz képest. A PCIe 4.0 A100 GPU többpéldányos GPU technológiát tartalmaz. Ez azt jelenti, hogy egyetlen A100-at akár hét külön GPU-ra is fel lehet osztani különböző számítási feladatok kezelésére. Bár ez fokozza a szegmentálást, van egy 3. generációs NVLink, amely lehetővé teszi több GPU összekapcsolását egy óriási GPU-ba.

Címkék nvidia