Radeon Open Compute „ROCm” Stack v3.1, kiadva a RAS-szal a Vega 7nm-hez, SLURM támogatás a jobb erőforrás-kezelés érdekében, de a Navi még mindig hiányzik

Hardver / Radeon Open Compute „ROCm” Stack v3.1, kiadva a RAS-szal a Vega 7nm-hez, SLURM támogatás a jobb erőforrás-kezelés érdekében, de a Navi még mindig hiányzik 2 perc olvasás

AMD Radeon



A Radeon Open Compute vagy a „ROCm” verem új verziója most van elérhető letölthető. A Radeon Open Compute v3.1 jó néhány funkciót magával hoz, de furcsa módon az AMD Navi és a GFX10 támogatása még mindig hiányzik.

A ROCm, a GPU által gyorsított számítástechnika legelterjedtebb univerzális platformja, most a 3.1-es verzión van. A moduláris platform legújabb frissítése, amely lehetővé teszi a hardvergyártók számára, hogy az ROCm keretrendszert támogató illesztőprogramokat készítsenek, tartalmaz néhány várva várt funkciót, például a 7 nm-es Vega RAS-támogatását és az AMD GPU-k SLURM-támogatását. Egyelőre ismeretlen okokból azonban a ROCm még mindig nem rendelkezik teljes támogatással a következő generációs AMD Navi Architecture számára.

A Radeon ROCm v3.1 újdonságai:

A Radeon ROCm v3.1 új telepítésének legnagyobb és legkézenfekvőbb változása a ROCm Installation Directory struktúrában van. Az ROCm eszköztár friss telepítése telepíti a csomagokat a / opt / rocm- mappába. Korábban ROCm eszközkészlet csomagokat telepítettek a / opt / rocm mappába.



Az ROCm új verziója továbbfejlesztette a Vega 7nm GPU-k megbízhatóságának, hozzáférhetőségének és szervizelhetőségének (RAS) támogatását. Ez a 7 nm-es Vega-munka feltehetően még mindig a mikroszkóp alatt van Vega-alapú „Arcturus” az idén érkező számítási gyorsító. A támogatás a következőket tartalmazza:



  • UMC RAS ​​- HBM ECC (kijavíthatatlan hiba-injekció), oldal visszavonása, RAS-helyreállítás GPU-n keresztül (BACO) visszaállítás
  • GFX RAS - GFX, MMHUB ECC (kijavíthatatlan hiba-injektálás), RAS-helyreállítás GPU-n keresztül (BACO) visszaállítás
  • PCIE RAS - PCIE_BIF ECC (kijavíthatatlan hibajuttatás), RAS helyreállítás GPU-n keresztül (BACO) visszaállítás

A Radeon ROCm v3.1 SLURM támogatást is kap az AMD GPU-khoz. A SLURM vagy az egyszerű Linux segédprogram az erőforrás-menedzsmenthez az egyik nagyon preferált és könnyen használható fürtkezelő és munkaütemező rendszer a Linux-fürtök számára. A SLURM előnyös, mivel nyílt forráskódú, hibatűrő és nagymértékben méretezhető.

Ez a rendszer most már jól képes együttműködni az AMD GPU-kkal. A SLURM legújabb, 20.02.0 verziója olyan AMD beépülő modulokat tartalmaz, amelyek lehetővé teszik a SLURM számára az AMD GPU-k automatikus felismerését és konfigurálását. Ezenkívül összegyűjti és beszámol a grafikus chipek energiafogyasztásáról. A SLURM támogatás hasznos kiegészítő, mivel a Radeon GPU-kat és más nagyobb AMD GPU-fürtöket használó szuperszámítógépes telepítések száma növekszik.

Annak ellenére, hogy számos funkció szerepel benne, még mindig nincsenek jelei a GFX10 / Navi támogatásnak a ROCm-ben. A GitHub oldal a ROCm számára frissítésre került az összes változás, a telepítési megjegyzések és az ismert problémák tükrözése érdekében.



Címkék amd