Nvidia RT magok és AMD sugárgyorsítók - magyarázat

Az Nvidia az 2018-as első generációs RTX grafikus kártyákkal egy teljesen új funkcióval ismertette meg a világot, amelynek állítólag meg kellett változtatnia a játék terét, ahogyan mi ismerjük. Az első generációs RTX 2000 sorozatú grafikus kártyák az új Turing architektúrára épültek, és támogatást nyújtottak a valós idejű Ray Tracing támogatáshoz a játékokban. A Ray Tracing már létezett professzionális 3D animációban és szintetikus területeken, de az Nvidia támogatta a játékok valós idejű renderelését a Ray Tracing technológiát használó hagyományos raszterizálás helyett, amely állítólag játékváltoztató volt. A raszterizálás az a hagyományos technika, amelyen keresztül a játékokat renderelik, míg a Ray Tracing összetett számításokkal pontosan ábrázolja, hogy a fény hogyan fog kölcsönhatásba lépni és viselkedni a játék környezetében, mint a való életben. Tudjon meg többet a sugárkövetésről és a raszterezésről ebben a tartalmi darabban .



A Ray Tracing Reflections lehet a Ray Tracing legszembetűnőbb alkalmazása a játékokban - Kép: Nvidia

Még 2018-ban az AMD nem tudott választ adni az Nvidia grafikus kártyák RTX sorozatára és azok Ray Tracing funkcionalitására. A Vörös csapat egyszerűen nem volt kész az Nvidia innovatív bemutatkozására, és ez jelentős hátrányt jelentett a Team Green-hez képest. Az AMD RX 5700 XT fantasztikus grafikus kártya volt, 399 dolláros áron, amely vetekedett a 499 dolláros RTX 2070 Super teljesítményével. Az AMD legnagyobb problémája azonban az volt, hogy a verseny olyan technológiát kínált, amellyel nem rendelkeztek. Ez a sokrétű szolgáltatáskészlettel, a DLSS támogatással, a stabil meghajtókkal és az összességében kiemelkedő teljesítménnyel párosítva jelentős előnyt jelent az Nvidia kínálatában, amikor a Turing vs RDNA generációról van szó.



AMD RX 6000 sorozat sugárkövetéssel

Gyors előrejutás 2020-ig, és az AMD végül az Nvidia legnépszerűbb kínálatába hozta a harcot. Az AMD nemcsak a játékok valós idejű sugárkövetését támogatta, hanem kiadott 3 grafikus kártyát is, amelyek rendkívül versenyképesek az Nvidia legjobb grafikus kártyái számára. Az AMD RX 6800, az RX 6800 XT és az RX 6900 XT fej-fej mellett küzd az Nvidia RTX 3070, RTX 3080, illetve RTX 3090 készülékekkel. Az AMD végül ismét versenyképes a termékcsomag legfelső részén, ami ígéretes hír a fogyasztók számára is.



A sugárkövetés az egyik legfontosabb funkció, amelyet az AMD bemutatott ennek a generációnak - Image: AMD



A dolgok azonban nem teljesen pozitívak az AMD számára sem. Bár az AMD bevezette a valós idejű sugárkövetés támogatását a játékokban, azok sugárkövetési teljesítménye langyos fogadtatásban részesült mind az értékelőktől, mind az általános fogyasztóktól. Bár érthető, mivel ez az AMD első kísérlete a Ray Tracingnél, így kissé igazságtalan lenne elvárni tőlük, hogy az első kísérlet során a legjobb Ray Tracing teljesítményt nyújtsák. Kérdéseket vet fel azonban az AMD Ray Tracing megvalósításának működési módja, összehasonlítva az Nvidia implementációjával, amelyet a Turing és most az Ampere architektúrával láttunk.

Az Nvidia RTX Technologies csomagja

Az AMD kísérlete elsöprőnek tűnik az Nvidia-hoz képest, hogy az AMD lényegében felzárkózott az Nvidiához, és nagyjából csak 2 év állt rendelkezésére a Ray Tracing megvalósításának fejlesztésére és tökéletesítésére. Az Nvidia ezzel szemben már jó ideje tovább fejleszti ezt a technológiát, mivel senkinek sem volt versenye a termékcsomag legmagasabb részén. Az Nvidia nemcsak a Ray Tracing támogatást nyújtotta az AMD előtt, hanem a technológia köré épített jobb támogatási ökoszisztémát is.

Az Nvidia megtervezte az RTX 2000 grafikus kártyák sorozatát, amelynek elsődleges célja a Ray Tracing volt. Ez nyilvánvaló maga a turingi építészet tervezése során. Az Nvidia nemcsak megsokszorozta a CUDA magok számát, hanem hozzáadott egy speciális dedikált Ray Tracing magot is, amelyet RT magoknak neveznek, amelyek kezelik a sugárkövetéshez szükséges számítások nagy részét. Az Nvidia kifejlesztett egy „Deep Learning Super Sampling vagy DLSS” néven ismert technológiát is, amely egy fantasztikus technológia, amely mély tanulást és mesterséges intelligenciát használ felméretezési és újjáépítési feladatok elvégzésére, valamint kompenzálja a sugárkövetés teljesítményvesztését. Az Nvidia egy külön „Tensor magot” is bemutatott a GeForce sorozatú kártyákban, amelyek célja a mély tanulás és az AI feladatok, például a DLSS segítése. Ezen felül az Nvidia játékstúdiókkal is együttműködött, hogy optimalizálja a készülő Ray Tracing játékokat a dedikált Nvidia hardverhez, hogy a teljesítmény maximalizálható legyen.



A Ray Tracing alkalmazásban a fény úgy viselkedik a játékban, mint a való életben - Kép: Nvidia

Az Nvidia RT magjai

Az RT vagy a Ray Tracing Cores az Nvidia dedikált hardvermagjai, amelyeket kifejezetten a játékok valós idejű sugárkövetésével társított számítási terhelés kezelésére terveztek. A Ray Tracingre szakosodott magok nagy terhelést jelentenek a CUDA magokból, amelyek a játékok renderelésének vannak szentelve, így a teljesítmény kihatását nem befolyásolja túlságosan a mag kihasználtsága. Az RT magok feláldozzák a sokoldalúságot, és speciális architektúrájú hardvert valósítanak meg speciális számításokhoz vagy algoritmusokhoz a nagyobb sebesség elérése érdekében.

Az általánosan ismert Ray Tracing gyorsulási algoritmusok a BVH és a Ray Packet Tracing, és a turingi architektúra sematikus diagramja megemlíti a BVH (Bounding Volume Hierarchy) transzverzálisat is. Az RT Core célja a Ray Traced rendereléssel kapcsolatos parancsok azonosítása és felgyorsítása a játékokban.

Az RT mag magyarázata - Kép: Nvidia

Az Nvidia korábbi vezető GPU építésze, Yubo Zhang szerint:

„[Lefordítva] Az RT mag lényegében egy dedikált csővezetéket (ASIC) ad az SM-hez a sugár és a háromszög kereszteződésének kiszámításához. Hozzáférhet a BVH-hoz, és konfigurálhat néhány L0 puffert, hogy csökkentse a BVH és a háromszög adatelérésének késleltetését. A kérelmet az SM nyújtja be. Az utasítást kiadják, és az eredményt visszaküldik az SM helyi nyilvántartásába. Az átlapolt utasítás és más számtani vagy memória IO utasítások egyidejűek lehetnek. Mivel ez egy ASIC-specifikus áramköri logika, a teljesítmény / mm2 nagyságrenddel megnövelhető, összehasonlítva az árnyékoló kód metszésszámításhoz történő alkalmazásával. Bár elhagytam az NV-t, részt vettem a turingi építészet tervezésében. Én voltam a felelős a változó sebességű színezésért. Izgatottan látom a kiadást. ”

Az Nvidia a Turing Architecture White Paper-ben azt is megállapítja, hogy az RT magok fejlett denoising szűréssel, az NVIDIA Research által kifejlesztett rendkívül hatékony BVH gyorsító struktúrával és RTX kompatibilis API-kkal működnek együtt, hogy valós idejű sugárkövetést érjenek el egyetlen Turing GPU-n. Az RT magok a BVH-t autonóm módon haladják át, és a bejárási és sugár / háromszög kereszteződési tesztek felgyorsításával kirakják az SM-t, lehetővé téve számára egy másik csúcs, képpont és az árnyékolás kiszámítását. Az olyan funkciókat, mint a BVH építése és újrarendezése, a vezető kezeli, a sugárképzést és az árnyékolást az alkalmazás új típusú árnyékolókon keresztül kezeli. Ez felszabadítja az SM egységeket más grafikus és számítási munkák elvégzésére.

Az AMD sugárgyorsítói

Az AMD RX 6000 sorozatukkal belépett a Ray Tracing versenybe, és ezzel pár kulcseleme is bemutatkozott az RDNA 2 építészeti tervezésében, amelyek segítenek ebben a szolgáltatásban. Az AMD RDNA 2 GPU-jainak sugárkövetési teljesítményének javítása érdekében az AMD beépített egy Ray Accelerator komponenst az alap Compute Unit Design-ba. Állítólag ezek a sugárgyorsítók növelik a szabványos számítási egységek hatékonyságát a sugárkövetéssel kapcsolatos számítási munkaterhelésekben.

A sugárgyorsítók működésének mechanizmusa még mindig viszonylag homályos, azonban az AMD némi betekintést nyújtott abba, hogy miként működnek ezek az elemek. Az AMD szerint ezeknek a sugárgyorsítóknak kifejezett célja, hogy bejárják a Bounded Volume Hierarchy (BVH) struktúráját, és hatékonyan meghatározzák a sugarak és dobozok (és végül háromszögek) metszéspontjait. A kialakítás teljes mértékben támogatja a DirectX sugárkövetést (a Microsoft DXR), amely a PC Gaming ipari szabványa. Ezen túlmenően az AMD Compute-alapú denoiser-t használ a sugár által nyomon követett jelenetek speculus hatásainak megtisztítására, ahelyett, hogy erre a célra épített hardverekre támaszkodna. Ez valószínűleg extra nyomást fog gyakorolni az új Compute Units vegyes pontosságú képességeire.

A sugárgyorsítók magyarázata - Kép: AMD

A sugárgyorsítók képesek négy korlátozott kötetdoboz-metszet vagy egy háromszög kereszteződés feldolgozására másodpercenként, ami sokkal gyorsabb, mint egy Ray Traced-jelenet renderelése külön dedikált hardver nélkül. Az AMD megközelítésének nagy előnye, hogy az RDNA 2 RT Acceleratorjai kölcsönhatásba léphetnek a kártya Infinity Cache-jével. Lehetőség van nagy számú kötött kötetszerkezet egyidejű tárolására a gyorsítótárban, így bizonyos terhelés levonható az adatkezelésről és a memóriaolvasó cellákról.

Kulcskülönbség

A legnagyobb különbség, amely az RT magok és a sugárgyorsítók összehasonlításakor azonnal nyilvánvaló, az, hogy míg mindkettő meglehetősen hasonlóan látja el funkcióit, addig az RT magok különálló hardvermagok, amelyeknek egyedi funkciójuk van, míg a sugárgyorsítók része a standard Compute Unit struktúra az RDNA 2 architektúrában. Nem csak az, hogy az Nvidia RT magjai második generációjukat mutatják be az Amperével, rengeteg technikai és építészeti fejlesztéssel a motorháztető alatt. Ez az Nvidia RT Core implementációját sokkal hatékonyabb és erőteljesebb Ray Tracing módszerré teszi, mint az AMD által a Ray Acceleratorokkal megvalósított megvalósítás.

Mivel minden számítási egységbe egyetlen sugárgyorsító van beépítve, az AMD RX 6900 XT 80, a 6800 XT 72, az RX 6800 pedig 60 sugárgyorsítót kap. Ezek a számok nem hasonlíthatók közvetlenül az Nvidia RT Core számaival, mivel ezek dedikált magok, egyetlen funkció szem előtt tartásával. Az RTX 3090 82 2-t kapndGen RT magok, az RTX 3080 60 2-t kapndA Gen RT magok és az RTX 3070 46 2-t kapndGen RT magok. Az Nvidia különálló Tensor magokkal is rendelkezik ezekben a kártyákban, amelyek segítenek a gépi tanulásban és az AI alkalmazásokban, például a DLSS-ben, amelyekről többet megtudhat ebben a cikkben .

Az RDNA 2 minden számítási egységébe egy sugárgyorsító van beépítve - Kép: AMD

Jövőbeli optimalizálás

Ebben a szakaszban nehéz megmondani, hogy mi lesz a jövőben az Nvidia és az AMD Ray Tracing-jével, de a jelenlegi helyzet elemzésével néhány művelt találgatás tehető. A cikk írásakor az Nvidia meglehetősen jelentős előnnyel rendelkezik a Ray Tracing teljesítményében, összehasonlítva közvetlenül az AMD kínálatával. Bár az AMD lenyűgözően elindította az RT-t, a kutatás, fejlesztés, támogatás és optimalizálás terén még mindig 2 évvel vannak lemaradva az Nvidia mögött. Az Nvidia most, 2020-ban bezárta a legtöbb Ray Tracing címet, hogy jobban használhassa az Nvidia dedikált hardverét, mint amit az AMD összeállított. Ez, valamint az a tény, hogy az Nvidia RT magjai érettebbek és erősebbek, mint az AMD Ray Accelerators, hátrányos helyzetbe hozzák az AMD-t, ha a jelenlegi Ray Tracing helyzetről van szó.

Az AMD azonban itt biztosan nem áll meg. Az AMD már bejelentette, hogy a DLSS helyett egy AMD alternatíván dolgoznak, amely hatalmas segítség a sugárkövetés teljesítményének javításában. Az AMD a játékstúdiókkal is együttműködve optimalizálja a következő játékokat a hardverükhöz. Ez olyan címekben jelenik meg, mint a GodFall és a Dirt 5, ahol az AMD RX 6000 sorozatú kártyái meglepően jól teljesítenek. Ezért számíthatunk arra, hogy az AMD Ray Tracing támogatása egyre jobb lesz a következő címek és a következő technológiák, például a DLSS Alternative fejlesztésével.

Ennek ellenére az Nvidia RTX Suite-jének írása idején túl erős ahhoz, hogy figyelmen kívül hagyja azokat, akik komoly Ray Tracing teljesítményt keresnek. Alapvető ajánlásunk az Nvidia új RTX 3000 sorozatú grafikus kártyája lesz az AMD RX 6000 sorozatán keresztül, bárki számára, aki a Ray Tracing-et fontos tényezőnek tartja a vásárlási döntés során. Ez változhat és kell is az AMD jövőbeli kínálatával, valamint az illesztőprogramok és a játékok optimalizálásának fejlesztésével az idő múlásával.

Az RTX-t és a DLSS-t egyaránt támogató közelgő játékok - Kép: Nvidia

Végső szavak

Az AMD végül a Ray Tracing színtérre ugrott az RDNA 2 architektúrán alapuló RX 6000 sorozatú grafikus kártyáik bemutatásával. Noha nem verik az Nvidia RTX 3000 sorozatú kártyáit a közvetlen Ray Tracing referenciaértékek alapján, az AMD kínálata rendkívül versenyképes raszterezési teljesítményt és lenyűgöző értéket kínál, ami vonzó lehet azoknak a játékosoknak, akik nem törődnek annyira a Ray Tracing-lel. Az AMD azonban jó úton halad a Ray Tracing teljesítményének javítása érdekében, számos gyors lépéssel a gyors egymásutánban.

Az Nvidia és az AMD által alkalmazott Ray Tracing megközelítés meglehetősen hasonló, de mindkét vállalat különböző hardveres technikákat alkalmaz erre. Az első tesztek azt mutatták, hogy az Nvidia dedikált RT magjai felülmúlják az AMD Ray Accelerátorait, amelyek magukba a Compute Units-be vannak beépítve. Ez nem okozhat különösebb aggodalmat a végfelhasználó számára, de fontos szempont a jövő szempontjából, mivel a játékfejlesztők most szembesülnek azzal a döntéssel, hogy optimalizálják RT funkcióikat az egyik megközelítés egyikéhez.