Video: NVIDIA GTC May 2020 Keynote Pt6: NVIDIA A100 Data Center GPU Based on NVIDIA Ampere Architecture (November 2024)
Op de GPU Technology Conference van Nvidia vorige week was ik verrast om te zien hoe ver grafische en GPU-technologie zich beweegt - op de desktop en op mobiele apparaten - en hoe de manier waarop mensen software moeten veranderen om er voordeel uit te halen.
De grote beweging is in de richting van heterogene software, programma's die zowel de traditionele microprocessor CPU als de GPU tegelijkertijd kunnen gebruiken. Dit is geen nieuw concept - zowel Nvidia als AMD praten hier al een tijdje over - maar de twee partijen komen dichter bij elkaar.
AMD's benadering is geweest om wat het "versnelde verwerkingseenheden" noemt, die GPU's en CPU's op één enkele matrijs combineren, en wat het "heterogene systeemarchitectuur" noemt te promoten. De afgelopen jaren promootte het HSA en vorig jaar richtte het samen met 21 andere bedrijven de HSA Foundation op om open standaarden te ontwikkelen voor heterogeen computergebruik.
Nvidia's aanpak is heel anders geweest, gericht op haar CUDA-platforms voor het schrijven van software op haar GPU's en de Tesla-versie van GPU's, die nu worden gebruikt in supercomputers zoals de Titan supercomputer van Oak Ridge National Laboratory. In dergelijke systemen beheert tamelijk complexe software wat computing werkt op de CPU en wat werkt op de GPU.
Nvidia CEO Jen-Hsun Huang opende zijn keynote en zei: "Visual computing is een krachtig en uniek medium. In de afgelopen 20 jaar heeft dit medium de pc getransformeerd van een computer voor informatie en productiviteit naar een van creativiteit, expressie en ontdekking.." De komende jaren moeten uitwijzen of die overgang een plateau bereikt of, inderdaad, het is net begonnen."
Zoals verwacht heeft Huang in zijn keynote veel gesproken over hoe GPU computing op basis van CUDA groeit. Het bedrijf heeft 430 miljoen CUDA-compatibele GPU's en 1, 6 miljoen CUDA-programmeerkitdownloads verzonden; Nvidia GPU's worden nu gebruikt in 50 supercomputers over de hele wereld. Hij zei bijvoorbeeld dat Titan onlangs 's werelds grootste mechanische simulatie van vaste stoffen heeft uitgevoerd, met behulp van 40 miljoen CUDA-processors om 10 petaflops met duurzame prestaties te leveren. Hij zei ook dat GPU computing veel potentieel had in "big data" -toepassingen.
Huang heeft een vertegenwoordiger van Shazam opgevoed om te vertellen hoe het bedrijf GPU's gebruikt om muziek en audio van een groot aantal gebruikers te matchen. Huang zei vervolgens dat een bedrijf genaamd Cortexica vergelijkbare technologie gebruikt voor visueel zoeken.
Het belangrijkste is dat het bedrijf een nieuwe routekaart heeft gepresenteerd voor zijn GPU-motor die wordt gebruikt in zowel zijn GeForce-gamingproducten als de Tesla-lijn. De huidige GPU-architectuur heet "Kepler", die vorig jaar werd verzonden. De volgende versie, bekend als "Maxwell, " komt volgend jaar uit. Het neemt een grote stap in de richting van heterogeen computergebruik door een "unified virtual memory" -architectuur toe te voegen, wat betekent dat de CPU en GPU al het geheugen van het systeem kunnen zien.
Dit is belangrijk omdat een van de grote knelpunten in GPU-computing het verplaatsen van gegevens tussen hoofdgeheugensystemen en grafisch geheugen is en omdat het schrijven van software die beide typen processors gebruikt moeilijk is geweest. (AMD heeft een soortgelijke functie aangekondigd voor zijn Kaveri-processor, die eind dit jaar zal verschijnen. Ik ben een beetje onduidelijk hoe dit werkt zonder directe ondersteuning van de CPU-makers, maar het is zeker een benadering waar we meer van zullen zien vooruit gaan.)
Voor 2015 beloofde Huang een andere versie, "Volta" genaamd, die het grafische geheugen neemt en het direct bovenop de GPU stapelt, waardoor de geheugenbandbreedte dramatisch wordt vergroot tot ongeveer één terabyte per seconde. Ter vergelijking: de totale maximale bandbreedte van Kepler is ongeveer 192 gigabytes per seconde.
Een aantal bedrijven, waaronder Intel, hebben gesproken over het stapelen van geheugen bovenop een processor, maar de bedrading om het geheugen te verbinden met de processor, die een techniek gebruikt die bekend staat als via-silicium via's, is complex. Voor zover ik weet, is Volta de eerste relatief mainstream-processor die is aangekondigd met deze functie.
De mobiele routekaart heeft enkele van dezelfde functies. Het bedrijf heeft onlangs zijn Tegra 4 (codenaam "Wayne") en Tegra 4i (codenaam "Gray") -processors aangekondigd. "Logan", die in 2014 in productie zal zijn, voegt de eerste CUDA-compatibele grafische kaart toe aan de Tegra-lijn. Dit wordt in 2015 gevolgd door "Parker", die de Maxwell GPU-technologie combineert met het eerste unieke CPU-kernontwerp van het bedrijf, een 64-bits ARM-processor bekend als Project Denver. (Merk op dat, hoewel de twee processors het GPU-ontwerp delen, het aantal werkelijke grafische cores waarschijnlijk veel kleiner zal zijn in een mobiele processor dan in een desktopversie.)
Dit zou interessant moeten zijn, zowel vanwege de uniforme geheugenarchitectuur als omdat het gepland is om te worden vervaardigd met behulp van 3D FinFET-transistors. Intel gebruikt deze techniek in zijn 22nm-processors en beide oude Nvidia-productiepartner Taiwan Semiconductor Manufacturing Corp. en rivaal Globalfoundries hebben gezegd dat ze ergens volgend jaar FinFETS zullen hebben. De massaproductie start waarschijnlijk in 2015.
"Over vijf jaar zullen we de prestaties van Tegra met 100 keer verhogen", beloofde Huang.
De grote vraag is natuurlijk waar we de computerpaarden voor zullen gebruiken. Het is vrij gemakkelijk voor mij om de high-performance computing- en "big data" -applicaties te zien - die blijven groeien en kunnen gemakkelijk de parallelle computerfuncties van GPU's gebruiken. Nvidia zal deze functies op verschillende manieren aanbieden, waaronder via Tesla-boards voor werkstations en supercomputers; de GRID CPU-servervirtualisatietechnologie voor bedrijfsservers; en een nieuwe GRID Virtual Computing Appliance (VCA), een 4U-chassis met Xeon-processors, op Kepler gebaseerde GPU's en geheugen, gericht op afdelingen.
En natuurlijk zullen games meer grafische afbeeldingen gebruiken en realistischer worden in elke generatie. De grootte en resolutie van beeldschermen neemt toe en mensen willen meer afbeeldingen. Huang liet de nieuwe high-end desktop grafische kaart van het bedrijf zien, genaamd Titan, die een realtime oceaansimulatie van Waveworks uitvoert. Het demo ook Faceworks, een 3D-sprekende kop genaamd Ira (hierboven), gemaakt met het Institute for Creative Technology bij USC.
Het is bijzonder interessant om al deze functies mobiel te maken. Ik ben niet helemaal zeker dat ik echt alle kracht van een high-end desktop GPU in een mobiel apparaat nodig heb - op een vijf-inch scherm lijkt 1.980 x 1.080 tenslotte genoeg - maar ik twijfel er niet aan dat mensen zullen er gebruik van maken. Een zorg is dat het teveel stroom zou gebruiken, maar Huang zei dat Logan "niet groter dan een dubbeltje" zou zijn. Ik ben in elk geval geïnteresseerd om te zien wat mensen met zoveel prestaties zullen doen.
Over het algemeen wedt Nvidia, zoals AMD, op voortdurende grafische verbeteringen, uniform geheugen en een heterogene benadering voor het programmeren van de CPU en GPU. AMD zou zeggen dat het met open standaarden werkt, terwijl Nvidia zou wijzen op de successen die CUDA heeft, met name in de high-performance arena. En natuurlijk is er Intel, waarvan de grafische weergave vandaag zowel AMD als Nvidia achterlaat, maar nog steeds het CPU-gebied van de pc domineert. Het heeft ook een eigen set softwaretools. De verschillende benaderingen moeten dit een fascinerend gebied maken om naar te kijken.