Video: 🏆 ЛУЧШИЕ ПРОЦЕССОРЫ для игр на конец 2020 года (December 2024)
In een reeks recente aankondigingen hebben Intel en AMD verschillende belangrijke wijzigingen onthuld in de architecturen van hun x86-processors, die beloven de manier te veranderen waarop x86-processors de komende jaren zullen worden gebruikt.
Vorige week kondigde AMD een nieuwe geheugenarchitectuur aan die CPU en GPU-computing dichter bij elkaar brengt. Intel onthulde een nieuwe nadruk op het verbeteren van zijn positie in meer traditionele pc-graphics. Gisteren heeft Intel een volledig nieuwe versie van de microarchitectuur aangekondigd voor zijn Atom-serie processors, een die die chips veel krachtiger zou moeten maken en mogelijk de kloof tussen Atom en de meer gangbare Core-processorfamilie van het bedrijf zou dichten.
AMD's nieuwe geheugenarchitectuur
AMD's aankondiging van wat het heterogene Uniform Memory Access (hUMA) noemt, was geen grote verrassing, aangezien het bedrijf al lang over Heterogeneous Architecture (HSA) praat.
Het concept is vrij eenvoudig. Zelfs in een chip die zowel de CPU als de grafische verwerking (GPU) op dezelfde chip heeft, zoals in AMD's versnelde verwerkingseenheden (APU's), is het geheugen dat door de CPU en de grafische kaart wordt gebruikt in afzonderlijke pools gebleven. Hoewel er fysiek hetzelfde geheugen is, gebruiken de CPU en de GPU verschillende aanwijzingen voor het geheugen. Om de GPU voor computergebruik te gebruiken, moet een programma de gegevens kopiëren van het gedeelte van het geheugen dat door de CPU wordt gebruikt naar het gedeelte dat door de grafische afbeeldingen wordt gebruikt, de berekening uitvoeren en opnieuw kopiëren. Dit kost allemaal tijd. Met een echt verenigd geheugensysteem dat afbeeldingen bevat, is dit niet nodig.
AMD pusht dit als onderdeel van de HSA Foundation, waaronder ARM, Qualcomm, Samsung, Texas Instruments, MediaTek en Imagination. In het bijzonder maakt deze benadering gebruik van een softwarelooptijd bekend als HSAIL en een set interfaces voor HSA-versnelde toepassingen.
Deze week heeft AMD gedetailleerd beschreven hoe in zijn hUMA-architectuur de CPU en GPU dynamisch geheugen kunnen toewijzen uit de gehele geheugenruimte en dit samen met hetzelfde virtuele adresschema kunnen gebruiken. Het geheugen is bidirectioneel coherent, dus elke update van het geheugen door de CPU of GPU wordt door de andere verwerkingselementen gezien. De GPU ondersteunt nu pageable-geheugen, met virtuele pagina's, zodat het kan werken met grotere datasets (de manier waarop CPU's momenteel werken). Het idee is dat de CPU en GPU efficiënter kunnen samenwerken. AMD zei dat ontwikkelaars HSA-versnelde applicaties kunnen schrijven met standaard programmeertalen zoals Python, C ++ en Java.
AMD is niet het enige bedrijf dat heterogene informatica belangrijk vindt en de HSA Foundation heeft ook zijn concurrenten. Nvidia is een groot voorstander geweest van wat het vroeger GP-GPU noemde, zijn CUDA-API's pushend en beloofde dat een toekomstige versie van zijn grafische processors uniform geheugen zal ondersteunen. Verschillende grote softwareplatforms hebben hun eigen alternatieven: Microsoft's DirectCompute-uitbreidingen op DirectX voor GP-GPU-computing en Google's Renderscript API voor heterogene computing. Misschien nog het belangrijkste is dat de Khronos Group, een industrieconsortium, de OpenCL-standaard promoot.
De grote vraag zal zijn welke van deze standaarden ontwikkelaars zullen aantrekken. AMD's eerste processor die hUMA ondersteunt, is de Kaveri-processor, die eind 2013 zal worden verzonden (hoewel waarschijnlijk niet in systemen tot begin volgend jaar). AMD levert ook de APU voor de PlayStation 4 en het gerucht gaat dat de APU ook wordt geleverd voor de volgende generatie Xbox. Het lijkt waarschijnlijk dat andere leden van de HSA Foundation ook de HUMA-architectuur zouden kunnen gebruiken, hoewel niemand dergelijke ontwerpen nog moet aankondigen. Samen kan dit voldoende zijn om kritische massa te creëren voor ontwikkelaars en voor tools en als dat zo is, kan dit erg belangrijk blijken te zijn.
Intel werkt dubbel op graphics voor Haswell
Eind vorige week heeft Intel meer informatie onthuld over zijn komende 4e generatie Core-processor, een product van 22 nm dat bekend staat als Haswell. Intel had eerder een aantal nieuwe functies voor Haswell bekendgemaakt, waaronder nieuwe AVX2-instructies voor het werken met grotere gehele vectoren en gefuseerde multiply-add (FMA) -instructies voor drijvende komma. Dit zijn dingen die eindgebruikers waarschijnlijk niet zullen zien, behalve in termen van verbeterde prestaties in vrij gespecialiseerde workloads.
Het meest interessante aan de nieuwe aankondiging is de focus op graphics, een gebied waar concurrenten AMD en Nvidia zeker een voorsprong hebben gehad.
Maar Intel zet grote stappen met de Haswell-processors. Intel heeft al lang gezegd dat het meer graphics aan de dobbelsteen zal toevoegen voor sommige modellen van Haswell, waaronder een high-end versie die bekend staat als GT3. In feite zijn dit slechts extra grafische instructie-eenheden, boven de bedragen in de huidige Ivy Bridge-processors. Op zichzelf is dit een grote verandering, gezien het feit dat Intel in zijn producten doorgaans meer ruimte aan CPU-ruimte heeft besteed, terwijl AMD's concurrerende APU's meer ruimte aan grafische ruimte hebben besteed.
Maar Intel liet onlangs een andere variant zien, wat het GT3e-graphics noemt, die een tweede dobbelsteen met 128 MB ingebed DRAM toevoegt aan het pakket dat de Haswell-dobbelsteen bevat, en is ontworpen om de grafische prestaties te versnellen. Vorige week kondigde Intel aan dat versies met hogere snelheid van de GT3-graphics nu Iris zullen heten, en die met de ingebouwde DRAM Iris Pro zullen heten, omdat Intel hoopt op wat merkvoordeel van de nieuwe grafische niveaus.
In het bijzonder zal de Haswell-lijn worden gesegmenteerd met versies met een kleine hoeveelheid grafische afbeeldingen (GT1) genaamd HD Graphics; met de GT2-grafische kaart (equivalent aan de high-end van de Ivy Bridge-lijn) genaamd HD Graphics 4200 tot 4600, afhankelijk van de snelheid; met GT3-graphics maar met een vermogen van 15 watt genaamd HD Graphics 5000; die delen met GT3 grafische voorstellingen van 28 watt en hoger worden nu Intel Iris Graphics 5100 genoemd; en die met de GT3e-graphics en embedded graphics genaamd Iris Pro 5200. (Intel is er nooit een geweest voor het benoemen van eenvoud.)
De onderdeelnummers van Intel blijven ingewikkeld, maar merk op dat een onderdeelnummer dat begint met 4 Haswell aangeeft, terwijl een onderdeel dat begint met een 3 Ivy Bridge aangeeft. Het bedrijf gebruikt MQ om standaard GT3-notebookonderdelen aan te duiden en HQ om onderdelen aan te geven die het ingesloten DRAM hebben.
Als onderdeel van de aankondiging deelde Intel de prestaties van de nieuwe onderdelen en vertoonde deze aanzienlijke prestatieverbeteringen in vergelijking met de bestaande processors van het bedrijf. Intel toonde cijfers die wijzen op Ultrabook-prestaties van maximaal 1, 5 keer de vorige generatie bij ongeveer hetzelfde stroomverbruik (en twee keer de prestaties met een hogere wattage chip gericht op iets grotere notebooks, die met 14-inch en grotere schermen), tweemaal de grafische kaart prestaties op traditionele notebooks, en bijna drie keer de prestaties op desktopsystemen.
Intel zegt dat de nieuwe grafische afbeeldingen van Iris en Iris Pro vergelijkbaar zijn met discrete GPU's, en dat is een groot probleem. (Zoals altijd neem ik alle prestatienummers met een korreltje zout totdat ik de producten daadwerkelijk kan testen.) Ik weet zeker dat er nog steeds veel beter presterende afzonderlijke grafische bureaubladonderdelen van AMD en Nvidia zijn voor gaming en werkstationtoepassingen, maar meestal gebruiken die onderdelen veel stroom. In full-size laptops waar de krachtenvelop veel kleiner is, zijn on-die graphics belangrijker, maar er is nog steeds een grote markt voor discrete graphics. Intel lijkt zich op die markt te richten. Ultrabooks en andere dunne notebooks hadden meestal niet de vereiste stroom om discrete grafische afbeeldingen uit te voeren, dus verbeterde on-die graphics zijn zeker welkom.
Intel's nieuwe atomaire microarchitectuur
In veel opzichten was de grootste aankondiging van Intel echter de low-power-architectuur, die bedoeld is om de architectuur te vervangen die wordt gebruikt in de huidige Atom-architectuur van het bedrijf. De Atom-familie staat vooral bekend om zijn gebruik in mobiele apparaten, zoals tablets en in mindere mate een paar smartphones. De nieuwe architectuur, die bekend staat als Silvermont, is ook gericht op een verscheidenheid aan datacenters en embedded markten.
De architectuur betekent een grote verandering. In plaats van de in-order uitvoering-engine die werd gebruikt in eerdere versies van de Atom-architectuur, inclusief de Saltwell-architectuur die wordt gebruikt op de huidige 32 nm Atom-versies van het bedrijf, voegt Silvermont een out-of-order uitvoering-engine toe, zoals wordt gebruikt in Intel's Core- en Xeon-processors. Dit zou de verwerking van applicaties met één thread aanzienlijk moeten verbeteren. Het biedt een nieuwe systeemstructuur, ontworpen voor het schalen van maximaal acht cores (waarschijnlijk voor toepassingen zoals microservers). Ten slotte voegt het nieuwe instructies toe (om het te vergelijken met die gebruikt in de Westmere-versie van de Core-processors), en nieuwe beveiligings- en virtualisatietechnologieën.
De nieuwe architectuur heeft een modulair ontwerp gebaseerd op modules die twee kernen bevatten, 1 MB gedeelde L2-cache (zeer lage latentie, hoge bandbreedte), en een speciale point-to-point-interface naar de SoC-fabric. Merk op dat dit het concept van multi-threading vervangt, dat Intel sterk heeft gepromoot, en in feite een beetje lijkt op de modulaire aanpak van AMD die wordt gebruikt in de huidige desktop- en serverchips. (Intel deed echter zijn uiterste best om uit te leggen dat het niet hetzelfde was; de modules van AMD delen meer dingen, inclusief drijvende komma.) De modules kunnen worden gecombineerd tot maximaal acht cores.
Wat het stroomverbruik betreft, zegt Intel dat de nieuwe architectuur een breder dynamisch vermogensbereik mogelijk maakt en elke kern zijn eigen onafhankelijke frequentie- en energiebeheer mogelijk maakt, waardoor elke prestatie omhoog en omlaag kan gaan wat betreft prestaties en stroomverbruik. (In tegenstelling tot mobiele processors lijkt dit meer op wat Qualcomm gebruikt met zijn Krait-cores dan op de meer standaard ARM big.LITTLE-combinatie.) Het is ook ontworpen met verbeterd energiebeheer en snellere in- en uitgang vanuit stand-bymodi, functies die bijzonder belangrijk zijn in de mobiele markt.
Het bedrijf zegt dat het het vermogen tussen de CPU-kern en andere elementen, zoals afbeeldingen, beter kan aanpassen, wat een meer geavanceerde implementatie van de burst-modus mogelijk maakt.
Over het algemeen zegt Intel dat de nieuwe architectuur en de overstap naar het 22nm FinFet SoC-proces van het bedrijf chips moeten toestaan die tot drie keer hogere prestaties of vijf keer minder vermogen bieden dan de huidige Atom-chips. Over het algemeen zei Intel dat zijn "efficiënte" dual-core beter kan presteren dan een inefficiënte huidige quad-core processor onder stroombeperkingen. (Nogmaals, zoals altijd, wacht ik tot de producten dit beoordelen.)
Net als de huidige Atom-lijn, zal de Silvermont-architectuur waarschijnlijk worden gebruikt in verschillende processors, variërend van die gericht op mobiele apparaten tot grotere systemen. Hiertoe behoren Avoton, gericht op micro-servers, Rangely gericht op netwerkapparaten, Merrifield gericht op smartphones en Bay Trail gericht op tablets en convertibles. Hiervan is het meest langverwachte het 22nm Bay Trail-platform, dat Intel verwacht op tijd op de markt te hebben voor tablets die tegen de feestdagen beschikbaar zullen zijn, met meer details binnenkort.
Over het algemeen klinkt de Silvermont-architectuur als een grote stap voorwaarts ten opzichte van de bestaande Atom-architectuur, en ik ben vooral geïntrigeerd om te zien hoe Bay Trail, gebaseerd op deze architectuur, daadwerkelijk presteert. Tot op heden was er een opmerkelijke prestatiekloof tussen de low-end van de Core-familie en de high-end Atoms, maar deze architectuur lijkt de kloof echt te dichten.
Conclusie: Graphics en Power definiëren concurrentie
Elke belangrijke processor die u tegenwoordig ziet - of het nu een Intel- of AMD-chip is die is gericht op desktops of laptops of een ARM-gebaseerde chip die is gericht op smartphones en tablets - heeft meerdere CPU-cores, meestal meerdere GPU-cores (behalve serverchips), en allerlei andere gespecialiseerde logica, bijvoorbeeld voor beeldverwerking, videocodering en -decodering en codering.
Naarmate het chipproces kleiner wordt, kunnen meer transistors op een enkele chip worden opgenomen. Maar welke functies te integreren (en hoe ze te integreren) blijft een belangrijk onderscheidend vermogen onder de chipleveranciers, evenals het specifieke ontwerp en de microarchitectuur van de chips zelf.
Deze aankondigingen laten de afwegingen zien die Intel en AMD maken, en deze zouden de komende jaren enorme gevolgen voor de computer moeten hebben.
Voor desktops en laptops ziet Intel eruit alsof het niet alleen AMD probeert in te halen met ingebouwde grafische prestaties door meer uitvoeringseenheden toe te voegen, maar ook probeert door te gaan met functies zoals ingebed DRAM, gebruikmakend van de procestechnologie lood. AMD zal ook niet stil blijven zitten met zijn graphics, dus het zou voor een interessante matchup moeten zorgen. Ondertussen duwt AMD hard om de grafische en CPU-functies beter te integreren, wat kan leiden tot een nieuwe manier van programmeren; dat duurt langer, maar kan ongelooflijk belangrijk blijken te zijn.
De strijd tussen Kaveri van AMD en Haswell van Intel zou daarom interessanter kunnen zijn dan de Intel-AMD-concurrentie van de afgelopen jaren. Haswell wordt zeker als eerste verzonden. (Ik verwacht deze zomer systemen te zien, versus begin volgend jaar voor Kaveri.) Nogmaals, dit is voornamelijk voor reguliere desktops en notebooks. Gamers en werkstationgebruikers zullen ongetwijfeld beide chips willen koppelen aan discrete grafische oplossingen van AMD of Nvidia.
Voor tablets en mogelijk uiteindelijk telefoons kan de heterogene systeemarchitectuurbenadering die AMD en anderen pushen, nog belangrijker blijken te zijn, hoewel het opnieuw een tijdje zal duren om te zien of applicaties daar echt voordeel uit halen. De nieuwe architectuur van Intel zou het in deze ruimte concurrerender moeten maken. Het ziet er echt uit als een grote stap vooruit, maar de concurrenten blijven ook in beweging.
Ik ben een beetje nieuwsgierig of dingen zoals het op Silvermont gebaseerde Bay Trail-platform voor Atom daadwerkelijk snel genoeg lopen, zodat het in meer gangbare low-end notebooks of zelfs desktops begint te verschijnen. Al op Atom-gebaseerde tablets van vandaag draait Windows redelijk goed, en met de verbeteringen kan het genoeg zijn voor veel mainstreamgebruikers, zelfs als het achterblijft bij de prestaties van Haswell of Kaveri (of Intel's huidige Sandy Bridge en AMD's huidige Richmond daarvoor) er toe doen).
Het moet het komende jaar een spannende wedstrijd worden.