Video: Building an Accelerator Functional Unit for the Intel® FPGA Programmable Acceleration Card N3000 (November 2024)
Veel van de interessante processorbesprekingen hebben de laatste tijd vooral te maken met het gebruik van verschillende soorten chips en kernen, in tegenstelling tot de algemene computerkernen die gangbaar zijn in conventionele CPU's. We hebben allerlei verschillende combinaties van chips gezien die worden gebruikt voor bepaalde computertaken, waaronder CPU's, GPU's, DSP's, aangepaste ASICS en veld-programmeerbare gate-arrays (FPG's), en we zien steeds vaker toepassingen die aspecten van alle deze, soms in een systeem en soms binnen een enkele chip.
Zelfs Intel - lang de voorstander van universele rekenkernen die om de paar jaar in snelheid verdubbelde - is begonnen met de aankoop van Altera, een van de toonaangevende FPGA-fabrikanten. Onlangs kreeg ik de gelegenheid om te praten met Dan McNamara, algemeen directeur van Intel's Programmable Solutions Group (PSG) - wat ooit bekend stond als Altera - die enig licht werpen op de plannen van Intel op dit gebied en meer details gaven over de plannen van het bedrijf om verbinding te maken verschillende soorten kernen en verschillende sterven samen in high-speed chippakketten.
"De wereld gaat heterogeen, " zei McNamara en merkte op dat er nu een algemeen besef is dat je niet alle problemen met kernen voor algemeen gebruik kunt oplossen. Aangepaste ASIC's, zoals Tensor Processing Units of TPU's van Google, kunnen bepaalde soorten functies veel sneller versnellen dan traditionele CPUS- of GPU's, maar het duurt lang om deze te maken. In tegenstelling, zei hij, FPGA's zorgen voor aanpasbare code die veel van de prestatievoordelen van ASIC's biedt zonder twee jaar te wachten op chipontwerp en productie. Een ontwikkelaar kan algoritmen binnen een FPGA onmiddellijk wijzigen, terwijl een CPU, GPU of aangepaste chip op een vaste manier werkt.
McNamara zei ook dat FPGA's een zeer lage latentie hebben en zeer parallel kunnen zijn, waarbij verschillende delen van een chip gelijktijdig werken aan toepassingen zoals beeldverwerking of communicatie.
Intel levert nu de Arria 10 FPGA, vervaardigd volgens het 20nm-proces van TSMC, en biedt een pakket dat een Xeon (Broadwell) -processor en de Arria 10 combineert. Dit wordt gebruikt in applicaties zoals zoeken op het web en analyses. McNamara zei dat FPGA's het zoeken tot 10 keer konden versnellen en merkte op dat Microsoft openbaar is geweest over het gebruik van dergelijke FPGA's om het zoeken te versnellen.
Een groot gebied van verbetering is de laatste tijd het maken van snellere multi-chip-pakketten die chip-matrijzen kunnen combineren die op verschillende processen en misschien van verschillende makers zijn gemaakt. Deze omvatten pakketten die een CPU en een FPGA bevatten, zoals de Xeon / Arria-combinatie; een FPGA met verschillende transceivers, zoals in Intel's Stratix 10 FPGA; of zelfs verschillende delen van een volledige CPU, zoals Intel beschreef in zijn recente technologie en productiedag.
Intel heeft hiervoor een nieuwe technologie ontwikkeld met de naam embedded multi-chip interconnect bridge (EMIB), die debuteerde in de Stratix 10. In EMIB wordt de kerndobbelsteen gemaakt op het 14nm-proces van Intel en de transceivers op het 16nm-proces van TSMC.
Over het algemeen zei McNamara dat verschillende gebieden meer FPGA's gaan gebruiken met dergelijke verpakkingen. Hij sprak over hyper-schaal websites, die de vraag snel zien veranderen en waar een FPGA / CPU-combinatie goed kan werken op gebieden zoals zoeken, analyse en videostreaming, evenals netwerktransformatie, waar trends zoals softwaregedefinieerde netwerken en virtualisatie van netwerkfuncties leidt tot een behoefte aan meer pakketverwerking. Andere aandachtsgebieden zijn 5G- en draadloze toepassingen, autonoom rijden en kunstmatige intelligentie (AI) -toepassingen. In AI zei McNamara dat geoptimaliseerde ASIC's en onbewerkte computerkracht wellicht het beste zijn voor training (Intel heeft Nervana gekocht), maar zei dat FPGA's vaak het beste zijn vanwege hun flexibiliteit en lage latentie, en merkte op dat ZTE Arria 10s gebruikte om toon zeer indrukwekkende scores voor beeldherkenning.
Persoonlijk ben ik nieuwsgierig om te zien of toekomstige CPU's echt verschillende componenten zullen nemen en deze combineren en combineren met behulp van EMIB of een vergelijkbare technologie om te veranderen wat we beschouwen als een processorchip. Ik ben geïntrigeerd door het idee dat systemen van de toekomst veel verschillende cores kunnen gebruiken - sommige programmeerbaar (FPGA) en sommige vast (een combinatie van zowel aangepaste ASIC's en traditionele CPU's en GPU's) om dingen samen te doen die verbeteren op wat een enkele technologie kan het alleen.