Huis Vooruit denken Supercomputer scoort grotendeels ongewijzigd, maar zit vast

Supercomputer scoort grotendeels ongewijzigd, maar zit vast

Video: Fugaku: the supercomputer helping us understand how coronavirus spreads | ABC News (November 2024)

Video: Fugaku: the supercomputer helping us understand how coronavirus spreads | ABC News (November 2024)
Anonim

De meest recente lijst van 's werelds snelste supercomputers veranderde niet veel, maar de jaarlijkse Supercomputing-show (SC14) bevatte veel discussie over nieuwe systemen op de lijst, evenals verschillende krachtige computeraankondigingen, zoals nieuwe versnellers van Intel en Nvidia.

De Chinese Tianhe-2-supercomputer, die Intel Xeon CPU's en Xeon Phi-versnellers gebruikt, bleef op de eerste plaats op de Top500-lijst met topprestaties van 54, 9 petaflops (quadriljoenen drijvende-kommabewerkingen per seconde). Dit jaar waren de top negen systemen zelfs identiek aan de top nieuwe toevoeging op de 10e plaats - een niet-gespecificeerde Amerikaanse systeemmachine die een Cray CS-Storm is, aangedreven door Intel Xeon E5-2660 v2 CPU's en Nvidia K40 GPU's, verbonden via Infiniband.

Verderop in de lijst waren er 78 nieuwe systemen, hoewel zelfs dit een nieuw recordpunt is. En over het algemeen lijkt het erop dat we de groeisnelheid van het totale vermogen van de 500-systemen zien vertragen.

De ranglijsten van deze systemen zijn gebaseerd op de LINPACK-benchmark, hoewel er nu een aantal inspanningen worden geleverd om nieuwe benchmarks te maken die zijn gericht op verschillende soorten computers. Ik vond het interessant dat Horst Simon, redacteur van de Top500-lijst, in een toespraak op de show zei dat hij, ondanks het doel om een ​​exascale computer te bereiken - 1 exaflops per seconde (ongeveer 1.000 petaflops) - tegen 2020, duurt tot eind 2024. Voor een deel komt dit omdat we meer energiebesparende technieken nodig hebben - zoals siliciumfotonica en 3D-integratie en verpakking - om het benodigde vermogen voor een exascale-systeem op 20 megawatt te houden. Dit zijn grote systemen.

Ondanks het ontbreken van grote veranderingen aan de top, hoorden we een paar nieuwe aankondigingen - met name die van Intel en Nvidia, die de weg konden wijzen naar snellere machines.

Nvidia, wiens GPU's en CUDA-programmeertaal de beweging naar versnellers en coprocessors in high-performance computing echt op gang brachten, was overal met veel systemen. Het biedt momenteel de K40-versneller en op de show kondigde de volgende versie, de Tesla K80, die een dual-GPU-aanpak gebruikt om te bieden wat het bedrijf zegt bijna twee keer hogere prestaties en dubbele geheugenbandbreedte van zijn voorganger.

Nvidia zegt dat de K80 4.992 CUDA-kernen en 24 megabytes RAM biedt en een piekcapaciteit heeft van 2, 91 teraflops per bord. Het is interessant dat de K80 nu beschikbaar is en dat veel van de systeemmakers al systemen aanbieden met het bord. Dell liet bijvoorbeeld zijn nieuwe PowerEdge C4130-servers zien, waarmee u maximaal vier Nvidia-versnellingsborden (of Intel Xeon Phi-versnellers) in een 1U-server kunt plaatsen, waarbij de K80-versie tot 7, 2 teraflops in elke doos biedt. Dat is gewoon een waanzinnige hoeveelheid rekenkracht in een rack (hoewel een die veel energie zou gebruiken en veel koeling nodig zou hebben).

Ondertussen kondigde Intel aan dat de volgende versie van zijn Xeon Phi-chip - een versie die bekend staat als Knight's Landing waarvoor de eerste commerciële systemen volgend jaar zouden moeten worden verzonden - nu meer dan 50 klanten heeft die van plan zijn de nieuwe processorversie van het onderdeel te gebruiken (waar de Xeon Phi fungeert als de systeemprocessor) in nieuwe supercomputers. Veel meer systemen gebruiken de coprocessor PCIe-kaartversie van het product.

Onder de klanten van Knights Landing bevinden zich de Trinity-supercomputer, een samenwerking tussen Los Alamos en Sandia National Laboratories, en de Cori-supercomputer, aangekondigd door het National Department of Energy (DOE) National Energy Research Scientific Computing (NERSC) Center van het Amerikaanse ministerie van Energie. Knight's Landing zou ongeveer 3 teraflops aan prestaties moeten bieden en zal Intel's op silicium-fotonica gebaseerde Omni-Path Fabric-technologie integreren, waarvan het bedrijf zei dat het een 100 Gbps lijnsnelheid en tot 56 procent lagere switch fabric latentie zou bieden dan InfiniBand-alternatieven. (Merk op dat de InfiniBand-providers nu ook over nieuwe versies praten.)

Intel zei dat de follow-up, bekend als Knight's Hill, zal worden gebouwd met behulp van Intel's 10nm-procestechnologie en de volgende generatie van de Omni-Path-fabric zal gebruiken. Het volgt Knight's Landing, maar de exacte timing is niet bekendgemaakt.

AMD, dat zijn FirePro S9150 single-CPU-kaart aankondigde en liet zien, die volgens hem 2, 53 teraflops aan prestaties kan bieden, mag niet buiten beschouwing worden gelaten. Dit systeem, dat is geprogrammeerd met OpenCL, wordt al verzonden.

Een nieuwe supercomputer genaamd L-CSC van het GSI Helmholtz Center, gebaseerd op de S9150 GPU's en Intel Xeon 2690v2 10-core CPU's, stond zelfs bovenaan de nieuwe versie van de Green500-lijst, die supercomputers weergeeft in volgorde van verwerkingsvermogen per watt. Dit was de eerste keer dat een systeem 5 gigaflops / watt (miljarden bewerkingen per seconde per watt) kon overtreffen. Let op die lijst, het tweede plaats-systeem was de Suiren, aangedreven door PEZY-SC veel-kern versnellers en Xeon CPU's; terwijl de rest van de top 10 Nvidia Tesla GPU's gebruikt, waarmee het bereik van dergelijke systemen wordt weergegeven.

Er zijn ook andere, meer ongebruikelijke opties. Micron toont zijn Automata-chip, in wezen een speciale chip ontworpen voor het matchen van patronen, voor gebruik in zaken als netwerkbeveiliging en zoeken naar genomics. Dit wordt ontwikkeld tot een PCIe 3-bord met 32 ​​chips en zal in het eerste kwartaal van 2015 worden gelanceerd, aanvankelijk in lage volumes. (Het bedrijf zit ook achter zijn Hybrid Memory Cube voor geheugen van de volgende generatie voor dergelijke systemen.) IBM heeft zijn TrueNorth-processor, waarvan hij hoopt dat die de weg zal wijzen naar meer 'hersenkunnen'. NEC werkt aan de volgende generatie van zijn SX-ACE vectorprocessor, die volgens hem eenvoudiger te programmeren is dan GPU's. En natuurlijk probeert ARM ook de servermarkt te veroveren, waarbij X-Gene1 van Applied Micro wordt gebruikt als een processor die verbinding maakt met verschillende versnellerkaarten.

Een aantal leveranciers toonde nieuwe systemen. Naast het Dell-systeem dat ik eerder noemde, toonde Lenovo een watergekoeld systeem met dubbele processor op basis van een aangepaste Intel Xeon E5-2798A-processor (met 16 cores tot 3, 2 GHz), die volgens hem 1, 083 teraflops levert. En er stond dat de Knights Landing Xeon Phi-processor van volgend jaar een "peta-cube" -systeem mogelijk maakt dat meer dan één petaflop in slechts twee standaard 42U-racks levert.

One Stop Servers toonden een High Density Compute Accelerator, die PCIe Gen3 gebruikt om tot 16 high-end acceleratorboards van een enkele of meerdere servers te ondersteunen, en het bedrijf zegt dat het tot 89.6 teraflops levert met behulp van Tesla K80-boards. Dit kan werken met de Power8-processor van IBM. Huawei toonde de Amerikaanse beschikbaarheid van zijn X6800 Data Center Server en een vloeistofgekoelde versie van zijn FusionServer 9000-bladeserver.

Voor het koppelen van systemen lanceerde Obsidian Technologies zijn InfiniCortex-initiatief, ontworpen om een ​​100 Gigabit InfiniBand-verbinding over lange afstanden te maken. Het bedrijf kondigde steun aan van Singapore's Agency for Science, Technology and Research (A * STAR). En Mellanox toonde 100 Gigabit Infiniband werkend over 100 meter via glasvezel en 8 meter via koper.

Om de grootste supercomputers te maken, wenden organisaties zich meestal tot bedrijven zoals IBM en Cray om de systemen samen te stellen, hoewel deze vaak jaren duren om te bouwen. De grootste aankondiging van Cray op de show was een systeem van $ 80 miljoen, bekend als Shaheen II aan de King Abdullah University of Science and Technology in Saoedi-Arabië voor een Cray XC40, inclusief een Urika-GD grafische analyseapparaat.

En natuurlijk, vlak voor de show, heeft de DOE IBM (en componentleveranciers Nvidia en Mellanox) een enorm contract toegekend voor wat de twee grootste supercomputers in het land zouden zijn, elk met meer dan 100 petaflops.

Noot van de redactie: dit bericht is bijgewerkt op 26-11. De Tianhe-2 heeft een topprestatie van 54.9 petaflops, geen teraflops.

Supercomputer scoort grotendeels ongewijzigd, maar zit vast