Huis Vooruit denken Supercomputing 17 biedt enkele verrassingen, tips voor de toekomst

Supercomputing 17 biedt enkele verrassingen, tips voor de toekomst

Video: DIY cadeaubox | origamidoosje vouwen | leuk cadeau-idee | zelf verrassing maken (November 2024)

Video: DIY cadeaubox | origamidoosje vouwen | leuk cadeau-idee | zelf verrassing maken (November 2024)
Anonim

Er waren een paar verrassingen op de Supercomputing 17-conferentie van deze maand, waaronder een zeer goede show voor de PEZY-SC2-versneller, evenals de koersverandering van Intel voor zijn Xeon Phi-lijn. Daarnaast zagen we ook de eerste systemen gebouwd op Intel's Xeon Scalable Processor (Skylake) en de eerste met Nvidia's Volta-versneller.

Maar misschien het meest opvallend is het nieuws dat Chinese systemen nu goed zijn voor 202 van de 500 supercomputers op de nieuwste Top 500-lijst vergeleken met slechts 143 uit de VS. Amerikaanse systemen hebben de lijst gedomineerd sinds de oprichting 25 jaar geleden, en slechts een paar maanden geleden, hadden de VS 169 systemen tegenover de 160 van China. Hetzelfde geldt als het gaat om geaggregeerde prestaties, waarbij de Chinese systemen goed waren voor 35, 4 procent van de totale prestaties van de Top 500-systemen.

De snelste computers ter wereld blijven de twee enorme Chinese machines die al enkele jaren bovenaan de lijst staan: Sunway TaihuLight, van het Chinese nationale supercomputingcentrum in Wuxi, met duurzame Linpack-prestaties van meer dan 93 petaflops (93.000 triljoen drijvende punt) operaties per seconde), en de Tianhe-2, van het Chinese nationale supercomputercentrum in Guangzhou, met aanhoudende prestaties van meer dan 33, 8 petaflops. Dit blijven de snelste machines, en met een enorme marge. Het Piz Daint-systeem van het Zwitserse Nationale Supercomputing Center, een Cray-systeem dat gebruik maakt van Intel Xeons en Nvidia Tesla P100s, behaalde de derde plaats met aanhoudende Linpack-prestaties van 19, 6 petaflops.

De grootste verandering aan de top is een nieuw systeem op de vierde plaats: een verbeterde versie van de Gyoukou-supercomputer, een ZettaScaler-2.2-systeem dat wordt ingezet bij het Japanse Agentschap voor Marine-Earth Science and Technology. Deze machine maakt gebruik van PEZY-SC2-versnellers, een 2048-core chip van de tweede generatie die een piekprestatie van 4.096 teraflops levert met dubbele precisie, evenals conventionele Intel Xeon-processors, voor een totaal van 19.860.000 cores. (Een eerdere ZettaScaler-machine met de PEZY-SC2 maakte de lijst op een lager niveau in de juni-versie). Dat geeft het het hoogste aantal cores dat samen wordt gebruikt - ook wel het hoogste niveau van concurrency genoemd - dat tot nu toe is gezien en overtreft de TaihuLight, die 10, 6 miljoen cores heeft. De Gyoukou-machine behaalde een duurzame Linpack-prestatie van 19.14 petaflops, maar wat interessant is, is dat deze 1, 35 megawatt vermogen gebruikt, vergeleken met 2, 27 megawatt voor PizDaint, 17, 8 megawatt voor Tinahe-2 en 15, 4 megawatt voor Taihulight. Dat is nog steeds veel vermogen, maar het is een grote vermindering in vergelijking met de andere systemen en een sterke indicatie dat problemen met het vermogen belangrijk zijn, zelfs voor de snelste machines ter wereld. Het is ook vermeldenswaard dat dit laat zien hoe nieuwe architecturen het stroomverbruik drastisch kunnen verminderen.

Het Amerikaanse topsysteem blijft de Titan-supercomputer in het Oak Ridge National Laboratory, een vijf jaar oud systeem dat Nvidia K20x GPU-versnellers gebruikt en 17.59 petaflops levert, die nu op de vijfde plaats staat op de lijst.

In de nieuwste Green 500-lijst van de meest energie-efficiënte supercomputers gingen vier van de top vijf slots - inclusief de top drie - naar nieuw geïnstalleerde Japanse systemen, allemaal gebaseerd op de ZettaScaler-2.2-architectuur en de PEZY-SC2-versneller. De meest efficiënte hiervan is het Shoubu-systeem B, dat wordt geïnstalleerd in RIKEN's geavanceerde centrum voor computergebruik en communicatie. Het Shoubu-systeem B behaalde 17, 0 gigaflops / watt; Shoubu-systeem B en de volgende twee systemen, die respectievelijk 16, 8 en 16, 7 gigaflops / watt gebruiken, staan ​​allemaal in de onderste helft van de Top 500-lijst. Het vijfde systeem op de Groene ranglijst is het hierboven genoemde Gyoukou-systeem - het nummer vier-systeem op de Top 500-lijst, met 14, 2 gigaflops / watt.

Dit zijn grote doorbraken voor de PEZY-SC2-versneller en kunnen wijzen op toekomstige aanwijzingen voor supercomputing-architecturen.

De vierde groenste supercomputer is het interne DGX SaturnV Volta-systeem van Nvidia, dat 15, 1 gigaflops / watt bereikte en op de Top 500-lijst op 149 komt. Dit systeem heeft 22.440 Volta-cores (die op een iets andere manier op de lijst lijken te worden geteld dan sommige van de andere cores.) Nvidia heeft een heel goed jaar gehad voor zijn gaspedaal en hoopt op meer machines die de Volta gebruiken GPU-architectuur.

Zoals gewoonlijk kraaiden de grote leveranciers over hun successen op de lijst, waarbij Intel opmerkte dat de CPU's in zes van de top tien-systemen stonden en een recordhoogte van 471 van de 500-systemen. Intel merkte ook op dat zijn nieuwe Xeon Scalable Processors in 18 supercomputers waren met meer dan 25 petaflops aan prestaties. Maar wat meer opvalt, is dat Intel zei dat het Knights Hill annuleert, de geplande 10 nm opvolger van de 14 nm Knights Landing Xeon Phi-processor. Het bedrijf zei dat het nu een nieuw platform voor exascale-systemen (1.000 petaflops) plant tegen 2021, maar heeft geen details bekendgemaakt.

Nvidia benadrukte dat het 34 nieuwe systemen met zijn versnellers op de lijst had, waardoor het totaal van de onderneming op 87 kwam. Nvidia en partner IBM waren aan het kraaien over de mogelijkheid dat tegen de tijd dat de volgende lijst in juni komt, de Summit-machine op Oak Ridge Nationaal laboratorium (ORNL) moet een van de machines bovenaan de lijst zijn. Deze machine beschikt over 4600 knooppunten, elk met twee IBM Power 9 basis-CPU's en 6 Nvidia Volta-versnellers, met een verwachte prestatie van ongeveer 200 petaflops. Dit verschilt van de interne oplossing van Nvidia, omdat de CPU's en GPU's allemaal via NVLink 2.0 communiceren op een cache-coherente manier met behulp van OpenCAPI, zodat de GPU's rechtstreeks toegang hebben tot het RAM van het hoofdsysteem. De top zal worden gevolgd door de Sierra-machine in het Lawrence Livermore National Laboratory, en door de AI Bridging Cloud Infrastructure (ABCI) -machine in Japan.

Ik was geïnteresseerd om te horen dat Cray een "productie-klaar" supercomputer aankondigde op basis van de Cavium ThunderX2-processor op de 64-bit Armv8-A-architectuur, nu beschikbaar als onderdeel van zijn XC50-supercomputer. ARM-gebaseerde machines worden getest in het Barcelona Supercomputer Center (waarvan de Mare Nostrum-machine nu op nummer 16 staat in de Top 500-lijst), evenals de "Post-K"-supercomputer in Japan en de Isambard-supercomputer in het VK. Cavium had enkele vroege benchmarks op de ThunderX2, waaruit bleek dat de 14nm-chip beter presteerde op multi-threaded of geheugengebonden applicaties dan Intel's Skylake Xeons, hoewel Intel de leider blijft in single-threaded en in ruwe teraflops. Merk op dat Qualcomm naast het Cavium-ontwerp ook een ARM-gebaseerde serverchip heeft aangekondigd genaamd Centriq.

In ander processornieuws kondigde AMD aan dat het de productie van zijn Epyc-processors had opgevoerd, hoewel deze nog niet in Top 500-systemen zijn, terwijl NEC versies van zijn Vector Engine PCIe-versnellingskaart aankondigde voor zijn nieuwe SX-Aurora TSUBASA supercomputerserie, die hebben een bijzonder snelle geheugenbandbreedte.

Wat de verbindingen betreft, zei Mellanox dat 77 procent van de nieuwe systemen op de Top 500-lijst InfiniBand gebruiken, terwijl Intel recente successen prees met zijn Omni-Path Architecture, die meestal wordt gebruikt in zijn Xeon Scalable Processor (Skylake) -systemen. Ondertussen kijken een aantal leveranciers naar Gen-Z, ontworpen om een ​​geheugengecentrische benadering met lagere latentie te zijn voor zeer snelle verbindingen tussen computer- en geheugen- / opslagapparaten.

Het is ook interessant om op te merken dat alle machines op de Top 500 voor het eerst Linux draaien.

Tussen de sterke eerste indruk van PEZY-SC2, het besluit van Intel om Knights Mill te dumpen voor een nieuwe architectuur, Nvidia's Volta, en nieuwe concurrentie van AMD, ARM-leveranciers en NEC, is nu een spannende tijd in de wereld van supercomputing. De lijsten van volgend jaar moeten behoorlijk interessant zijn, omdat we zien welke architecturen echt presteren en welke het meest efficiënt zijn, omdat veel van de leveranciers en de supercomputersites zichzelf proberen te positioneren in de race om een ​​exascale (1000 petaflop) -computer met een sub te produceren -20 megawatt stroomverbruik.

Benieuwd naar je breedband internet snelheid? Test het nu!

Supercomputing 17 biedt enkele verrassingen, tips voor de toekomst