Huis Vooruit denken We krijgen twee enorme nieuwe supercomputers

We krijgen twee enorme nieuwe supercomputers

2024

Video: SERVER vs MAINFRAME vs SUPERCOMPUTER | What is the difference? [Overview] (November 2024)

De Amerikaanse regering heeft vandaag een grote gok gemaakt dat snellere supercomputers zullen helpen bij het oplossen van enkele van de grootste problemen in de wetenschap, met plannen om twee enorme supercomputers te bouwen, die elk meerdere keren sneller zouden zijn dan de snelste machines van vandaag.

Dit omvat $ 325 miljoen voor de bouw van de nieuwe supercomputers, inclusief een nieuwe machine genaamd Summit bij Oak Ridge National Laboratories (ORNL) en een andere genaamd Sierra bij Lawrence Livermore National Laboratory (LLNL), evenals $ 100 miljoen voor onderzoek en ontwikkeling op extreme schaal supercomputing-technologie in een programma genaamd FastForward2. De top zal naar verwachting 150 tot 300 piek petaflop / s (quadriljoenen drijvende komma berekeningen per seconde) leveren, en Sierra meer dan 100 petaflop / s vergeleken met de 54.9 piek petaflop / s van de snelste machine van vandaag (de Tianhe-2) op de weg naar 'exascale computing'.

Om dit in perspectief te plaatsen, het totale rekenvermogen van de Top500-systemen vanaf een paar maanden geleden was 274 petaflop / s (een nieuwe Top500-lijst zal volgende week verschijnen in combinatie met de show SuperComputing 14). Beide systemen worden gebouwd door IBM en zijn gebaseerd op IBM Power-architectuur CPU's, Nvidia Tesla GPU's en Mellanox-interconnects.

Tom Rosamilla, Senior Vice President van IBM Systems & Technology Group, beschreef de systemen als een nieuwe "datacentrische architectuur" die is ontworpen om databewegingen zoveel mogelijk te elimineren door de gegevens dichter bij de computer te plaatsen. IBM zegt dat dit is ontworpen om toonaangevende, kosteneffectieve modellering, simulatie, applicaties en analyses op Big Data te bieden, en profiteert van het OpenPower-initiatief (waarvan Nvidia en Mellanox lid zijn).

Als onderdeel hiervan zal het Nvidia Tesla GPU's gebruiken op basis van zijn aanstaande Volta-architectuur (die in 2017 moet zijn, volgend op de Pascal-architectuur die in 2016 moet zijn) en de NVLink-technologie van het bedrijf voor verbindingen tussen alle processors in een enkel serverknooppunt. Sumit Gupta, General Manager van Tesla GPU Accelerated Computing voor Nvidia, beschreef NVLink als de "eerste hogesnelheidsverbinding voor de GPU", waardoor point-to-point communicatie mogelijk is tussen een GPU en een andere GPU, evenals tussen de GPU en de Kracht CPU. (De eerste generatie NVLink is gepland voor 2016; de nieuwe systemen zullen de tweede generatie gebruiken.) De knooppunten binnen de systemen worden verbonden met behulp van de volgende generatie Mellanox EDR 100 Gb / s InfiniBand-interconnect.

IBM zei dat elk systeem een topprestatie heeft "ruim 100 petaflops", in balans met meer dan vijf petabytes aan dynamisch geheugen en flashgeheugen, en in staat zal zijn om gegevens naar de processor te verplaatsen met meer dan 17 petabytes per seconde (wat bedrijf zegt dat dit gelijk staat aan het verplaatsen van meer dan 100 miljard foto's per seconde).

Jeffrey Nichols, geassocieerd laboratoriumdirecteur voor de informatica- en computerwetenschappen van ORNL, beschreef de architectuur als "een kleiner aantal knooppunten met een veel grotere footprint voor gedeeld geheugen" en zei dat ontwikkelaars de parallelle belastingen die momenteel op de huidige ORNL draaien moeten optimaliseren en efficiënter kunnen uitvoeren. Titan systeem. ORNL zegt dat het Summit-systeem meer dan 3400 knooppunten zal bevatten met elk knooppunt inclusief meerdere IBM Power 9-processors en meerdere Nvidia Volta GPU's, met meer dan 512 GB DDR4 en geheugen met hoge bandbreedte (in een samenhangend ontwerp, zodat het kan werken met alle CPU's en GPU's) samen met 800 GB niet-vluchtig RAM, voor meer dan 40 teraflops van topprestaties. Het zal een GPFS Storage Server-systeem hebben met 1 TB / s I / O-bandbreedte en 120 PB schijfcapaciteit. Dit zou uiteindelijk het huidige Titan-systeem van ORNL moeten vervangen, wat een Cray-systeem is gebaseerd op AMD Opteron-processors en Nvidia Kepler CPU's, geschikt voor 27 petaflop / s, waarbij Nichols zegt dat Summit 5 tot 10 keer de prestaties van Titan moet leveren. Summit is gepland voor levering in 2017 en beschikbaar voor gebruikers in 2018.

De beoogde toepassingen voor het Summit-systeem zijn onder andere verbrandingswetenschap (proberen de efficiëntie van verbrandingsmotoren met 25-50 procent te verhogen), wetenschap op het gebied van klimaatverandering, energieopslag en kernenergie. Nichols zei dat de top ORNL in staat moet stellen om "de horizon te verbreden" van de wetenschap die ze in de laboratoria doen.

Het LLNL-systeem, Sierra genaamd, is gericht op het programma Advanced Simulation and Computing (ASC) van de National Nuclear Security Administration (NNSA), voornamelijk ontworpen op het gebied van wapenwetenschap en -evaluatie. Volgens Mike McCoy, de ASC-programmadirecteur van LLNL, stelt de supercomputer het laboratorium in staat om simulaties te maken van de nucleaire voorraad van het land zonder terug te keren naar nucleaire testen. Hij zei dat de 3D-wapensimulatiecode van het lab "een van de meest gecompliceerde toepassingen op de planeet" was. Hij merkte op dat dit niet het geval is van de overheid die een kant-en-klaar systeem koopt, maar eerder een "co-ontwerp" waarbij programmeurs en systeemontwerpers samenwerken aan de architectuur.

Beide systemen, die deel uitmaken van een Department of Energy-programma bekend als Collaboration of Oak Ridge, Argonne en Lawrence Livermore National Labs (CORAL), zijn gericht op het versnellen van de ontwikkeling van high-performance computing. IBM zegt dat het programmeren voor dergelijke systemen vandaag kan beginnen, maar de systemen zullen pas in 2017 of 2018 worden geïnstalleerd. Als onderdeel van het CORAL-programma krijgt Argonne National Lab ook nieuwe supercomputing maar heeft het nog niet aangekondigd.

Over het algemeen zei Nichols dat hij Summit en Sierra zag als 'vroege stappen naar exascale' en zei hij uit te kijken naar toekomstige systemen langs hetzelfde architecturale pad en hoopte op een lange samenwerking met de leveranciers. Ongeveer vijf jaar nadat Summit is afgeleverd, zei hij, zou hij hopen een exascale computer te hebben.

Ook heeft AMD vandaag aangekondigd dat het $ 32 miljoen heeft ontvangen in twee DOE-awards, als onderdeel van het FastForward2-project, om exascale node-architectuur te onderzoeken op basis van zijn Heterogeneous Architecture (HSA) -gebaseerde versnelde verwerkingseenheden (APU's) en te helpen bij het ontwerpen van een nieuwe standaard voor toekomstige geheugeninterfaces. DOE zei dat AMD, Cray, IBM, Intel en Nvidia de FastForward2-projecten zullen leiden. (Intel en Cray zijn niet betrokken bij de vandaag aangekondigde supercomputers, maar blijven grote spelers in de ruimte, dus het zal interessant zijn om te zien of ze betrokken zijn bij de plannen van Argonne.)