In een indrukwekkende demonstratie van rekenkracht... heeft het StorageReview Lab team een wereldrecord behaald... door pi te berekenen tot een verbazingwekkende 202.112,290,000Deze opmerkelijke mijlpaal overtreft het team's eigen record van 105 biljoen cijfers.het benadrukken van de ongeëvenaarde mogelijkheden van moderne high-performance computing (HPC) en goed ontworpen commodity hardware platforms.
Een ongekende computationele prestatie
Om deze buitengewone prestatie te bereiken, gebruikte het StorageReview Lab Team een zeer geavanceerde hardware setup.Het team liep een bijna non-stop berekening voor 85 dagen.Dit baanbrekende project onderstreept aanzienlijke vooruitgang in zowel rekenkracht als efficiëntie.
"Dit nieuwe record benadrukt het buitengewone potentieel van de huidige hoogwaardige computerinfrastructuur", aldus Jordan Ranous, systeemarchitect van het StorageReview Lab Team.¢Door deze mijlpaal te halen, stellen we niet alleen nieuwe maatstaven in de rekenmatheek, maar leggen we ook de basis voor toekomstige innovaties op verschillende wetenschappelijke en technische gebieden.
In maart 2024 heeft het StorageReview Lab Team een wereldrecord gemaakt door pi te berekenen tot 105 biljoen cijfers.,Het team overwon grote technische hindernissen, waaronder geheugen- en opslagbeperkingen.Deze prestatie toonde de mogelijkheden van moderne hardware en leverde waardevolle inzichten in het optimaliseren van HPC-systemen.
Niet alleen werkten de Solidigm drives en Dell PowerEdge R760 naadloos samen, maar de bijna hands-off aard van dit nieuwe album was een verfrissende verandering ten opzichte van de uitdagingen van onze laatste poging,- Dat zei Kevin O'Brien.Na wat we hebben meegemaakt in de laatste testrit naar 105 biljoen cijfers, ben ik blij dat we het platform hebben gekozen dat we voor dit belangrijke record hebben gekozen, voegde hij eraan toe.Voor meer details over de vorige poging van 105 biljoen cijfers en de uitdagingen, kunt u het volledige artikel hier lezen.
CompSci en wiskundeles
Toen we voor het eerst begonnen met het onderzoeken van boeiende manieren om SSD's met grote capaciteit te testen, was de oplossing duidelijk in onze CPU- en systeembeoordelingen: y-cruncher.de ruimtebehoefte is ongeveer 4.7De verhouding van 1 naar het aantal cijfers betekent dat 100 biljoen cijfers ongeveer 470 TiB ruimte vereisen.y-cruncher gebruikt het Chudnovsky algoritme, dat gebaseerd is op een snel convergerende reeks afgeleid van modulaire functie en elliptieke curve theorie.
De meest voorkomende vraag die we kregen over onze 100 biljoen en 105 biljoen cijfers was: Oké, dat is indrukwekkend, maar waarom duurt het zo lang en vereist het zoveel geheugen?Deze vraag werd vaak gekoppeld aan andere frustrerende vragen over open source en Alex Yee's programmeerkennisLaten we een stapje terug doen en dit vanuit een systeemperspectief onderzoeken.
Het berekenen van een enorm aantal pi-cijfers, zoals 100 biljoen, vereist een aanzienlijke opslagruimte vanwege de grote rekenkundige bewerkingen.die inherent veel geheugen vereistBijvoorbeeld, de beste algoritmen voor het vermenigvuldigen van N-cijferige getallen hebben ongeveer 4N bytes geheugen nodig, waarvan het grootste deel wordt gebruikt als scratch space.Dit geheugen moet meerdere malen worden geopend tijdens de berekening, waardoor het proces in een disk-I/O-intensieve taak wordt omgezet in plaats van een CPU-gebonden taak.
De formule van Chudnovsky, die veel gebruikt wordt voor het berekenen van massale getallen van pi cijfers, vereist uitgebreide rekenkundige bewerkingen.en het kwadraat taken worden vaak vereenvoudigd tot grootschalige vermenigvuldigingenIn het verleden gebruikten supercomputers AGM-algoritmen, die, hoewel langzamer, gemakkelijker te implementeren waren en profiteerden van de ruwe kracht van meerdere machines.De moderne vooruitgang heeft de knelpunt verplaatst van rekenkracht naar geheugengesnelheid..
Processor Arithmetic Logic Units (ALU's) en Floating Point Units (FPU's) verwerken deze grote vermenigvuldigingen vergelijkbaar met handmatige op papier gebaseerde vermenigvuldiging en breken ze op in kleinere, beheersbare taken.Vroeger waren pi-berekeningen berekeningsgebonden, maar tegenwoordig overschrijdt de rekenkracht de geheugentoegangssnelheden, waardoor opslag en betrouwbaarheid de belangrijkste factoren zijn bij het instellen van pi-records.We zagen weinig verschil in prestaties tussen onze 128 kern Intel machine en een 256 kern AMD BergamoIn plaats daarvan werd de nadruk gelegd op de efficiëntie van schijf-I/O.
Solidigm-SSD's spelen een cruciale rol in deze berekeningen, niet vanwege hun ruwe snelheid, maar vanwege hun uitzonderlijke opslagdichtheid.
NVMe-schijven voor consumenten kunnen tot 4 TB opslaan in een compacte vormfactor, terwijl SSD's voor bedrijven deze chips stapelen voor nog grotere capaciteit.de parallelisme in deze SSD's met een hoge dichtheid zorgt voor een hogere totale bandbreedte, waardoor ze ideaal zijn voor grootschalige pi-berekeningen.
Solidigm QLC NVMe SSD's, die de waanzin mogelijk maken
Als je het nog steeds volgt, dan is dit de belangrijkste les: wanneer computers getallen berekenen die te groot zijn om in het geheugen te passen, vertrouwen ze op software-algoritmen voor meerprecisie-rekenkunde.Deze algoritmen breken grote getallen in beheersbare stukjes en voeren verdeling uit met behulp van gespecialiseerde technieken.Dit is waar de Solidigm P5336 61.44TB NVMe SSD's in het spel komen. y-cruncher neemt deze beheersbare stukjes, slaat ze eerst op in het systeemgeheugen, en wisselt ze vervolgens om schijfruimte te scratchen.
Vergeet niet, we hebben ongeveer 4 nodig.71:1 verhouding voor swapruimte, aangezien elk onderdeel van die eerder genoemde complexe formule door ontelbare bits moet worden weergegeven.
y-cruncher bevat een ingebouwde schattingsmeter voor de vereiste schijfruimte (nog steeds gelabeld disk, *hoest *) die we perfect nauwkeurig vonden in deze en eerdere runs.
Hoewel je HDD's of opslag van objecten kunt gebruiken, is de ruwe capaciteit slechts een stukje van een zeer complexe puzzel, zoals we ontdekten in onze eerste testronde.De mogelijkheid om voldoende grote en snelle opslag in de buurt van het computerapparaat is een terugkerend thema op StorageReview deze dagen, gezien de stijging van de AI-workloads. De prestaties van de swap-ruimte zijn de grootste knelpunt in deze berekening. Direct aangesloten NVMe biedt de hoogste beschikbare prestaties,en hoewel sommige opties sneller doorvoer per apparaat kunnen hebben, was onze grote, dichte reeks QLC drives meer dan in staat om de taak te verwerken.
Consumer Drive en CPU prestaties.
y-cruncher beschikt over een ingebouwde benchmark waarmee u verschillende instellingen kunt aanpassen om de optimale prestaties voor uw schijfrol te vinden.De bovenstaande schermopname toont de benchmarkresultaten voor dit consumentensysteem, met inbegrip van statistieken over de CPU-verwerkingssnelheid en de SSD-prestaties.
Alex Yee geeft uitgebreide documentatie, maar om samen te vatten: na weken testen, vonden we dat het laten van y-cruncher om rechtstreeks met de schijven te communiceren de beste resultaten oplevert.We hebben netwerkdoelen getest., draait achter een SAS RAID-kaart, NVMe RAID-kaarten en iSCSI-doelen.Maar we hebben het alleen getest voor het uitvoerbestandDe swap mode RAID code lijkt goed ontworpen te zijn, en uit onze testen en gesprekken
De 61,44 TB Solidigm schijven komen snel naar voren als de ideale oplossing voor veel uitdagingen in deze ruimte.De test op ons systeem toonde aan dat de schijven presteren op hun gespecificeerde lees- en schrijfsnelheden.We hebben specifiek voor Intel CPU's gekozen om de optimale 2:1 drive-to-computation ratio te bereiken.We kunnen meer uitgebreid, sneller loopt door het selecteren van CPU's met een hoger kern aantal.
¢Custom ¢ Dell PowerEdge R760 Server
Dit is niet onze eerste rodeo met het breken van records met Pi; we hebben lessen getrokken uit onze eerste twee iteraties om het beste Pi-platform te bouwen.Onze eerste build gebruikte een 2U server met 16 NVMe bays en drie interne SSD sleeën.Met 30.72TB Solidigm P5316 SSD's, hadden we de swap opslag voor y-cruncher, maar we moesten een HDD-gebaseerde opslagserver gebruiken voor het uitvoerbestand.Vooral aan het einde van de afschrijvingsfaseOns tweede platform gebruikte dezelfde server, met een externe NVMe JBOF, wat ons extra NVMe bay gaf, maar ten koste van gevoelige bekabeling en onevenwichtige prestaties.Het nadeel van beide platforms was dat ze gedurende de hele y-cruncher run moesten vertrouwen op externe hardware ten koste van extra vermogen en extra storingpunten.
Voor deze run wilden we gebruik maken van één enkele all-direct-NVMe-server en genoeg ruimte hebben voor onze y-cruncher swap opslag en output opslag onder één plaat dak.Voer de Dell PowerEdge R760 in met de 24-bay NVMe Direct Drives backplaneDit platform maakt gebruik van een interne PCIe-switch om alle NVMe-stations tegelijkertijd met de server te laten communiceren, waardoor er geen extra hardware of RAID-apparaten nodig zijn.Vervolgens hebben we een PCIe riser configuratie van meerdere R760s in onze lab omgevingEen bonus was het nemen van grotere radiatoren van een andere R760, waardoor we zoveel mogelijk ruimte kregen.Direct Liquid Cooling kwam een maand te laat in ons lab..
De berekening van pi door het StorageReview Lab tot meer dan 202 biljoen cijfers, uitgevoerd met behulp van 5DeDe Intel Xeon-processor onderstreept de kracht en efficiëntie van deze CPU's.DeDeze mijlpaal zet een nieuwe maatstaf in de rekenmatheek en blijft de weg vrijmaken voor innovaties in verschillende wetenschappelijke en technische werkzaamheden.ZeiSuzi Jewett, General Manager Intel voor 5DeGeneratie Intel Xeon-processorproducten
Hoewel je technisch gezien een Dell-configuratie kon bestellen precies zoals die gebruikt werd in deze run, was het niet iets wat ze hadden liggen en dat moest worden samengevoegd.(Misschien zal Michael een beperkte editie runnen van R760's met deze exacte config, maatverf, en het SR-logo.)
De grootte van de voedingsbron was ook cruciaal voor deze run.Onze bouw leverde de 2400W PSUsWe hadden een paar bijna kritieke energie-afname momenten waarin we ondervermogend zouden zijn geweest als het systeem één stroomverbinding had laten vallen.Deze hit vroeg.Als we dit opnieuw moesten doen, zouden de 2800W-modellen de voorkeur hebben.
Prestatiespecificaties
Technische punten
- Totale cijfers berekend: 202,112,290,000,000
- Gebruikte hardware: Dell PowerEdge R760 met 2x Intel Xeon 8592+ CPU's, 1TB DDR5 DRAM, 28x Solidigm 61.44TB P5336
- Software en algoritmen- Y-cruncher v0.8.3.9532-d2, Chudnovsky.
- Gegevensopslag: 3,76PB geschreven per schijf, 82,7PB over de 22 schijven voor swap array
- Berekeningsduur: 100.673 dagen
y-cruncher Telemetrie
- Logisch grootste controlepost: 305,175,690,291,376 (278 TiB)
- Logisch maximum schijfgebruik: 1,053,227,481,637,440 (958 TiB)
- Logische schijf bytes gelezen: 102614,191,450,271,272 (91,1 PiB)
- Logische schijf bytes geschreven: 88,784,496,475,376,328 (78,9 PiB)
- Startdatum: dinsdag 6 februari 16:09:07 2024
- Einddatum: maandag 20 mei 05:4316 2024
- Pi: 7,272,017.696 seconden, 84.167 dagen
- Totale berekeningstijd: 8,698,188.428 seconden, 100.673 dagen
- Start-tot-einde Muur Tijd: 8,944,449.095 seconden, 103.524 dagen
Het grootste bekende cijfer van Pi is 2, in positie 202.112,290,000, 000 (tweehonderd twee biljoen, honderd twaalf miljard, tweehonderd negentig miljoen).
Bredere implicaties
Hoewel het berekenen van pi op zo'n groot aantal cijfers een abstracte uitdaging lijkt, hebben de praktische toepassingen en technieken die tijdens dit project zijn ontwikkeld verreikende implicaties.Deze vooruitgang kan verschillende rekentaak verbeteren, van cryptografie tot complexe simulaties in de natuurkunde en techniek.
De recente 202 biljoen cijferige pi-berekening toont aanzienlijke vooruitgang in opslagdichtheid en totale eigendomskosten (TCO).720 petabyte NVMe SSD-opslag in een enkel 2U-chassisDeze dichtheid vertegenwoordigt een sprong vooruit in de gegevensopslagcapaciteit, vooral gezien het totale energieverbruik dat slechts 2,4 kW bereikte bij volle CPU- en aandrijflijnbelasting.
Deze energie-efficiëntie contrasteert met traditionele HPC-recordritten die aanzienlijk meer stroom verbruiken en overmatige warmte genereren.Het stroomverbruik neemt exponentieel toe wanneer u extra knooppunten invoert voor grootschalige opslagsystemen als u gedeelde opslag met een lage capaciteit moet uitbreiden in vergelijking met lokale opslag met een hoge dichtheidHet beheersen van warmte is van cruciaal belang, vooral voor kleinere datacenters en serverkasten.dat chillers voor datacenters nodig hebben die meer vermogen kunnen opnemen dan de apparatuur die alleen draait. Door het energieverbruik en de warmteproductie te minimaliseren, biedt onze installatie een duurzamere en beheersbare oplossing voor kleine bedrijven.
Om dit in perspectief te plaatsen, stel je de uitdagingen voor diegenen die werken met netwerkgedeelde opslag en niet-geoptimaliseerde platforms.Die installaties vereisen een of meer datacenter koelers om de temperaturen in toom te houdenIn deze omgevingen zorgt elke bespaarde watt voor minder koeling en lagere operationele kosten, waardoor onze benadering met een hoge dichtheid en een laag vermogen een ideale keuze is.Een ander cruciaal voordeel van het uitvoeren van een slanke en efficiënte platform voor een record run is het beschermen van de hele setup met batterij back-up hardwareZoals eerder vermeld, heb je batterij back-ups nodig voor computer servers, switching, opslag servers, koelers, en waterpompen om het levend te houden voor een goed deel van het jaar.
Over het algemeen,Deze recordprestatie toont het potentieel van de huidige HPC-technologieën en onderstreept het belang van energie-efficiëntie en thermisch beheer in moderne computeromgevingen.
Zorg voor nauwkeurigheid: de Bailey-Borwein-Plouffe-formule
Het berekenen van pi tot 202 biljoen cijfers is een monumentale taak, maar het verzekeren van de nauwkeurigheid van die cijfers is net zo cruciaal.
De BBP-formule stelt ons in staat om de binaire cijfers van pi te verifiëren in hexadecimaal (basis 16) formaat zonder dat we alle voorafgaande cijfers hoeven te berekenen.Dit is vooral nuttig voor kruiscontrole secties van onze enorme berekening.
Dit is een vereenvoudigde verklaring:
- Hexadecimale uitslagDe BBP-formule kan elk willekeurig individuele cijfer van pi in basis 16 rechtstreeks berekenen.Je kunt dit doen met andere programma's zoals GPUPI, maar y-cruncher heeft ook een ingebouwde functie.
- Kruisverificatie: We kunnen deze resultaten vergelijken met onze hoofdberekening door de specifieke posities van pi ̊s hexadecimale cijfers onafhankelijk te berekenen met de BBP-formule.Het geeft sterk aan dat onze hele volgorde correct is.We hebben dit meer dan zes keer gecontroleerd; hier zijn er twee.
Als onze primaire berekening bijvoorbeeld op verschillende punten dezelfde hexadecimale cijfers oplevert als die welke uit de BBP-formule zijn verkregen, kunnen we met vertrouwen beweren dat onze cijfers juist zijn.Deze methode is niet alleen theoretisch.Het is praktisch toegepast bij alle significante pi-berekeningen, waardoor de resultaten robuust en betrouwbaar zijn.
R = officieel resultaat van de uitvoering, V = resultaat van de controle
- R: f3f7e2296 822ac6a8c9 7843dacfbc 1eeb4a5893 37088*
- V: *3f7e2296 822ac6a8c9 7843dacfbc 1eeb4a5893 370888
De scherpzinnige lezers zullen merken dat de verificaties van de screenshots en de bovenstaande vergelijking een beetje verschoven zijn.We hebben ook een paar andere locaties gecontroleerd (zoals 100 biljoen en 105 biljoen cijfers) om ervoor te zorgen dat de run overeenkomtHoewel het theoretisch mogelijk is om elke decimale cijfer van pi te berekenen met behulp van een vergelijkbare methode,Het is onduidelijk of dat meer dan 100 miljoen cijfers nauwkeurig zou zijn of zelfs computationally efficiënt om dat te doen., in plaats van de Chudnovsky wiskunde te doen en ze allemaal te krijgen.
Door dit wiskundige kruiscontroleproces te integreren, kunnen we de integriteit garanderen van onze record 202 biljoen cijfers pi berekening.Het demonstreren van onze computationele precisie en onze toewijding aan wetenschappelijke nauwkeurigheid..
De weg vooruit
The StorageReview Lab Team’s achievement of computing pi to more than 202 trillion digits stands as a powerful testament to the remarkable progress in high-performance computing and storage technologiesDeze recordbrekende prestatie, aangedreven door Intel Xeon 8592+ CPU's in onze Dell PowerEdge R760 en Solidigm 61.44TB QLC NVMe SSD's, benadrukt hoe moderne hardware complexe problemen efficiënt kan aanpakken.de uitgaven voor de uitvoering van de werkzaamheden met een ongeëvenaarde effectiviteitBehalve de expertise van het StorageReview-team,Het succes van het project benadrukt het potentieel van de huidige HPC-infrastructuur om de grenzen van computationele wiskunde en andere wetenschappelijke gebieden te verleggen.
Dit nieuwe Pi-wereldrecord is een opwindende prestatie omdat deze rekenwerklast net zo intens is als veel van de AI-werklasten die we vandaag zien.Nogmaals., dat de krachtige combinatie van ultra-hoge capaciteit, PCIe 4 verzadigende leesprestaties en hoge Petabyte schrijven, enkele van de meest veeleisende toepassingen van vandaag kan weerstaan en ontketenen, zeiGreg Matson, VP, Data Center Storage Group van Solidigm.We zijn verheugd dat we de mogelijkheid hebben gehad om met onze partners van Dell Technologies en de experts van StorageReview een nieuwe recordpoging om Pi te berekenen mogelijk te maken.
Dit initiatief levert ook waardevolle inzichten op het gebied van het optimaliseren van de opslagdichtheid en energie-efficiëntie, waardoor de weg vrij wordt gemaakt voor duurzamere en beheersbare computingoplossingen.Als we het potentieel van HPC blijven verkennen, zullen de lessen die uit dit project zijn getrokken zeker toekomstige innovaties stimuleren, ten bate van verschillende gebieden, variërend van cryptografie tot techniek.De prestatie van het StorageReview Lab Team staat als een mijlpaal in de computationele geschiedenis, waaruit blijkt dat we met de juiste mix van hardware en expertise nieuwe hoogten van wetenschappelijke ontdekkingen en technologische vooruitgang kunnen bereiken.
Dankzegging
Het StorageReview Lab Team bedankt Solidigm, Dell Technologies, Intel en y-cruncher Alex Yee voor hun onwrikbare steun en bijdragen aan dit project.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang, directeur Global Strategy
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Zaken:
Distributie van ICT-producten/Systeemintegratie en diensten/Infrastructuuroplossingen
Met meer dan 20 jaar IT-distributie-ervaring werken we samen met toonaangevende wereldwijde merken om betrouwbare producten en professionele diensten te leveren.
Technologie gebruiken om een intelligente wereld te bouwenUw betrouwbare ICT-productdienstverlener!