A POWER9 az IBM által gyártott szuperskalár, többszálas, többmagosmikroprocesszor-család, amely a Power utasításkészlet-architektúrán alapul. A POWER8 utódja. 2016 augusztusában jelentették be.[2] A POWER9 alapú processzorok 14 nm-esFinFET eljárással készülnek,[3] 12 és 24 magos kiépítésben, emellett scale out (SO) és scale up (SU) skálázási változatokban elérhetőek,[3] és esetlegesen más változatokban is, mivel a POWER9 architektúra nyitott a licencelés és módosítások céljaira az OpenPOWER Alapítvány tagjai számára.[5] Összesen négy célzott lapka-implementáció létezik (magok száma szerint 24/SO, 24/SU, 12/SO és 12/SU).
A Summit szuperszámítógép, amely 2024-ben a kilencedik helyen állt a világ szuperszámítógépeinek ranglistáján (a 2024 júniusi TOP500 lista alapján[6]), a POWER9-en alapul, ezek mellett Nvidia TeslaGPU-kat használ gyorsítóként.[7]
Tervezés
Mag
A POWER9 magjának két változata van, egy négyutas többszálas SMT4 és egy nyolcutas SMT8 jelű.[1] Az SMT4 és SMT8 magok összeállítása hasonló, mind a kettő több úgynevezett „szeletből” áll (slice), amelyeket közös ütemezők táplálnak. A szelet egy egyszerű 64 bites egyszálas feldolgozó mag, betöltő-tároló (LSU), fixpontos (ALU) egységekkel és egy vektor-skalár egységgel (VSU, SIMD és lebegőpontos műveletekhez). Két összekapcsolt szelet alkotja a „szuperszeletet” (super-slice). Egy SMT4 mag egy 32 KiB-os (1 KiB = 1024 bájt) L1 utasítás-gyorsítótárat, egy 32 KiB-os L1 adat-gyorsítótárat, egy utasításlehívó egységet (IFU) és egy utasítássorrend-vezérlő egységet (ISU) tartalmaz, amely két szuperszeletet szolgál ki. Az SMT8 mag gyakorlatilag két SMT4 egység, két készlet L1 gyorsítótárral valamint IFU-kkal és ISU-kkal rendelkezik, amelyek négy szuperszeletet hajtanak meg. Ennek eredményeként az a POWER9 12 és 24 magos változatai azonos számú szeletet tartalmaznak (96 darabot) és ugyanannyi L1 gyorsítótárat tartalmaznak.
A POWER9 moduláris felépítése lehetővé tette, hogy csökkentsék az utasítás-futószalag fokozatainak számát, így a magoknak, mind az SMT4, mind az SMT8 változatban, 12 fokozatú futószalagjuk van (öt fokozattal rövidebb, mint az elődjében, a POWER8-ban), ami elősegíti a 4 GHz körüli órajelfrekvencia megtartását.[1] Ebben a processzortípusban elsőként jelentek meg a 2015 decemberében kiadott Power ISA v.3.0 elemei, az VSX-3 utasításokkal egyetemben.[8] A POWER9 moduláris tervezése alapján több processzorváltozatban készül és licencelhető, az IBM-étől eltérő gyártási eljárással is.[9] A csipen a tömörítést és kriptográfiát segítő társprocesszorok találhatók, valamint egy nagyméretű, alacsony késleltetésű, eDRAM-mal megvalósított L3 gyorsítótár.[3]
A POWER9 egy új megszakításvezérlő architektúrát vezettek be, ami felváltja a POWER4-től POWER8-ig alkalmazott sokkal egyszerűbb architektúrát,
melynek a neve „External Interrupt Virtualization Engine”, röviden XIVE. Az XIVE-t az Power10-ben is felhasználják.[10][11][12]
Scale out / scale up
A scale out a horizontális skálázást, a scale up a vertikális-, ill. felskálázást takarja az IBM terminológiájában, ezeket SO és SU rövidítésekkel jelölik.
IBM POWER9 SO – scale-out változat, két foglalatos, legfeljebb 120 GiB/s sávszélességű, közvetlenül csatlakoztatott DDR4 memóriával rendelkező számítógépekre optimalizálva[1][3][9] (a tervek szerint 2017-ben vagy 2018 elején jelent meg)
IBM POWER9 SU – scale-up változat, négy vagy több foglalatra, nagy NUMA memóriájú gépek számára optimalizált kialakítás, legfeljebb 230 GiB/s sávszélességgel a pufferelt memóriához[1][9] (25,6 GHz-es jeltovábbítást használ a PowerAXON 25 GT/sec összeköttetési interfésszel[13])
Mindkét POWER9 változat olyan változatban is szállítható, amelyben egyes magok le vannak tiltva kihozatali okok miatt, így a Raptor Computing Systems először 4 magos csipeket értékesített, és még az IBM is kezdetben legfeljebb 22 magos csipekkel árulta AC922-es rendszereit, annak ellenére, hogy mindkét típusú chip 24 magot tartalmaz a lapkán.[14][4]
I/O
A lapkákra számos teljesítményt növelő eszköz van építve, ezek segítik a masszív csipen kívüli be- és kimeneti teljesítményt:
Az SO változat integrált DDR4 vezérlőkkel rendelkezik a közvetlenül csatlakoztatott RAM-hoz, míg az SU változat a POWER8-ban bevezetett csipen kívüli Centaur architektúrát használja a nagy teljesítményű eDRAM (beágyazott DRAM) L4 gyorsítótár és a DDR4 RAM memóriavezérlőkhöz való kapcsolatra.[1][3]
A „Cumulus” és „Nimbus” processzorokban a Bluelink összeköttetést alkalmazzák a több processzor közötti NUMA összeköttetés biztosítására, az Nvidia NVLink protokolljának (NVLink v.2) futtatására, a memóriakoherencia biztosítására a Power9 CPU és az Nvidia „Volta” V100 GPU gyorsítók között, és hogy általánosabb memóriakoherens kapcsolatokat biztosítson más típusú gyorsítókhoz az OpenCAPI portokon keresztül.[15]
Általános célú PCIe v.4 csatlakozók normál ASIC-ek, FPGA-k és más perifériák, valamint CAPI 2.0 és a POWER8-hoz tervezett CAPI 1.0 eszközök csatlakoztatásához.
Multiprocesszoros (szimmetrikus többprocesszoros rendszer) kapcsolatok más POWER9 processzorok összekapcsolására ugyanazon az alaplapon, vagy más, szorosan kapcsolt felépítési elemekben.
Lapkatípusok
A POWER9 processzorok kétféle maggal készülhetnek, ezen belül scale out vagy scale up (horizontálisan vagy vertikálisan skálázható) konfigurációban. A POWER9 magok vagy SMT4, vagy SMT8 típusúak; az SMT8 magokat PowerVM virtualizációs szoftvert alkalmazó rendszerekhez szánják, míg az SMT4 magok PowerNV rendszerekhez készülnek, amelyek nem használnak PowerVM-et és leginkább Linuxot futtatnak. A POWER9 családban a scale out funkcióhoz készült chipek támogatják a közvetlenül csatlakoztatott memóriát, míg a scale up csipek a kettőnél több CPU-foglalattal rendelkező gépekhez használhatók, és pufferelt memóriát használnak.[16][1]
POWER9 csipek
PowerNV
PowerVM
24 × SMT4 mag
12 × SMT8 mag
scale out
Nimbus
ismeretlen
scale up
Cumulus
Modulok
Az IBM OpenPOWER portálja felsorolja a Nimbus csiphez elérhető három modult, bár a PowerVM-hez készült scale-out SMT8 változat is a LaGrange modult/foglalatot használja:[17]
Sforza – 50 mm × 50 mm, 4 DDR4, 48 PCIe sáv, 1 XBus 4B[18]
Talos II – két foglalatos munkaállomás/kiszolgáló platform POWER9 SMT4 Sforza processzorok használatával;[22] 2U kiszolgáló (server), 4U kiszolgáló, torony kiépítésben, vagy EATX alaplapként elérhető. A cég biztonságosként és tulajdonos által vezérelhetőként hirdeti, szabad és nyílt forráskódú szoftverrel és firmware-rel kerül forgalomba. Kezdetben 4 magos,[23] 8 magos,[24] 18 magos,[25] és 22 magos[26] kiszerelésben szállították, míg a több maggal rendelkező lapkák nem álltak rendelkezésre.[27][28]
Talos II Lite – a Talos II alaplap egyfoglalatos változata, ugyanazon hordozó áramköri lap felhasználásával.[29]
Blackbird – egy foglalatos microATX platform SMT4 Sforza processzorokkal (akár 8 magos 160 W-os változatban), 4–8 maggal, 2 RAM bővítőhellyel (a teljes RAM mérete elérheti a 256 GiB-ot)[30]
Google–Rackspace partnerség
Barreleye G2 / Zaius – két foglalatos szerverplatform LaGrange processzorokkal;[22] mind a Barreleye G2, mind a Zaius váz a Zaius POWER9 alaplapot használja[31][32][33]
IBM
Power System AC922 – 2U, 2× POWER9 SMT4 Monza, akár 6× Nvidia Volta GPU-val, 2× CAPI 2.0 csatolt gyorsítókkal és 1 TiB DDR4 RAM-mal. Az AC itt az Accelerated Computing rövidítése; ez a rendszer „Witherspoon” vagy „Newell” néven is ismert.[22][34][35][36][37]
Power System S914 – 4U, 1× POWER9 SMT8, 4–8 mag, max. 1 TiB DDR4 RAM-mal, AIX/IBM i/Linux rendszert futtató PowerVM.[38][39]
Power System S922 – 2U, 1–2× POWER9 SMT8, 4–11 mag processzoronként, max. 4 TiB DDR4 RAM-mal, PowerVM alatt futó AIX/IBM i/Linux.[40]
Power System S924 – 4U, 2× POWER9 SMT8, 8–12 mag processzoronként, max. 4 TiB DDR4 RAM-mal, PowerVM alatt futó AIX/IBM i/Linux.[38][39][41]
Power System H922 – 2U, 1–2× POWER9 SMT8, 4–10 mag processzoronként, max. 4 TiB DDR4 RAM-mal, PowerVM, amely (Linux alatti) SAP HANA(HochleistungsANalyseAnwendung) rendszert futtat, AIX/IBM i-vel a rendszer legfeljebb 25%-án.[38][39][42]
Power System H924 – 4U, 2× POWER9 SMT8, 8–12 mag processzoronként, max. 4 TiB DDR4 RAM-mal, (Linux-os) SAP HANA-t futtató PowerVM, AIX/IBM i-vel a rendszer legfeljebb 25%-án.[38][39][42]
Power System E950 – 4U, 2–4× POWER9 SMT8, 8–12 mag processzoronként, max. 16 TiB pufferelt DDR4 RAM[43]
Power System E980 – 1–4× 4U, 4–16× POWER9 SMT8, 8–12 mag processzoronként, max. 64 TiB pufferelt DDR4 RAM[44]
MareNostrum 4 – a negyedik MareNostrum szuperszámítógép feltörekvő technológiák blokkjában kiépített három fürt (klaszter) egyike egy Nvidia Volta GPU-kkal felszerelt POWER9 klaszter. Ez a klaszter várhatóan több mint 1,5 petaFlops számítási kapacitást biztosít a teljes üzemben. A MareNostrum 4 feltörekvő technológiák blokkja azért jött létre, hogy tesztelje hogy az új fejlesztések „alkalmasak lehetnek-e a MareNostrum jövőbeli változataihoz”.[51]
A GNU Guix csomagkezelő szintén támogatja a POWER9-et, azonban a Guix rendszerdisztribúció támogatása kezdettől fogva „technológiai előzetesként” (Technology Preview) volt elérhető.[60][61] 2021 augusztusától bizonyos támogatások beépültek a Guix fő disztribúciójába, de maga a platform továbbra is „technológiai előzetes” állapotban van.[62]
↑ abPower9 To The People (angol nyelven). The Next Platform , 2017. december 5. „a Nimbus Power9 csip #:miben# használják az AC922 egy egycsipes modul ami ~nak van 24 magok #prep.on a lapka. A Summit és Sierra gépek AC922-en alapuló #># getting 22 mag változatok #>nak# a csipek... IBM tudta utóbb/később, mint Power9 hozama/eredményez improve, add egy 24 mag opciót/bővítést.”
↑*Chris Marusich; Léo Le Bouter: New Supported Platform: powerpc64le-linux (angol nyelven). Guix, 2021. április 12. (Hozzáférés: 2025. január 1.) „support for powerpc64le-linux (PowerISA v.2.07 and later) has now been merged to the master branch of GNU Guix!”
Fordítás
Ez a szócikk részben vagy egészben a POWER9 című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.