Az ARM CPU technológia már régóta az okostelefonok és táblagépek választott processzora, és más beágyazott eszközökben is elterjedt, ahol az alacsony energiafogyasztás kulcsfontosságú szempont. Az elmúlt néhány évben azonban a vállalati munkaterhelések, például a HPC és az AI fejlődésével az ARM CPU-k kezdtek vonzóbbá válni szerverkörnyezetben. Ez a váltás az ARM-alapú processzorok eltérő működésének köszönhető, szemben az Intel és az AMD hagyományos x86-os szerver CPU-ival.
Új megközelítés az új munkafolyamatokhoz
Röviden: az ARM processzorok azért uralják az akkumulátoros és kis teljesítményű piacokat, mert felépítésük RISC-alapú, nem pedig CISC-alapú. A CISC (komplex utasításkészletű számítógép) tervezések és kompatibilisek az Intel eredeti 8086-os processzorával az 1970-es évek végéről – az ezen az eredeti terven alapuló CPU-kat x86-os processzornak nevezzük. Bár egy 70-es években született processzor nem tűnik túl korszerűnek, ezt a kezdeti tervezést sokszor frissítették és helyettesítették, hogy eljussanak a ma ismert 64 bites x86-os Intel Xeon és AMD EPYC processzorokhoz. Másrészt az Arm CPU-k RISC (csökkentett utasításkészletű számítógép) felépítést használnak – az eredeti Acorn és BBC Micro számítógépektől kezdve az 1980-as évek óta több generáción keresztül fejlődtek a mai ARM CPU-kig.
CISC-alapú design | RISC-alapú design |
---|---|
Komplex utasítások | Egyszerű utasítások |
Nagyszámú utasítás (100-300) | Az utasítások alacsony száma (30-40) |
Változó utasításhossz vagy utasításméret | Az utasítások hossza vagy mérete rögzített |
Több művelet utasításonként | Egy művelet utasításonként |
Nagy energiafogyasztás (100W+) | Kis energiafogyasztás (5-10W) |
Bonyolult hardver – Egyszerű szoftver | Egyszerű hardver – Összetett szoftver |
Mivel a RISC-alapú processzorok egyszerűbb utasításkészleteket használnak, és kisebb mennyiségben tartalmaznak egyetlen műveletre vonatkozó utasításokat, végső soron kevesebb energiát fogyasztanak, így ideálisak a túlnyomórészt akkumulátorral működő vagy nagyon kevés energiát fogyasztó eszközökhöz. Az x86-os Xeon és EPYC CPU-kban az összetett utasításkészleteket több magon keresztül dolgozzák fel – a belépőmodellekben 8 magtól kezdve a felső kategóriás modellekben akár 128 magig. A magok ilyen skálázása a teljesítmény növekedését eredményezi, mivel a sebesség és a teljesítmény javulása révén nagyobb igénybevételt jelentő számítási munkaterheléseket tud kezelni. Ehhez képest egy ARM CPU sok kisebb, kevésbé kifinomult, alacsony fogyasztású processzort alkalmaz, amelyek mindegyike maga is több maggal rendelkezik, így a számítási feladatok valójában több száz mikroprocesszor között oszlanak meg. A teljesítmény növelésének ezt a módszerét néha skálázásnak nevezik, és azt eredményezheti, hogy egy Arm szerver nagyobb feldolgozási teljesítményt nyújt, ugyanakkor kevesebb energiát használ és kevesebb hűtést igényel, mint egy x86-alapú megfelelője. Emellett lehetővé teszi a CPU különböző típusú magjainak használatát a különböző munkaterhelések kezeléséhez.
Ez a megközelítésbeli különbség tovább fokozódik, ha figyelembe vesszük, hogy a szerver CPU-generációkat két-három évente frissítik, szemben az okostelefonok és táblagépek CPU-ival, amelyeket évente legalább egyszer frissítenek, hogy fenntartsák a keresletet egy nagyon versenyképes piacon. Ez a megnövekedett fejlesztési ciklus az elmúlt évtizedben sokkal több fejlődést eredményezett az Arm térben, mint az x86 esetében, ami egyre kisebb CPU-architektúrákat eredményezett. Az x86-os CPU-k jellemzően 14 nm-től 10 nm-ig, majd nemrégiben 7 nm-ig terjedtek, míg az Arm-alapú CPU-k ugyanezen idő alatt 14, 10, 7, 5 és 4 nm-es kialakításon mentek keresztül. Minden egyes alkalommal, amikor a tranzisztorok összezsugorodnak, nagyobb számú tranzisztor fér el a CPU-ban, növelve annak összteljesítményét, ami még vonzóbbá teszi az ARM CPU-kat a szerverpiacon, ahol egyre több a szoftveresen definiált technológia és alkalmazás, amelyek kisebb, de nagyobb számú feladatot igényelnek, mint például a nagy teljesítményű számítások, a gépi tanulás, a mélytanulás és alapvetően az AI.
Munkaterhelésre szabott CPU-magok
Bár hivatkozhatunk ARM-alapú szerverekre, az Intellel vagy az AMD-vel ellentétben az ARM nem gyártója ezeknek a CPU-knak. Az olyan márkák, mint az Ampere, az NVIDIA és a Qualcomm licencelik és fejlesztik az ARM-alapú CPU-t, az alábbi magok kombinációját használva, attól függően, hogy milyen munkaterhelést kívánnak az adott processzorral megoldani. Előfordulhat, hogy egy adott magot eredetileg mobil felhasználásra terveztek, vagy egy szerveralkalmazásban vagy munkafolyamatban alkalmazva különleges előnnyel vagy hasznos tulajdonsággal rendelkezik.
Cortex-A magok
Az ARM Cortex-A 32 bites és 64 bites processzormagok egy csoportja, amelyet a legmagasabb teljesítményre optimalizáltak a legalacsonyabb áron.
Cortex-A715
- Második generációs Armv9 „nagy” CPU a kategóriájában legjobb hatékony teljesítményért
- A CPU-klaszter munkagépe a „big.LITTLE” konfigurációkban
- Célzott mikroarchitektúra-optimalizálás a 20%-os energiahatékonysági javulás érdekében.
Cortex-A710
- Első generációs Armv9 „nagy” CPU, amely a teljesítmény és a hatékonyság egyensúlyát kínálja
- Az ARMv9 architektúra jellemzőinek hozzáadása a nagyobb teljesítmény és biztonság érdekében
- 30%-kal nagyobb energiahatékonyság a Cortex-A78-hoz képest
Cortex-A510
- Első generációs Armv9 nagy hatékonyságú „LITTLE” CPU
- Nagy teljesítménynövekedés egy nagy hatékonyságú CPU esetében
- Innovatív mikroarchitektúra-frissítések
- Több mint 3x-os ML teljesítménynövekedés a Cortex-A55-höz képest
Cortex-A78
- A negyedik generációs nagy teljesítményű CPU, amely a DynamIQ technológián alapul. A leghatékonyabb prémium Cortex-A CPU
- A következő generációs fogyasztói eszközökhöz készült
- Megragadó élmények lehetővé tétele új formátumok és összecsukható eszközök esetén
- Az ML-eszközök reakciókészségének és az olyan képességeknek a javítása, mint az arc- és beszédfelismerés.
Cortex-A78C
- Piac-specifikus megoldások nyújtása fejlett biztonsági funkciókkal és nagyméretű, nagymagos konfigurációkkal
- Teljesítmény a laptop-osztályú termelékenységhez és a játékhoz útközben
- Fejlett adat- és eszközbiztonság a Pointer-hitelesítéssel
- Jobb skálázhatóság akár 8 nagy magos konfigurációval és akár 8 MB L3 gyorsítótárral
Cortex-A78AE
- A legfejlettebb, biztonságkritikus alkalmazásokhoz tervezett processzor
- Alkalmas összetett automatizált vezetési és ipari autonóm rendszerekhez
- Split-Lock képesség hibrid üzemmóddal a rugalmas működéshez
- Továbbfejlesztett támogatás az ISO 26262 ASIL B és ASIL D biztonsági követelményekhez
Cortex-R magok
Az Arm Cortex-R egy 32 bites és 64 bites processzormagokból álló csoport, amely valós idejű és biztonságkritikus alkalmazásokhoz lett optimalizálva.Cortex-R82
- Nagyobb teljesítményű valós idejű processzor
- Hatékony, nagy teljesítményű számítási lehetőséget kínál komplex tárolási alkalmazásokhoz
- Támogatja az Arm Neon technológiát az ML gyorsításhoz
- MMU-t valósít meg a gazdag operációs rendszertámogatáshoz
Cortex-R52
- Felfejlett processzor a funkcionális biztonságért
- Fejlett biztonsági funkciókat tesz lehetővé számos autóipari alkalmazáshoz
- A szoftveres elkülönítés védi a biztonságkritikus kódot
- A nagy teljesítményű többmagos klaszterek valós idejű reakciókészséget biztosítanak
Cortex-R52+
- Valós idejű virtualizációs támogatás a funkcionális biztonsághoz
- A szoftveres szétválasztás lehetővé teszi több operációs rendszer integrálását a biztonságkritikus kód védelme mellett
- A nagy teljesítményű többmagos klaszterek valós idejű reakciókészséget biztosítanak
Cortex-R8
- Tárolóvezérlőkhöz és modemekhez alkalmas nagy teljesítményű processzor
- Alacsony késleltetési időt kínál
- A konfigurálható portok rugalmas tervezési lehetőségeket támogatnak
- A nagy teljesítményű tömegtároló alkalmazásokhoz szükséges érzékeny teljesítményt nyújtja.
Cortex-R4
- A legkisebb, valós idejű teljesítményű processzor
- Kiváló energiahatékonyságot és költséghatékonyságot kínál
- Prioritást ad a megbízhatóságnak és a hibakezelésnek a beépített hibakezeléssel
- Ideális beágyazott alkalmazásokhoz, beleértve az autókat és a kamerákat is
Ethos magok
Az Ethos a legnagyobb teljesítményű neurális processzorok családja a gépi tanulási következtetésekhez.Ethos-N78
- Skálázható és hatékony második generációs ML következtetési processzor
- 2x gyorsabb következtetés 40%-kal alacsonyabb sávszélességgel, 25%-kal nagyobb hatékonysággal
- Többféle piac 1-től 10 TOP/s-ig és akár 90 egyedi konfigurációig
- Egyszeri fejlesztés, bárhol történő telepítés online és offline fordítással
Ethos-U65
- Az innováció támogatása az AI-eszközök új világában az élek és a végpontokon
- 1,0 TOP/s ML teljesítményt nyújt körülbelül 0,6 mm2 -en
- 256 és 512 darab 8 bites MAC között konfigurálható partner
- Az egységesített toolchain támogatja a Cortex-M és Cortex-A alapú rendszereket
Ethos-U55
- Konfigurálható és hatékony beágyazott ML következtetés
- Akár 0,5 TOP/s, 480-szoros ML-emelkedés és 90%-os energiacsökkentés
- 32-től 256 8 bites MAC-ig konfigurálható partner kb. 0,1 mm2 -en
- Gyors fejlesztés egyetlen eszközlánccal a Cortex-M és Ethos-U rendszerekhez
Neoverse magok
A Neoverse processzorok sorozata maximális magonkénti teljesítményt nyújt az igényes számítás- és memóriaintenzív alkalmazásokat futtató rendszerek, például felhő- és virtualizált infrastruktúrák számára.Neoverse V1
- Egy teljesítmény-fókuszú szint, amely a HPC-t, a HPC-t a felhőben és az AI és ML-gyorsítású alkalmazásokat célozza
- Az Arm első SVE implementációja a HPC-piac számára, 2x lebegő és 4x ML-emelkedéssel a Neoverse N1-hez képest
- A Neoverse N1-hez képest 50%-os IPC-növekedéssel bővíti a piacvezető teljesítményt.
Neoverse N2
- Vezető teljesítményhatékonyság a felhőtől a peremfelületig terjedő infrastruktúrákhoz
- Piacvezető skálázhatóság és sokoldalúság
- Jelentős, 40%-os IPC teljesítménynövekedés a Neoverse N1-hez képest
- Az Armv9 a teljesítmény (SVE2) és a biztonság (MTE) szempontjából kulcsfontosságú funkciókat vezet be
Neoverse N1
- Meggyorsítja a skálázható felhőtől a peremekig terjedő infrastruktúrára való átállást
- Forradalmi számítási teljesítmény
- Az infrastruktúrára jellemző platformfunkciók
- Rendkívüli méretarányú és változatos számítási lehetőségekhez tervezve
Neoverse E1
- Az infrastruktúra teljesítményének növelése a következő generációs átviteli igények kielégítésére
- Intelligens tervezés a rendkívül hatékony átviteli teljesítményért
- Teljes mértékben kihasználja az Arm sokszínű szoftveres ökoszisztémáját
- Nagymértékben skálázható áteresztőképesség a peremtől a magig tartó adattovábbításhoz
Az ARM alapú szerverek eladása világszerte érdekes kérdés.
Jelenleg a globális szervermennyiség mintegy 40%-a Kínában található, és az ARM alapú szerverek további növekedésre számíthatnak az elkövetkező időszakban. Ennek oka az, hogy Kínában az x86 alapú szerverprocesszorok beszerzése nehézkesen oldható meg, így az ARM alapú alternatívák egyre népszerűbbek. A kínai vállalatok közül többen is fejlesztik az ARM alapú klienspiaci és szerverpiaci SoC (System on a Chip) egységeket, például az Alibaba, a Phytium és a Huawei. Ugyanakkor a RISC-V architektúra is egyre dinamikusabban fejlődik, és több kínai chipfejlesztő is ezt az alternatívát vizsgálja. Az ARM architektúra jelenleg sokkal ütőképesebb, és olyan meghatározó cégek támogatják, mint az AWS, a Google, az Nvidia, a Microsoft, a Samsung és a Qualcomm. Ezek a vállalatok aktívan dolgoznak azon, hogy a szoftveres ökoszisztéma tökéletesen kompatibilis legyen az ARM alapú szerverprocesszorokkal, ami kulcsfontosságú a térhódításukhoz.