Ampere Computing ha annunciato questa mattina che la sua famiglia di processori AmpereOne è entrata in produzione e ha fornito ulteriori dettagli su questi processori per server Arm progettati internamente.
I nuovi core AmpereOne sono un design di base personalizzato interno come precedentemente rivelato dalla società. Nel progettare AmpereOne esattamente per i provider di servizi cloud, AmpereOne offre fino a 192 core fisici per socket, ben al di sopra dei già impressionanti 128 core attualmente offerti da Ampere Altra Max.
Sono stato informato in anticipo sulla roadmap aggiornata di Ampere Computing e mentre AmpereOne è in produzione e campiona con i clienti, Non ho ancora avuto l’opportunità di testare in prima persona nessuna piattaforma AmpereOne per verificarne indipendentemente le prestazioni e l’efficienza energetica. Spero che ciò accada presto. Alcuni dettagli su AmpereOne sono ancora limitati, come nessuna tabella SKU con velocità di clock, informazioni sui prezzi o disponibilità da parte dei fornitori di servizi di cloud pubblico che sono stati divulgati durante il briefing avanzato. Come anticipato, AmpereOne passa a DDR5 e PCIe Gen 5.0, abbinando le capacità dei più recenti processori AMD EPYC”Genoa”e Intel Xeon Scalable”Sapphire Rapids”.
Nuovo con i core personalizzati di AmpereOne sono Bfloat16, tagging della memoria, crittografia della memoria a chiave singola, virtualizzazione sicura, gestione energetica avanzata e una serie di altri miglioramenti rispetto ai precedenti processori Ampere Altra e Ampere Altra Max.
Uno degli aspetti Sono rimasto molto sorpreso da AmpereOne è che almeno per ora lo stanno limitando a un numero di core più elevato non coperto da Ampere Altra/Altra Max. In altre parole, AmpereOne è per 136/144/160/176/192 conteggi di core… Al momento non sono previsti processori AmpereOne per 128 core o meno attualmente coperti dalla famiglia Ampere Altra. Presumibilmente ciò è dovuto alla loro grande scommessa nel puntare i nuovi processori esattamente per i fornitori di servizi cloud interessati a massimizzare la densità delle macchine virtuali. Avevo chiesto informazioni sulla possibilità di un processore per sviluppatori AmpereOne con numero di core inferiore o per coloro che desiderano meno core ma interessati ad AmpereOne per BFloat16 o altre nuove funzionalità trovate con questi nuovi processori, ma attualmente non hanno in programma alcun prodotto in questo segmento. In altre parole, vai alla grande o vai a casa.
Alla fascia alta con AmpereOne a 192 conteggi di core c’è un rapporto sulla potenza di utilizzo di circa 350 Watt. AmpereOne sfrutta 8 canali di memoria DDR5 come Intel Sapphire Rapids ma al di sotto dei 12 canali DDR5 di cui gode AMD Genoa.
Il core personalizzato di Ampere include 64 KB di cache dati L1 a 4 vie per core, cache di istruzioni L1 da 16 KB per core e cache L2 da 2 MB per core. Si dice che ci siano guadagni di efficienza energetica, presumibilmente in parte dovuti all’aggiornamento nel processo di produzione di TSMC, ma i dettagli esatti non sono stati definiti.
Ampere Computing sta segnalando molte più macchine virtuali per rack possibile con AmpereOne, su cui basano la loro valutazione solo sul numero di core CPU fisici possibili e una VM per core fisico. Quindi questa affermazione è piuttosto dubbia in effetti solo riportando il numero massimo di core per rack possibile senza alcun potenziale di potenza/prestazioni delle suddette VM.
I benchmark iniziali forniti da Ampere per AmpereOne è piuttosto limitato: un benchmark di Stable Diffusion per l’IA generativa e quindi l’utilizzo di DLRM per le raccomandazioni sull’IA. Secondo quanto riferito, AmpereOne offre 2,3 volte più frame al secondo rispetto a un AMD EPYC 9654″Genova”e più del doppio del numero di query al secondo per DLRM rispetto a EPYC 9654. Sfortunatamente, questi due benchmark delle prestazioni AI sono tutto ciò che viene mostrato per gli annunci di oggi.
Un elemento che è importante sottolineare è stato durante le note finali della loro presentazione, con il benchmark DLRM stanno testando AmpereOne utilizzando FP16 mentre per AMD EPYC 9654 è stato testato utilizzando FP32. AmpereOne ha registrato una potenza media del sistema durante il DLRM a 534 Watt su AMD EPYC Genoa 9654 a 512 Watt.
Ampere Computing ha concluso il briefing mostrando la vasta gamma di partner di fornitori di hardware come Giga Computing, Foxconn, HPE e Supermicro a cloud pubblici come Microsoft Azure, Tencent Cloud, Google Cloud e altri. Questo è indicativo dei loro partner attuali e non si sa ancora quando vedremo un qualsiasi hardware AmpereOne o inizieremo a vedere questi 192 processori server core nel cloud pubblico.
Mi è stato detto durante il mio briefing che grazie al loro primo kernel upstreaming oltre ad avere già il supporto del compilatore per GCC e LLVM Clang, le principali distribuzioni AArch64 Linux dovrebbero essere pronte per essere eseguite su AmpereOne. Quelle precedenti patch del compilatore hanno confermato che AmpereOne è basato su ARMv8.6 ISA.
Per ora è tutto con le informazioni tratte dalla divulgazione odierna della roadmap di Ampere Computing. Speriamo presto di poter testare l’hardware AmpereOne per fornire uno sguardo indipendente alle sue prestazioni e all’efficienza energetica attraverso una più ampia varietà di benchmark.