Inihayag ng Ampere Computing kaninang umaga na ang kanilang pamilya ng mga processor ng AmpereOne ay pumasok sa produksyon at nagbigay ng mga karagdagang detalye sa mga in-house na dinisenyong mga processor ng Arm server na ito.
Ang mga bagong AmpereOne core ay isang in-house na custom na pangunahing disenyo tulad ng dati nang isiniwalat ng kumpanya. Sa tamang pagdidisenyo ng AmpereOne para sa mga cloud service provider, nag-aalok ang AmpereOne ng hanggang 192 na pisikal na core bawat socket–na mas mataas sa nakamamanghang 128 na core na kasalukuyang binibigay ng Ampere Altra Max.
Na-briefed ako nang maaga sa na-update na roadmap ng Ampere Computing at habang ang AmpereOne ay nasa produksyon at nagsa-sample sa mga customer, Hindi pa ako nagkakaroon ng pagkakataong subukan ang anumang mga platform ng AmpereOne nang direkta para sa hiwalay na pagtingin sa kanilang pagganap at kahusayan sa kuryente. Sana mangyari iyon sa lalong madaling panahon. Limitado pa rin ang ilang detalye sa AmpereOne, gaya ng walang SKU table na may mga bilis ng orasan, impormasyon sa pagpepresyo, o availability ng mga public cloud service provider na ibinunyag sa advanced briefing. Gaya ng inaasahan, lumipat ang AmpereOne sa DDR5 at PCIe Gen 5.0–tumutugma sa mga kakayahan ng pinakabagong AMD EPYC”Genoa”at Intel Xeon Scalable”Sapphire Rapids”na mga processor.
Bago sa ang mga custom na core ng AmpereOne ay Bfloat16, memory tagging, single-key memory encryption, secure na virtualization, pinahusay na pamamahala ng power, at isang hanay ng iba pang mga pagpapahusay kaysa sa mga naunang Ampere Altra at Ampere Altra Max na mga processor.
Isa sa mga aspeto Ang pinakanagulat ko sa AmpereOne ay na hindi bababa sa ngayon ay nililimitahan nila ito sa mas mataas na bilang ng core na hindi sakop ng Ampere Altra/Altra Max. Sa madaling salita, ang AmpereOne ay para sa 136/144/160/176/192 core counts… Sa kasalukuyan ay walang anumang AmpereOne processor na nakaplano para sa 128 core o mas kaunti pa na kasalukuyang sakop ng pamilyang Ampere Altra. Marahil ito ay dahil sa kanilang malaking taya sa pagpuntirya ng mga bagong processor para sa mga cloud service provider na interesadong i-maximize ang density ng VM. Nagtanong ako tungkol sa posibilidad ng isang mas mababang bilang ng core na AmpereOne developer processor o para sa mga gustong mas kaunting mga core ngunit interesado sa AmpereOne para sa BFloat16 o iba pang mga bagong kakayahan na makikita sa mga bagong processor na ito, ngunit sa kasalukuyan ay wala silang anumang mga produktong nakaplano sa segment na ito. Sa madaling salita, pumunta nang malaki o umuwi.
Sa tuktok na dulo na may AmpereOne sa 192 core count ay nasa 350 Watt na pag-uulat ng kuryente. Ang AmpereOne ay nag-tap out sa 8 channel ng DDR5 memory tulad ng Intel Sapphire Rapids ngunit mas mababa sa 12 channel na DDR5 na tinatangkilik ng AMD Genoa.
Nagtatampok ang custom na core ng Ampere ng 64KB 4-way L1 data cache bawat core, 16KB L1 na cache ng pagtuturo bawat core, at isang 2MB L2 cache bawat core. Sinasabing may mga nadagdag na kahusayan sa kuryente, marahil sa bahagi dahil sa pag-upgrade sa proseso ng pagmamanupaktura ng TSMC ngunit ang mga eksaktong detalye ay hindi inilatag.
Ang Ampere Computing ay nag-uulat ng higit pang mga VM bawat rack hangga’t maaari sa AmpereOne, kung saan ibinabatay nila ang kanilang pagtatasa sa bilang ng mga posibleng pisikal na CPU core at isang VM bawat pisikal na core. Kaya ang claim na ito ay medyo kahina-hinala sa bisa sa pag-uulat lamang ng maximum na bilang ng mga core sa bawat rack na posible nang walang anumang potensyal na kapangyarihan/pagganap ng nasabing mga VM.
Ang mga unang benchmark na ibinigay ng Ampere para sa Ang AmpereOne ay medyo limitado: isang benchmark ng Stable Diffusion para sa generative AI at pagkatapos ay gumagamit ng DLRM para sa mga rekomendasyon ng AI. Iniulat na nag-aalok ang AmpereOne ng 2.3x na higit pang mga frame sa bawat segundo kaysa sa isang AMD EPYC 9654″Genoa”at higit sa dalawang beses ang bilang ng mga query sa bawat segundo para sa DLRM bilang EPYC 9654. Sa kasamaang palad, ang dalawang benchmark ng performance ng AI na ito ay ang tanging ipinapakita para sa mga anunsyo ngayon.
Isang item na mahalagang ituro ay kapag dumaan sa mga end notes ng kanilang presentasyon, kasama ang DLRM benchmark na sinusubok nila ang AmpereOne gamit ang FP16 habang para sa AMD EPYC 9654 ay nasubok gamit ang FP32. Nakita ng AmpereOne ang system power average sa panahon ng DLRM sa 534 Watts hanggang sa AMD EPYC Genoa 9654 sa 512 Watts.
Tinapos ng Ampere Computing ang kanilang briefing sa pamamagitan ng pagpapakita ng kanilang malawak na hanay ng mga kasosyo mula sa mga hardware vendor tulad ng Giga Computing, Foxconn, HPE, at Supermicro sa mga pampublikong ulap tulad ng Microsoft Azure, Tencent Cloud, Google Cloud, at iba pa. Ito ay nagpapahiwatig ng kanilang kasalukuyang mga kasosyo at wala pang salita kung kailan natin makikita ang anumang AmpereOne hardware o magsisimulang makita ang 192 core na mga processor ng server na ito sa pampublikong cloud.
Sinabi sa akin noong ang aking briefing na salamat sa kanilang maagang kernel upstreaming pati na rin ang pagkakaroon ng compiler support para sa GCC at LLVM Clang sa lugar, ang mga pangunahing distribusyon ng AArch64 Linux ay dapat na handa para sa pagtakbo sa AmpereOne. Kinumpirma ng mga naunang patch ng compiler na iyon ang AmpereOne bilang batay sa ARMv8.6 ISA.
Iyon lang sa ngayon kasama ang impormasyon mula sa paghahayag ng roadmap ng Ampere Computing ngayon. Sana sa lalong madaling panahon ay mahanap na natin ang AmpereOne hardware para sa pagsubok para makapagbigay ng independiyenteng pagtingin sa performance at power efficiency nito sa mas malawak na iba’t ibang benchmark.