Pengkomputeran Ampere mengumumkan pagi ini bahawa keluarga pemproses AmpereOne mereka telah memasuki pengeluaran dan memberikan butiran tambahan tentang pemproses pelayan Arm rekaan dalaman ini.
Teras AmpereOne baharu ialah reka bentuk teras tersuai dalaman seperti yang didedahkan oleh syarikat sebelum ini. Dalam mereka bentuk AmpereOne tepat untuk pembekal perkhidmatan awan, AmpereOne menawarkan sehingga 192 teras fizikal setiap soket–jauh melebihi 128 teras yang sedia mengagumkan yang diberikan oleh Ampere Altra Max pada masa ini.
Saya telah diberi taklimat lebih awal tentang peta jalan Ampere Computing yang dikemas kini dan sementara AmpereOne sedang dalam pengeluaran dan pensampelan dengan pelanggan, Saya masih belum berpeluang untuk menguji mana-mana platform AmpereOne secara langsung untuk melihat secara bebas pada prestasi dan kecekapan kuasa mereka. Semoga perkara itu akan berlaku tidak lama lagi. Beberapa butiran tentang AmpereOne masih terhad, seperti tiada jadual SKU dengan kelajuan jam, maklumat harga atau ketersediaan oleh penyedia perkhidmatan awan awam yang telah didedahkan semasa taklimat lanjutan. Seperti yang dijangkakan, AmpereOne beralih kepada DDR5 dan PCIe Gen 5.0–memadankan keupayaan pemproses AMD EPYC”Genoa”dan Intel Xeon Scalable”Sapphire Rapids”terbaharu.
Baharu dengan teras tersuai AmpereOne ialah Bfloat16, penandaan memori, penyulitan memori kunci tunggal, virtualisasi selamat, pengurusan kuasa yang dipertingkatkan dan pelbagai penambahbaikan lain berbanding pemproses Ampere Altra dan Ampere Altra Max sebelumnya.
Salah satu aspek Saya paling terkejut dengan AmpereOne ialah mereka sekurang-kurangnya buat masa ini mengehadkannya kepada kiraan teras yang lebih tinggi yang tidak dilindungi oleh Ampere Altra/Altra Max. Dalam erti kata lain, AmpereOne adalah untuk kiraan teras 136/144/160/176/192… Tiada pemproses AmpereOne pada masa ini yang dirancang untuk 128 teras atau kurang dilindungi oleh keluarga Ampere Altra pada masa ini. Mungkin ini disebabkan oleh pertaruhan besar mereka untuk menyasarkan pemproses baharu tepat untuk penyedia perkhidmatan awan yang berminat untuk memaksimumkan kepadatan VM. Saya telah bertanya tentang kemungkinan pemproses pembangun AmpereOne kiraan teras yang lebih rendah atau bagi mereka yang mahukan kurang teras tetapi berminat dengan AmpereOne untuk BFloat16 atau keupayaan baharu lain yang ditemui dengan pemproses baharu ini, tetapi pada masa ini mereka tidak mempunyai sebarang produk yang dirancang dalam segmen ini. Dalam erti kata lain, pergi besar atau pulang ke rumah.
Di bahagian atas dengan AmpereOne pada kiraan teras 192 adalah sekitar pelaporan kuasa penggunaan 350 Watt. AmpereOne menggunakan 8 saluran memori DDR5 seperti Intel Sapphire Rapids tetapi di bawah 12 saluran DDR5 yang dinikmati oleh AMD Genoa.
Teras tersuai Ampere mempunyai 64KB 4-hala L1 cache data setiap teras, cache arahan L1 16KB setiap teras dan cache L2 2MB setiap teras. Dikatakan terdapat peningkatan kecekapan kuasa, mungkin sebahagiannya disebabkan oleh peningkatan dalam proses pembuatan TSMC tetapi butiran yang tepat tidak dibentangkan.
Pengkomputeran Ampere melaporkan lebih banyak VM setiap rak mungkin dengan AmpereOne, yang mana mereka mendasarkan penilaian mereka hanya pada bilangan teras CPU fizikal yang mungkin dan satu VM setiap teras fizikal. Jadi dakwaan ini agak meragukan kerana hanya melaporkan bilangan maksimum teras setiap rak yang mungkin tanpa sebarang potensi kuasa/prestasi VM tersebut.
Tanda aras awal yang disediakan oleh Ampere untuk AmpereOne agak terhad: penanda aras Stable Diffusion untuk AI generatif dan kemudian menggunakan DLRM untuk pengesyoran AI. AmpereOne dilaporkan menawarkan 2.3x lebih bingkai sesaat daripada AMD EPYC 9654″Genoa”dan lebih daripada dua kali ganda bilangan pertanyaan sesaat untuk DLRM sebagai EPYC 9654. Malangnya, kedua-dua penanda aras prestasi AI ini sahaja yang ditunjukkan untuk pengumuman hari ini.
Satu perkara yang penting untuk ditekankan ialah apabila melalui nota akhir pembentangan mereka, dengan penanda aras DLRM mereka menguji AmpereOne menggunakan FP16 manakala untuk AMD EPYC 9654 telah diuji menggunakan FP32. AmpereOne melihat purata kuasa sistem semasa DLRM pada 534 Watts kepada AMD EPYC Genoa 9654 pada 512 Watts.
Pengkomputeran Ampere mengakhiri taklimat mereka dengan menunjukkan rangkaian luas rakan kongsi mereka daripada vendor perkakasan seperti Pengkomputeran Giga, Foxconn, HPE dan Supermicro kepada awan awam seperti Microsoft Azure, Tencent Cloud, Google Cloud dan lain-lain. Ini menunjukkan rakan kongsi semasa mereka dan belum ada maklumat lagi bila kita akan melihat sebarang perkakasan AmpereOne atau mula melihat 192 pemproses pelayan teras ini dalam awan awam.
Saya diberitahu semasa taklimat saya bahawa terima kasih kepada huluan kernel awal mereka serta sudah mempunyai sokongan pengkompil untuk GCC dan LLVM Clang disediakan, pengedaran Linux AArch64 utama harus sedia untuk dijalankan pada AmpereOne. Tampalan pengkompil terdahulu itu mengesahkan AmpereOne sebagai berdasarkan ISA ARMv8.6.
Itu sahaja buat masa ini dengan maklumat daripada pendedahan peta jalan Ampere Computing hari ini. Mudah-mudahan tidak lama lagi kami akan mendapatkan perkakasan AmpereOne untuk ujian bagi memberikan pandangan bebas pada prestasi dan kecekapan kuasanya merentas pelbagai penanda aras yang lebih luas.