Ampere Computing ogłasza AmpereOne z maksymalnie 192 rdzeniami na gniazdo

Ampere Computing ogłosiło dziś rano, że ich rodzina procesorów AmpereOne weszła do produkcji i dostarczyło dodatkowe szczegóły na temat tych zaprojektowanych przez nas procesorów serwerowych ARM.

Nowe rdzenie AmpereOne są wewnętrzny niestandardowy projekt rdzenia, jak wcześniej ujawniono przez firmę. Projektując AmpereOne wprost dla dostawców usług w chmurze, AmpereOne oferuje do 192 fizycznych rdzeni na gniazdo – znacznie więcej niż już imponujące 128 rdzeni dostępnych obecnie w Ampere Altra Max.

Zostałem wcześniej poinformowany o zaktualizowanej mapie drogowej Ampere Computing i podczas gdy AmpereOne jest w fazie produkcji i próbkowania z klientami, Nie miałem jeszcze okazji osobiście przetestować żadnej platformy AmpereOne, aby samodzielnie spojrzeć na jej wydajność i efektywność energetyczną. Miejmy nadzieję, że wkrótce to nastąpi. Niektóre szczegóły dotyczące AmpereOne są nadal ograniczone, na przykład brak tabeli SKU z częstotliwościami taktowania, informacjami o cenach lub dostępności przez dostawców usług w chmurze publicznej, które zostały ujawnione podczas zaawansowanej odprawy. Zgodnie z przewidywaniami, AmpereOne przechodzi na DDR5 i PCIe Gen 5.0 – dopasowując możliwości najnowszych procesorów AMD EPYC „Genoa” i Intel Xeon Scalable „Sapphire Rapids”.

Nowość z niestandardowe rdzenie AmpereOne to Bfloat16, znakowanie pamięci, szyfrowanie pamięci jednym kluczem, bezpieczna wirtualizacja, ulepszone zarządzanie energią i szereg innych ulepszeń w stosunku do poprzednich procesorów Ampere Altra i Ampere Altra Max.

Jeden z aspektów Najbardziej zaskoczyło mnie to, że w przypadku AmpereOne przynajmniej na razie ograniczają to do większej liczby rdzeni nieobjętej przez Ampere Altra/Altra Max. Innymi słowy, AmpereOne ma 136/144/160/176/192 rdzeni… Obecnie nie ma żadnych procesorów AmpereOne planowanych na 128 rdzeni lub mniej, które są obecnie objęte rodziną Ampere Altra. Przypuszczalnie wynika to z ich dużego zaangażowania w kierowanie nowych procesorów bezpośrednio do dostawców usług w chmurze zainteresowanych maksymalizacją gęstości maszyn wirtualnych. Zapytałem o możliwość procesora deweloperskiego AmpereOne z mniejszą liczbą rdzeni lub dla tych, którzy chcą mniej rdzeni, ale są zainteresowani AmpereOne dla BFloat16 lub innymi nowymi możliwościami, które można znaleźć w tych nowych procesorach, ale obecnie nie planują żadnych produktów w tym segmencie. Innymi słowy, idź na całość lub idź do domu.

Na najwyższym poziomie z AmpereOne przy 192 rdzeniach jest raportowana moc użytkowa na poziomie około 350 W. AmpereOne wykorzystuje 8 kanałów pamięci DDR5, takich jak Intel Sapphire Rapids, ale poniżej 12 kanałów DDR5, z których korzysta AMD Genoa.

Niestandardowy rdzeń Ampere oferuje 64 KB czterokierunkowej pamięci podręcznej danych L1 na rdzeń, 16 KB pamięci podręcznej instrukcji L1 na rdzeń i 2 MB pamięci podręcznej L2 na rdzeń. Mówi się, że nastąpił wzrost wydajności energetycznej, prawdopodobnie częściowo z powodu aktualizacji procesu produkcyjnego TSMC, ale dokładne szczegóły nie zostały określone.

Ampere Computing zgłasza znacznie więcej maszyn wirtualnych na szafę z AmpereOne, na której opierają swoją ocenę tylko na liczbie możliwych fizycznych rdzeni procesora i jednej maszynie wirtualnej na fizyczny rdzeń. Tak więc to twierdzenie jest w rzeczywistości raczej wątpliwe, po prostu podaje maksymalną możliwą liczbę rdzeni na szafę bez jakiegokolwiek potencjału mocy/wydajności wspomnianych maszyn wirtualnych.

Pierwsze testy porównawcze dostarczone przez Ampere dla AmpereOne są raczej ograniczone: test porównawczy Stable Diffusion dla generatywnej sztucznej inteligencji, a następnie użycie DLRM do zaleceń AI. Podobno AmpereOne oferuje 2,3 razy więcej klatek na sekundę niż AMD EPYC 9654 „Genoa” i ponad dwa razy więcej zapytań na sekundę dla DLRM niż EPYC 9654. Niestety, te dwa testy wydajności AI to wszystko, co pokazano w dzisiejszych ogłoszeniach.

Jedną z rzeczy, na którą należy zwrócić uwagę, było przeglądanie notatek końcowych ich prezentacji, z testem porównawczym DLRM, który testują AmpereOne przy użyciu FP16, podczas gdy dla AMD EPYC 9654 był testowany przy użyciu FP32. Firma AmpereOne odnotowała średnią moc systemu podczas DLRM na poziomie 534 watów do AMD EPYC Genoa 9654 na poziomie 512 watów.

Ampere Computing zakończyło swoją odprawę, pokazując szeroką gamę partnerów od dostawców sprzętu, takich jak Giga Computing, Foxconn, HPE i Supermicro do chmur publicznych, takich jak Microsoft Azure, Tencent Cloud, Google Cloud i inne. To wskazuje na ich aktualnych partnerów i nie wiadomo jeszcze, kiedy zobaczymy jakikolwiek sprzęt AmpereOne lub zaczniemy widzieć te 192-rdzeniowe procesory serwerowe w chmurze publicznej.

Powiedziano mi podczas moja odprawa, że dzięki ich wczesnemu upstreamingowi jądra, a także już istniejącej obsłudze kompilatorów dla GCC i LLVM Clang, główne dystrybucje Linuksa AArch64 powinny być gotowe do działania na AmpereOne. Te wcześniejsze łatki kompilatora potwierdziły, że AmpereOne jest oparty na ARMv8.6 ISA.

To na razie tyle, biorąc pod uwagę informacje z dzisiejszego ujawnienia mapy drogowej Ampere Computing. Mamy nadzieję, że wkrótce będziemy mogli przetestować sprzęt AmpereOne, aby zapewnić niezależne spojrzenie na jego wydajność i efektywność energetyczną w szerszym zakresie testów porównawczych.

Ampere Computing ogłasza AmpereOne z maksymalnie 192 rdzeniami na gniazdo

Published by IT Info on May 19, 2023

IT Info

sdl12-compat sprawia, że więcej gier działa w tej warstwie zgodności SDL1-On-SDL2

IT Info

Szybkie zakończenie 10 wyjaśnione: odpowiedzi na twoje największe pytania

IT Info

Wyjaśnienie szybkiej sceny po napisach 10

Ampere Computing ogłasza AmpereOne z maksymalnie 192 rdzeniami na gniazdo

Published by IT Info on May 19, 2023

Related Posts

IT Info

sdl12-compat sprawia, że ​​więcej gier działa w tej warstwie zgodności SDL1-On-SDL2

IT Info

Szybkie zakończenie 10 wyjaśnione: odpowiedzi na twoje największe pytania

IT Info

Wyjaśnienie szybkiej sceny po napisach 10

sdl12-compat sprawia, że więcej gier działa w tej warstwie zgodności SDL1-On-SDL2