AMD-

Các bản vá mã công khai mới nhất trong danh sách gửi thư hôm nay đang chuẩn bị cho các máy chủ không đồng nhất mới hơn của AMD sẽ có các nút Aldebaran GPU được kết nối thông qua liên kết xGMI với (các) CPU và GPU lần lượt chết khi có bộ nhớ HBM2.

Các chi tiết hệ thống AMD không đồng nhất mới này đã được tiết lộ ngày hôm nay như một phần của tập hợp các bản vá lỗi cài sẵn mã trình điều khiển nhân AMD64 EDAC (Phát hiện và sửa lỗi) cho các nút không phải CPU. Trình điều khiển AMD64 EDAC theo truyền thống là để xử lý và sửa lỗi DRAM ECC của hệ thống trong khi giờ đây được mở rộng sang bộ nhớ nút GPU có thể truy cập từ CPU thông qua kết nối tốc độ cao xGMI.

Các bản vá công khai lưu ý rằng sẽ có các hệ thống có các nút GPU được kết nối thông qua liên kết xGMI và các ổ GPU có bộ nhớ HBM2. Các bản vá tiếp tục xác nhận các nút đó là Aldebaran , tên mã của AMD thế hệ tiếp theo Bộ tăng tốc/GPU CDNA đã hỗ trợ trình điều khiển hạt nhân ban đầu trong Linux 5.13 và tiếp tục thấy nhiều trình điều khiển mã nguồn mở hoạt động xung quanh nó. Aldebaran là người kế nhiệm rõ ràng cho MI100″Arcturus”và do đó có lẽ sẽ ra mắt như một thứ gì đó cùng dòng với AMD Instinct MI200.

Các bản vá này được xuất bản một thời gian ngắn trước lưu ý rằng Aldebaran có hai khuôn (xác nhận thêm Aldebaran là một thiết kế MCM) với mỗi khuôn có bốn bộ điều khiển bộ nhớ thống nhất (UMC). Mỗi bộ điều khiển bộ nhớ hợp nhất quản lý tám kênh bộ nhớ mà mỗi kênh được kết nối với 2GB bộ nhớ HBM2 (hoặc HBM2E).

Bảy bản vá được đăng chuẩn bị cho trình điều khiển bộ nhớ EDAC cho khái niệm về các nút không phải CPU được kết nối, nhận dạng loại bộ nhớ HBM Gen2, dịch địa chỉ trên Data Fabric phiên bản 3.5 và hệ thống ống nước liên quan. Việc nhận được sự hỗ trợ của Linux này ngay lập tức đang được thúc đẩy bởi sự thống trị của Linux trong không gian HPC và đặc biệt là với chiến thắng ngày càng tăng trong thiết kế siêu máy tính của AMD. Đáng chú ý nhất là Aldebaran và đến lượt nó, mã Linux này có thể là những gì chúng ta sẽ thấy trong siêu máy tính Frontier exascale sắp tới, nơi nó đã được đề cập là có sự kết nối chặt chẽ giữa các CPU EPYC và GPU Radeon Instinct.

Với thời gian của các bản vá này khi cửa sổ hợp nhất Linux 5.14 đã mở, các bản bổ sung amd64_edac này có thể sẽ đến với Linux 5.15 trừ khi được rút ra bởi một quá trình xem xét mở rộng.

Categories: IT Info