Trong một blog kỹ thuật , NVIDIA cuối cùng đã chia sẻ một số con số so sánh bộ tăng tốc Ampere A100 hiện có của mình với GPU AMD Instinct MI250.
NVIDIA Tuyên bố Hiệu suất cao hơn gấp 2 lần & Hiệu suất gần gấp 3 lần đối với GPU Ampere A100 so với Bản năng của AMD MI250
NVIDIA đã công bố GPU H100 thế hệ tiếp theo của mình dựa trên kiến trúc đồ họa Hopper (GPU) sẽ được giao hàng cho khách hàng sau này năm. GPU Hopper sẽ mang lại hiệu suất ước tính tăng 26 lần so với Pascal P100 được phát hành cách đây sáu năm và nhanh hơn gấp 3 lần so với quỹ đạo mà Định luật Moore đưa ra.
NVIDIA trình diễn ConnectX-7 tại ISC 2022: Công tắc thế hệ tiếp theo với 8 tỷ bóng bán dẫn
Vì vậy, đến với các bài kiểm tra hiệu suất, NVIDIA đã kiểm tra GPU Ampere A100 ở cả cấu hình đơn và đa GPU. Các cấu hình tương tự đã được sử dụng cho Instinct MI250 của AMD. Một số khối lượng công việc phổ biến nhất của Trung tâm dữ liệu như LAMMPS, NAMD, openMM, GROMACS & AMBER, đã được sử dụng để kiểm tra hiệu suất.
GPU Ampere A100 đơn của NVIDIA hóa ra nhanh hơn tới 1,9 lần so với AMD Bộ tăng tốc GPU MI250 bản năng trong khi giải pháp bốn GPU cho thấy mức tăng lên đến 2,1 lần cho hệ thống Ampere. Về hiệu quả năng lượng, giải pháp quad-GPU cung cấp hiệu suất/watt cao hơn 2,8 lần.
Hiệu suất tuyệt vời và hiệu suất năng lượng của GPU NVIDIA A100 là kết quả của nhiều năm hợp tác phần mềm-phần cứng không ngừng-tối ưu hóa để tối đa hóa hiệu suất và hiệu quả ứng dụng. Để biết thêm thông tin về kiến trúc NVIDIA Ampere, hãy xem Sách trắng NVIDIA A100 Tensor Core GPU .
A100 cũng thể hiện như một bộ xử lý duy nhất cho hệ điều hành, yêu cầu chỉ khởi chạy một cấp MPI để tận dụng hết lợi thế của nó màn biểu diễn. Và, A100 mang lại hiệu suất tuyệt vời trên quy mô lớn nhờ kết nối NVLink 600 GB/s giữa tất cả các GPU trong một nút.
Sau đây là những lưu ý từ thử nghiệm:
Tỷ lệ hiệu quả của A100 đến MI250 được hiển thị-cao hơn là tốt hơn cho NVIDIA. Geomean trên nhiều bộ dữ liệu (thay đổi) cho mỗi ứng dụng. Hiệu quả là Hiệu suất/Công suất tiêu thụ (Watts) được đo cho GPU sử dụng được đo bằng NVIDIA SMI và chức năng tương đương trong ROCm |
AMD MI250 được đo trên GIGABYTE M262-HD5-00 với (2) AMD EPYC 7763 với 4x AMD Instinct ™ MI250 OAM (128 GB HBM2e) GPU 500W với công nghệ AMD Infinity Fabric ™. NVIDIA chạy trên ProLiant XL645d Gen10 Plus sử dụng CPU EPYC 7713 kép và 4x A100 (80 GB) SXM4
LAMMPS grow_db00b49 (AMD) Develop_2a35ec2 (NVIDIA) bộ dữ liệu ReaxFF/c, Tersoff, Leonard-Jones, SNAP | Tập dữ liệu NAMD 3.0alpha9 STMV_NVE | OpenMM 7.7.0 Ensemble chạy cho các bộ dữ liệu: amber20-stmv, amber20-cellulose, apoa1pme, pme |
GROMACS 2021.1 (AMD) 2022 (NVIDIA) Bộ dữ liệu ADH-Dodec (h-bond), STMV (h-bà) | Bộ dữ liệu AMBER 20.xx_rocm_mr_202108 (AMD) và 20.12-AT_21.12 (NVIDIA) Cellulose_NVE, STMV_NVE | 1x MI250 có 2x GCD
qua NVIDIA
Bây giờ cần lưu ý rằng AMD Instinct MI250 được sử dụng ở đây không phải là cấu hình đầy đủ vì nó nằm trên MI250X nhưng dựa trên những kết quả này, A100 vẫn sẽ rất cạnh tranh với các sản phẩm AMD CDNA 2. Với Hopper sắp ra mắt, NVIDIA sẽ còn đẩy những con số này lên hơn nữa và đó là lúc AMD’s Instinct MI300 xuất hiện với thiết kế giống APU hoàn toàn mới.