Các tin đồn gần đây về dòng NVIDIA GeForce RTX 4090 thế hệ tiếp theo cho thấy rằng card đồ họa hỗ trợ AD102 có thể là sản phẩm chơi game đầu tiên vượt qua rào cản 100 TFLOP.

Card đồ họa NVIDIA GeForce RTX 4090 Class có thể trở thành GPU’AD102’chơi game đầu tiên vượt qua rào cản 100 TFLOPs

Hiện tại, NVIDIA GeForce RTX 3090 Ti cung cấp hiệu suất tính toán cao nhất trong số tất cả các cạc đồ họa chơi game, đạt từ 40 đến 45 TFLOP của tính toán GPU FP32 (Độ chính xác đơn). Nhưng với việc các GPU thế hệ tiếp theo sẽ ra mắt vào cuối năm nay, mọi thứ sẽ có một bước tiến lớn.

Thẻ đồ họa Intel Arc Alchemist A770 được xuất hiện trên Geekbench & PugetBench Benchmarks

Thành thật mà nói, tôi không có nhiều thông tin về AMD. Có lẽ sự cạnh tranh của Lisa và Jensen sẽ mang lại cho chúng ta một cuộc chiến chơi game 100TFLOPS trong vài tháng nữa.

-kopite7kimi (@ kopite7kimi) Ngày 29 tháng 4 năm 2022

Tôi chỉ có thể nói rằng hai sản phẩm đã được cải thiện rất nhiều so với người tiền nhiệm, nhưng nếu bạn muốn hãy hỏi trực tiếp tôi xem cái nào tốt hơn, tôi rất tiếc không thể trả lời vì không ai biết sự cải thiện cụ thể theo tỷ lệ phần trăm.

-Greymon55 (@ greymon55) Ngày 30 tháng 4 năm 2022

Theo tin đồn từ Kopite7kimi và Greymon55, các cạc đồ họa thế hệ tiếp theo, không chỉ của NVIDIA mà cả AMD, dự kiến ​​sẽ đạt mốc 100 TFLOP. Điều này sẽ đánh dấu một cột mốc quan trọng trong thị trường đồ họa tiêu dùng, nơi chắc chắn đã chứng kiến ​​một hiệu suất lớn và cũng là một bước nhảy vọt với thế hệ thẻ hiện tại. Chúng tôi đã đi thẳng từ 275W là giới hạn lên 350-400W trở thành tiêu chuẩn và những thiết bị tương tự như RTX 3090 Ti đã tận dụng được hơn 500W công suất. Thế hệ tiếp theo sẽ còn ngốn nhiều điện năng hơn nhưng nếu các con số tính toán vẫn tiếp diễn, thì chúng ta đã biết một lý do tại sao chúng lại tiêu thụ nhiều điện năng như vậy.

Theo báo cáo, GPU Ada Lovelace của NVIDIA, đặc biệt là chip AD102, đã chứng kiến ​​một số bước đột phá lớn trên nút quy trình 4N của TSMC. So với các tin đồn về tốc độ xung nhịp 2,2-2,4 GHz trước đây, ước tính hiện tại là AMD và NVIDIA sẽ có tốc độ tăng tương tự nhau và đó là khoảng 2,8-3,0 GHz. Đối với NVIDIA cụ thể, công ty sẽ kết hợp tổng cộng 18.432 lõi cùng với 96 MB bộ nhớ đệm L2 và giao diện bus 384-bit. Chúng sẽ được xếp chồng lên nhau trong một bố cục 12 GPC với 6 TPC và 2 SM cho mỗi TPC với tổng số 144 SM.

Tin đồn về card đồ họa NVIDIA GeForce RTX 40: GPU AD102 cho RTX 4090 24 GB, GPU AD103 Đối với RTX 4080 16 GB, GPU AD104 Đối với RTX 4070 12 GB, Titan-Class Tối đa 48 GB & 900W

Dựa trên tốc độ đồng hồ lý thuyết là 2,8 GHz, bạn nhận được tối đa 103 TFLOP của hiệu suất máy tính và những tin đồn cho thấy đồng hồ tăng cao hơn nữa. Bây giờ, chúng chắc chắn nghe giống như đồng hồ cao điểm, tương tự như tần số cao điểm của AMD cao hơn đồng hồ’Trò chơi’trung bình. Hơn 100 TFLOPs tính toán hiệu suất có nghĩa là hơn gấp đôi mã lực so với hàng đầu 3090 Ti. Nhưng cần lưu ý rằng hiệu suất máy tính không nhất thiết chỉ ra hiệu suất chơi game tổng thể nhưng mặc dù vậy, nó sẽ là một nâng cấp lớn cho PC chơi game và tăng 8,5 lần so với bảng điều khiển nhanh nhất hiện tại, Xbox Series X.

Vì vậy, vào cuối ngày, chúng ta nhất định phải thấy phần cứng PC, đặc biệt là cạc đồ họa, trở nên mạnh mẽ hơn nhưng sẽ thật tuyệt khi thấy tất cả sức mạnh đó được sử dụng tốt để chạy thế hệ trò chơi tiếp theo, đặc biệt là Các tựa game 8K với khả năng dò tia và các hiệu ứng đồ họa trong tương lai.

Thông số kỹ thuật GPU sắp ra mắt của AMD, Intel, NVIDIA (Sơ bộ)

Tên GPUAD102Navi 31Xe2-HPG CodenameAda LovelaceRDNA 3Battlemage Flagship SKUGeForce RTX 4090 SeriesRadeon Dòng RX 7900 Series Arc B900 Bộ xử lý GPU TSMC 4NTSMC 5nm + TSMC 6nmTSCM 5nm? Gói GPU Nguyên khốiMCD (Multi-Chiplet Die) MCM (Multi-Chiplet Die) GPU DieMono x 12 x GCD + 4 x MCD + 1 x IODQuad-Tile (tGPU) GPU Mega Cluster12 GPC (Graphics Processing Cluster) 6 Shader Engine10 Render Slices GPU Super Các cụm 72 TPC (Cụm xử lý kết cấu) 30 WGP (Mỗi MCD)
60 WGP (Tổng cộng) 40 Xe-Core (Mỗi Tile)
160 Xe-Core (Tổng số) Cụm GPU144 Dòng đa xử lý (SM) 120 Đơn vị tính toán (CU)
240 Đơn vị tính (tổng cộng) 1280 Xe VE (Mỗi ô)
5120 Xe VE (Tổng cộng) Lõi (Mỗi lõi) 18432 Lõi CUDA 7680 SP (Mỗi GCD)
15360 SP (Trong Tổng cộng) 20480 ALU (Tổng cộng) Xung nhịp đỉnh ~ 2,85 GHz ~ 3,0 GHz TBD FP32 Tính toán ~ 105 TFLOPs ~ 92 TFLOPs TBD Loại bộ nhớGDDR6XGDDR6GDDR6? Dung lượng bộ nhớ 24 GB32 GBTBD Bus bộ nhớ384-bit256-bitTBD Tốc độ bộ nhớ ~ 21 Gbps ~ 18 GbpsTBD Hệ thống con bộ nhớ đệm 96 MB L2 Cache512 MB (Bộ nhớ đệm vô cực) TBD TBP ~ 600W ~ 500WTBD Khởi chạyQ4 2022Q4 20222023

Categories: IT Info