Đối tác NVIDIA tại Đài Loan Chuẩn bị cho GPU GeForce RTX 40 'Ada Lovelace' ra mắt vào năm 2022, GPU gaming sử dụng nút xử lý 5nm của TSMC.
Các card đồ họa chơi game GeForce RTX 40 series thế hệ tiếp theo của NVIDIA dựa trên kiến trúc GPU Ada Lovelace đang được chuẩn bị cho sự ra mắt lớn vào năm 2022. Trong báo cáo mới nhất của mình, DigiTimes tuyên bố rằng các đối tác bao gồm các nhà máy Đài Loan là đối tác với NVIDIA đang sẵn sàng cho một đợt làm mới GPU lớn vào năm tới dưới dạng GeForce RTX 40 series.
Chúng ta đã nghe nói về khả năng NVIDIA sử dụng nút quy trình 5nm của TSMC cho các GPU chơi game thế hệ tiếp theo có tên mã Ada Lovelace từ những leaker, thông tin đến từ trực tiếp các nhà máy có trụ sở tại Đài Loan, nơi các GPU này sẽ được sản xuất.
GPU NVIDIA Ada Lovelace sẽ cung cấp sức mạnh cho các card đồ họa GeForce RTX 40 thế hệ tiếp theo sẽ đối đầu với các card đồ họa Radeon RX 7000 series dựa trên RDNA 3 của AMD. Vẫn còn một số suy đoán về việc NVIDIA sử dụng MCM. GPU Hopper, chủ yếu nhắm vào phân khúc Datacenter & AI, được cho là sẽ sớm ra mắt và sẽ có kiến trúc MCM CoWoS. NVIDIA sẽ không sử dụng thiết kế MCM trên GPU Ada Lovelace của mình nên họ sẽ giữ thiết kế nguyên khối truyền thống. GPU Ada Lovelace dự kiến sẽ mang lại một loạt các đổi mới quan trọng về mặt kiến trúc.
Card đồ họa NVIDIA GeForce RTX 4090 - GPU hàng đầu được hỗ trợ bởi Ada Lovelace AD102
Dựa vào những tin đồn trước đó, NVIDIA sẽ sử dụng nút quy trình N5 (5nm) của TSMC cho các GPU Ada Lovelace của mình. Điều này bao gồm cả AD102 SKU sẽ là một thiết kế hoàn toàn nguyên khối. Cụ thể, GPU AD102 được cho là có tốc độ xung nhịp cao tới 2,5 GHz (mức tăng trung bình 2,3 GHz). Dòng tweet cụ thể nói rằng xung nhịp GPU cho Ada Lovelace 'AD102' có thể là 2,3 GHz hoặc cao hơn, vì vậy hãy lấy đó làm cơ sở và các thông số kỹ thuật bị rò rỉ trước đó để tìm ra vị trí hiệu suất sẽ đạt được.
Bước nhảy hiệu suất 150% trông rất lớn nhưng nên nhớ rằng NVIDIA đã có một bước nhảy vọt về số lượng FP32 trong thế hệ này với Ampere. GPU Ampere GA102 (RTX 3090) cung cấp 36 TFLOP trong khi GPU Turing TU102 (RTX 2080 Ti) cung cấp 13 TFLOP. Đó là mức tăng hơn 150% về FP32 Flops nhưng mức tăng hiệu suất chơi game trong thế giới thực đối với RTX 3090 trung bình nhanh hơn khoảng 50-60% so với RTX 2080 Ti.
NVIDIA AD102 "ADA GPU" dường như có 18432 lõi CUDA dựa trên thông số kỹ thuật sơ bộ (có thể thay đổi), nằm trong 144 đơn vị SM. Con số này gần gấp đôi số lõi có trong Ampere vốn đã là một bước tiến lớn so với Turing. Tốc độ xung nhịp 2,3-2,5 GHz sẽ cung cấp cho chúng tôi hiệu suất máy tính lên tới 85 đến 92 TFLOP (FP32). Đây là hơn hai lần hiệu suất FP32 của RTX 3090 hiện tại, có 36 TFLOP của sức mạnh tính toán FP32.