Đây là những sản phẩm được thiết kế để nâng tầm hiệu suất AI, đặc biệt trong các tác vụ suy luận (inference) và đào tạo (training), khẳng định vị thế của Nvidia trong cuộc đua công nghệ toàn cầu.
Tại Hội nghị Công nghệ GPU (GTC) 2025, Tổng Giám đốc Nvidia Jensen Huang đã giới thiệu dòng GPU tăng tốc AI mạnh mẽ, bao gồm Blackwell Ultra B300, Vera Rubin và Rubin Ultra. Đây là những sản phẩm được thiết kế để nâng tầm hiệu suất AI, đặc biệt trong các tác vụ suy luận (inference) và đào tạo (training), khẳng định vị thế của Nvidia trong cuộc đua công nghệ toàn cầu.
![Nvidia cong bo loat GPU AI moi tai GTC 2025: Blackwell Ultra B300, Vera Rubin va Rubin Ultra Nvidia công bố loạt GPU AI mới tại GTC 2025: Blackwell Ultra B300, Vera Rubin và Rubin Ultra]()
Blackwell Ultra B300, dự kiến ra mắt vào nửa cuối năm 2025, là bản nâng cấp đáng kể từ Blackwell GB200. GPU này tăng dung lượng bộ nhớ từ 192GB lên 288GB HBM3e và cải thiện 50% hiệu suất tính toán FP4 tensor dày đặc. Điều này giúp hỗ trợ các mô hình AI lớn hơn, đồng thời tăng hiệu quả suy luận cho các nền tảng như DeepSeek R1. Trong cấu hình giá đỡ NVL72 đầy đủ, Blackwell Ultra đạt 1,1 exaflop tính toán suy luận FP4 – một bước tiến lớn so với phiên bản B200 hiện tại.
![Nvidia cong bo loat GPU AI moi tai GTC 2025: Blackwell Ultra B300, Vera Rubin va Rubin Ultra 2 Nvidia công bố loạt GPU AI mới tại GTC 2025: Blackwell Ultra B300, Vera Rubin và Rubin Ultra 2]()
Không chỉ là GPU đơn lẻ, Blackwell Ultra B300 còn đi kèm các giải pháp như giá đỡ máy chủ B300 NVL16, trạm DGX GB300 và hệ thống giá đỡ GB300 NV72L. Khi kết hợp tám giá NV72L, Blackwell Ultra DGX SuperPOD ra đời với 288 CPU Grace, 576 GPU Blackwell Ultra, 300TB bộ nhớ HBM3e và sức mạnh tính toán FP4 lên tới 11,5 exaflop. Nvidia gọi đây là “nhà máy AI” – các siêu máy tính có thể liên kết để đáp ứng nhu cầu tính toán khổng lồ.
![Nvidia cong bo loat GPU AI moi tai GTC 2025: Blackwell Ultra B300, Vera Rubin va Rubin Ultra 3 Nvidia công bố loạt GPU AI mới tại GTC 2025: Blackwell Ultra B300, Vera Rubin và Rubin Ultra 3]()
Được giới thiệu lần đầu tại Computex 2024, Vera Rubin sẽ ra mắt vào nửa cuối năm 2026, mang đến cải tiến vượt bậc cho cả đào tạo và suy luận AI. GPU này tích hợp hai chip trên một đế, đạt hiệu suất suy luận FP4 50 petaflop mỗi chip, cùng hàng chục terabyte bộ nhớ. Đi kèm là CPU Vera do Nvidia tự thiết kế, với 88 lõi Arm tùy chỉnh và 176 luồng. Trong cấu hình giá đỡ NVL144, Vera Rubin cung cấp 3,6 exaflop tính toán suy luận FP4, hứa hẹn định hình lại khả năng xử lý AI.
![Nvidia cong bo loat GPU AI moi tai GTC 2025: Blackwell Ultra B300, Vera Rubin va Rubin Ultra 4 Nvidia công bố loạt GPU AI mới tại GTC 2025: Blackwell Ultra B300, Vera Rubin và Rubin Ultra 4]()
Nvidia cũng hé lộ kiến trúc GPU tiếp theo mang tên “Feynman”, dự kiến ra mắt năm 2028 cùng CPU Vera. Dù chưa có nhiều thông tin, Feynman được kỳ vọng sẽ tiếp tục đẩy mạnh khả năng tính toán AI, giữ vững đà phát triển của Nvidia.
Trong bài phát biểu, Jensen Huang mô tả các trung tâm dữ liệu tương lai là “nhà máy AI”, nơi sản xuất mã thông báo (token) cho các mô hình AI. Ông nhấn mạnh vai trò của “AI vật lý” trong việc cung cấp năng lượng cho robot hình người, sử dụng phần mềm Nvidia để đào tạo AI trong môi trường ảo trước khi áp dụng thực tế. Chiến lược này không chỉ khẳng định tham vọng công nghệ mà còn nhằm trấn an nhà đầu tư sau biến động thị trường gần đây, nhờ thành công của dòng chip Blackwell.