Nvidia mới đây đã công bố GPU tiếp theo dựa trên kiến trúc Volta GV100 tiến trình FinFET 12nm mới nhất của họ với tên mã Tesla V100. Đây là con quái vật thực sự và chỉ dành cho các siêu máy tính với 21 tỷ transitor, 5120 nhân CUDA, 16 GB HBM2 băng thông lên tới 900 GB/s.
CEO của Nvidia Jensen Huang cho biết Tesla V100 sẽ hướng tới các tác vụ đồ họa cao cấp, các siêu máy tính và đăc biệt là trí thông minh nhân tạo AI - Artificial Intelligence.
Chi tiết kiến trúc đồ họa Volta GV100:
- 6 GPC (Graphic Processing Clusters)
- 84 Volta streaming multiprocessors (42 TPC x2 Streaming Multiprocessors)
- 64 Nhân CUDA mỗi Streaming Multiprocessors x 84 = 5376 nhân CUDA
- Giao diện bộ nhớ 512-bit x8 = 4096-bit
- 16 GB HBM2 VRAM
- Băng thông 900 GB/s (Thế hệ GPU kiến trúc Pascal là 720 GB/s
- Kích thước Chip 815 mm2 (Pascal GP100 là 610 mm2)
Các công nghệ mới trong kiến trúc đồ họa Volta:
- Kiến trúc Streaming Multiprocessor mới tối ưu hóa cho Deep Learning (dành cho AI có khả năng tự học hỏi)
- NVLink thế hệ thứ 2 cải thiện tốc độ truyền dữ liệu giữa các GPU lên đáng kể (Dành cho các card đồ họa đa GPU hoặc các card đồ họa đơn GPU)
- Bộ nhớ VRAM HBM2 thế hệ mới nhanh hơn, hiệu quả hơn, băng thông cao hơn
- Volta Multi-Process Service tăng tốc chia sẻ dữ liệu giữa các GPU (phần mềm)
- Enhanced Unified Memory và Address Translation Services tăng tính chính xác dữ liệu từ bộ nhớ sang các nhân xử lý với nhau
- Cooperative Groups và Cooperative Launch API mới - chương trình phân nhóm luồng dữ liệu giúp các nhà phát triển đồng bộ hóa luồng dữ liệu dễ dàng hơn.
- 2 chế độ tăng tối đa hiệu năng và tối đa điện năng tiêu thụ - 300W ở chế độ tối đa hiệu năng, tối ưu hiệu năng trên từng W tiêu thụ.
Chi tiết thông số kiến trúc Volta so với Pascal, Vega và có thể là Navi