DeepSeek ra mắt mô hình AI mới, hỗ trợ chip nội địa Trung Quốc ngay từ ngày đầu

Gấu Hồng

DeepSeek ra mắt mô hình AI mới DeepSeek-V3.2-Exp, tối ưu ngay từ đầu cho chip Huawei, Cambricon và Hygon, đánh dấu bước tiến lớn trong tham vọng tự chủ AI của Trung Quốc thay thế sự phụ thuộc vào Nvidia CUDA.

Sự kiện đánh dấu bước ngoặt trong cuộc đua AI khi DeepSeek công bố mô hình ngôn ngữ lớn DeepSeek-V3.2-Exp, tối ưu hóa cho chip từ Huawei, Cambricon và Hygon để thay thế vai trò vốn do Nvidia CUDA nắm giữ.

Hỗ trợ chip nội địa và CANN ngay khi ra mắt

Ngày 29/9, DeepSeek chính thức giới thiệu mô hình AI DeepSeek-V3.2-Exp trên Hugging Face cùng báo cáo kỹ thuật chi tiết. Điểm đặc biệt, mô hình này được tối ưu hóa ngay từ đầu cho phần cứng Ascend của Huawei và nền tảng CANN, thay vì phụ thuộc hoàn toàn vào CUDA của Nvidia như trước.

DeepSeek mô tả đây là bước chuyển tiếp quan trọng trong lộ trình phát triển kiến trúc AI thế hệ mới, tập trung vào giảm chi phí xử lý ngữ cảnh dài nhờ cơ chế sparse attention, vừa tiết kiệm bộ nhớ vừa duy trì chất lượng đầu ra.

Phiên bản mới nhất của Deepseek tối ưu hóa ngay khi vừa ra mắt cho dòng chip Ascend của Huawei

Các hãng chip Trung Quốc đồng loạt hưởng ứng

Ngay sau công bố, đội ngũ Huawei Ascend cùng cộng đồng vLLM-Ascend đã tích hợp V3.2-Exp vào hệ thống, đồng thời chia sẻ hướng dẫn cài đặt và triển khai cho NPU Ascend. Cambricon cũng phát hành bản cập nhật tương thích, khẳng định sự kết hợp giữa engine suy luận của hãng với cơ chế sparse attention giúp giảm chi phí xử lý chuỗi dài.

Trong khi đó, Hygon công bố bộ tăng tốc DCU của họ đã sẵn sàng cho “triển khai tức thì” nhờ bộ công cụ DTK.

Mở rộng hệ sinh thái AI độc lập với Nvidia

Ngoài Huawei, Cambricon và Hygon, DeepSeek còn xác nhận khả năng chạy mô hình trên nhiều backend thông qua SGLang, đồng thời duy trì khả năng triển khai trên GPU Nvidia nhờ hỗ trợ TileLang và CUDA kernels. Điều này cho phép các nhà nghiên cứu linh hoạt triển khai trên cả nền tảng nội địa lẫn quốc tế với thay đổi tối thiểu.

Deepseek đang cố gắng phát triển để không còn phụ thuộc vào Nvidia

Tín hiệu cho tham vọng tự chủ AI của Trung Quốc

Sự kiện DeepSeek-V3.2-Exp nhận được tốc độ hỗ trợ nhanh chóng từ nhiều hãng chip cho thấy hệ sinh thái AI Trung Quốc đang chuẩn bị sẵn cho một tương lai không còn phụ thuộc hoàn toàn vào Nvidia.

Nếu CUDA vẫn là chuẩn mực trong huấn luyện và suy luận AI toàn cầu, thì việc DeepSeek và các hãng chip nội địa tối ưu mô hình ngay từ ngày đầu đã cho thấy quyết tâm biến các nền tảng trong nước thành lựa chọn ưu tiên hàng đầu, thay vì chỉ “chạy theo” sau này.

 

 

Xem thêm: Disney "tuyên chiến" với Character.ai vì sử dụng trái phép nhân vật bản quyền

Xem thêm: Ngỡ ngàng trước bộ sưu tập GPU "vô giá" từ NVIDIA và AMD kéo dài ba thập kỷ

Bài cùng chuyên mục