DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github.

Được mệnh danh là "gã khổng lồ thầm lặng", công ty DeepSeek đang trở thành tâm điểm chú ý của Thung lũng Silicon với những đột phá gần đây trong lĩnh vực trí tuệ nhân tạo (AI). Với một chi phí phát triển thấp bất ngờ, DeepSeek đã phát triển các mô hình ngôn ngữ lớn (LLM) với hiệu suất vượt trội so với các đối thủ cạnh tranh.

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới

Cuối tháng 12 năm 2024, DeepSeek công bố mô hình DeepSeek V3 miễn phí, chỉ sau hai tháng phát triển với chi phí chưa tới 6 triệu USD. Điểm đặc biệt, mô hình này sử dụng GPU H800 của Nvidia, một phiên bản có sức mạnh đã được hạ cấp theo lệnh cấm của Mỹ, thay vì sử dụng các chip AI hàng đầu trên thị trường. Trong các bài kiểm tra chuẩn của bên thứ ba, V3 đã vượt qua các mô hình nổi tiếng như Llama 3.1 của Meta, GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic, từ giải quyết các vấn đề phức tạp đến toán học và mã hóa.

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github. Mô hình này được đánh giá cao hơn cả o1 mới nhất của OpenAI trong nhiều bài kiểm tra, với chi phí chỉ 2,19 USD cho mỗi triệu token đầu ra, thấp hơn đáng kể so với 60 USD của OpenAI o1.

Giám đốc sản phẩm của DeepSeek, Shubham Saboo, phát biểu trên X vào cuối tháng 1, "DeepSeek R1 là mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự". Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, cũng nhận xét trên X, "Điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá chỉ 30 USD".

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới 2

Tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1, CEO Microsoft Satya Nadella nhận xét, "Mô hình DeepSeek mới thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt".

Các chuyên gia AI cũng ca ngợi cách DeepSeek sử dụng quy trình gọi là 'chưng cất' để phát triển LLM, giúp tạo ra mô hình nhỏ thông minh từ mô hình lớn mà không tốn nhiều chi phí. Chetan Puttagunta của Benchmark nói với CNBC, "Họ đã tạo ra một LLM thực sự tốt và tiết kiệm chi phí".

Những đột phá của DeepSeek không chỉ làm dấy lên câu hỏi về việc liệu Mỹ có đang mất dần vị thế dẫn đầu toàn cầu về AI không, mà còn về hiệu quả chi tiêu của các công ty công nghệ lớn cho mô hình AI và trung tâm dữ liệu. DeepSeek, được thành lập vào tháng 5/2023 bởi Liang Wenfeng và có trụ sở ở Hàng Châu, Chiết Giang, được đầu tư toàn phần bởi quỹ đầu tư High-Flyer của Trung Quốc và không có kế hoạch huy động vốn. Họ tự chủ tài chính và sớm có lãi nhờ sự đổi mới trong kiến trúc mô hình AI.

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới 3

Tại Thung lũng Silicon, DeepSeek được coi là "thế lực bí ẩn từ phương Đông", thể hiện rõ ràng thông qua sự tiết kiệm và hiệu quả của các mô hình của họ. Khi các công ty khác trong lĩnh vực AI của Trung Quốc cũng đang tiến hành các bước phát triển tương tự, cuộc đua trong việc phát triển AI hiệu quả và tiết kiệm đang ngày càng trở nên quyết liệt

Bài đọc nhiều nhất

Bài mới trong ngày

Masashi Kishimoto xác nhận: “Boruto là tác phẩm của Ikemoto, không còn gì phải tranh cãi”

Masashi Kishimoto xác nhận: “Boruto là tác phẩm của Ikemoto, không còn gì phải tranh cãi”

hoanlagvnDũng Nhỏ TT

Từng bị cộng đồng fan tranh luận suốt nhiều năm về danh tính người đứng sau Boruto, hậu truyện nổi tiếng của Naruto nay đã chính thức được “định danh”. Trong cuộc phỏng vấn mới nhất, tác giả Masashi Kishimoto khẳng định: Mikio Ikemoto – trợ lý lâu năm của ông – mới là người toàn quyền sáng tạo nên Boruto, từ nội dung đến nét vẽ, còn bản thân Kishimoto chỉ đóng vai trò giám sát.

Giải trí
Nghề AV Ở Nhật: Sự Ngộ Nhận “Bình Thường Hóa” Của Thanh Niên Việt Và Thực Tế Khắc Nghiệt

Nghề AV Ở Nhật: Sự Ngộ Nhận “Bình Thường Hóa” Của Thanh Niên Việt Và Thực Tế Khắc Nghiệt

hoanlagvnDũng Nhỏ TT

Ngành công nghiệp phim người lớn (AV) tại Nhật Bản từ lâu đã là một chủ đề gây tranh cãi, đặc biệt với người nước ngoài, trong đó có không ít thanh niên Việt Nam. Nhiều người lầm tưởng rằng nghề AV ở Nhật được xã hội chấp nhận như một phần của “văn hóa đại chúng”, sánh ngang với manga, anime hay thần tượng idol.

Giải trí
Cựu biên tập viên Dragon Ball cảnh báo: Manga Nhật Bản đang đánh mất bản sắc, trở thành “Starbucks” và “McDonald’s”

Cựu biên tập viên Dragon Ball cảnh báo: Manga Nhật Bản đang đánh mất bản sắc, trở thành “Starbucks” và “McDonald’s”

hoanlagvnDũng Nhỏ TT

Trong một cuộc phỏng vấn mới đây tại Japan Expo 2025, Kazuhiko Torishima, cựu biên tập viên nổi tiếng của Dragon Ball, đã bày tỏ sự lo ngại về sự suy giảm bản sắc trong ngành manga Nhật Bản. Ông chỉ trích sự chuyển dịch sang nền tảng số và khẳng định rằng manga hiện nay đang trở nên giống nhau một cách đáng lo ngại, làm mất đi tính độc đáo và sáng tạo mà ngành từng nổi bật.

Giải trí
Lên đầu trang