DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github.

Được mệnh danh là "gã khổng lồ thầm lặng", công ty DeepSeek đang trở thành tâm điểm chú ý của Thung lũng Silicon với những đột phá gần đây trong lĩnh vực trí tuệ nhân tạo (AI). Với một chi phí phát triển thấp bất ngờ, DeepSeek đã phát triển các mô hình ngôn ngữ lớn (LLM) với hiệu suất vượt trội so với các đối thủ cạnh tranh.

Cuối tháng 12 năm 2024, DeepSeek công bố mô hình DeepSeek V3 miễn phí, chỉ sau hai tháng phát triển với chi phí chưa tới 6 triệu USD. Điểm đặc biệt, mô hình này sử dụng GPU H800 của Nvidia, một phiên bản có sức mạnh đã được hạ cấp theo lệnh cấm của Mỹ, thay vì sử dụng các chip AI hàng đầu trên thị trường. Trong các bài kiểm tra chuẩn của bên thứ ba, V3 đã vượt qua các mô hình nổi tiếng như Llama 3.1 của Meta, GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic, từ giải quyết các vấn đề phức tạp đến toán học và mã hóa.

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github. Mô hình này được đánh giá cao hơn cả o1 mới nhất của OpenAI trong nhiều bài kiểm tra, với chi phí chỉ 2,19 USD cho mỗi triệu token đầu ra, thấp hơn đáng kể so với 60 USD của OpenAI o1.

Giám đốc sản phẩm của DeepSeek, Shubham Saboo, phát biểu trên X vào cuối tháng 1, "DeepSeek R1 là mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự". Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, cũng nhận xét trên X, "Điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá chỉ 30 USD".

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới 2

Tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1, CEO Microsoft Satya Nadella nhận xét, "Mô hình DeepSeek mới thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt".

Các chuyên gia AI cũng ca ngợi cách DeepSeek sử dụng quy trình gọi là 'chưng cất' để phát triển LLM, giúp tạo ra mô hình nhỏ thông minh từ mô hình lớn mà không tốn nhiều chi phí. Chetan Puttagunta của Benchmark nói với CNBC, "Họ đã tạo ra một LLM thực sự tốt và tiết kiệm chi phí".

Những đột phá của DeepSeek không chỉ làm dấy lên câu hỏi về việc liệu Mỹ có đang mất dần vị thế dẫn đầu toàn cầu về AI không, mà còn về hiệu quả chi tiêu của các công ty công nghệ lớn cho mô hình AI và trung tâm dữ liệu. DeepSeek, được thành lập vào tháng 5/2023 bởi Liang Wenfeng và có trụ sở ở Hàng Châu, Chiết Giang, được đầu tư toàn phần bởi quỹ đầu tư High-Flyer của Trung Quốc và không có kế hoạch huy động vốn. Họ tự chủ tài chính và sớm có lãi nhờ sự đổi mới trong kiến trúc mô hình AI.

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới 3

Tại Thung lũng Silicon, DeepSeek được coi là "thế lực bí ẩn từ phương Đông", thể hiện rõ ràng thông qua sự tiết kiệm và hiệu quả của các mô hình của họ. Khi các công ty khác trong lĩnh vực AI của Trung Quốc cũng đang tiến hành các bước phát triển tương tự, cuộc đua trong việc phát triển AI hiệu quả và tiết kiệm đang ngày càng trở nên quyết liệt

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới

27/01/2025 11:26

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github.

Smartphone cài sẵn TikTok tại Mỹ được rao bán với giá hơn 1 triệu USD

Nhiều Thông Tin Rò Rỉ Hé Lộ Rằng Marvel Rivals Sẽ Chào Đón Thêm Nhiều X-Men Nữa

Người dùng YouTube phàn nàn về quảng cáo không thể bỏ qua kéo dài giờ tới 2 tiếng đồng hồ

Review CORSAIR iCUE Link LX120-R RGB: Giải pháp làm mát hoàn hảo cho mọi hệ thống PC

MrBeast cùng các tỷ phú đua nhau mua lại TikTok

Donald Trump: "Elon Musk có thể mua TikTok, nếu muốn"

Samsung cuối cùng đã giải được câu đố AI với Galaxy S25

Netflix tăng giá nhiều gói dịch vụ ở một vài quốc gia

Microsoft "ép" người dùng cập nhật Windows 11 24H2

Sony và AMD Đang Trong Giai Đoạn Phát Triển PlayStation 6

Cơn bão truyền thông: Trang tin Kotaku hứng "gạch đá" vì kêu gọi tẩy chay siêu phẩm anime "Mushoku Tensei"

Assassin's Creed Hexe Rò Rỉ Thêm Hình Ảnh Nữ Chính Anika Cùng Một Nhân Vật Khác

Kevin Feige Xác Nhận Có Kế Hoạch Đưa Miles Morales Vào MCU Sau Khi Spider-Verse Khép Lại

Modder Trung Quốc chế card đồ họa GeForce RTX 4060 Windows 11 trên máy trạm Huawei Arm

Pháp muốn cấm trẻ dưới 15 tuổi dùng mạng xã hội từ tháng 9

Chạm vào ký ức: "Ngất ngây" trước không gian lãng mạn của Frieren và Dũng sĩ Himmel tại khu nghỉ dưỡng THE FARM (Chiba)

DeepSeek Gây Sóng Gió Trong Lĩnh Vực Trí Tuệ Nhân Tạo với Các Mô Hình Mới

27/01/2025 11:26

Không chỉ có V3, ngày 20/1 DeepSeek tiếp tục công bố mô hình "có khả năng lý luận" mang tên DeepSeek R1, được đăng tải mã nguồn trên Github.

Bài đọc nhiều nhất

Steam Deck mất sức hút vì giá tăng quá cao?

Assassin's Creed Hexe Rò Rỉ Thêm Hình Ảnh Nữ Chính Anika Cùng Một Nhân Vật Khác

Cơn bão truyền thông: Trang tin Kotaku hứng "gạch đá" vì kêu gọi tẩy chay siêu phẩm anime "Mushoku Tensei"

Johnny Depp Tái Xuất Hollywood Với Phim Kinh Dị Giáng Sinh Ebenezer

Bài mới trong ngày

Cơn bão chi phí đè nặng "ông lớn" Anime: Công ty mẹ của Production I.G và Wit Studio lỗ hổng tài chính do trễ tiến độ

Toy Story 5 Trao Hơn 18.000 Món Đồ Chơi Cho Trẻ Em Đang Điều Trị Tại Bệnh Viện

Được Đánh Giá Cao Nhưng AC Black Flag Resynced Bất Ngờ Loại Bỏ Tính Năng Được Yêu Thích

Steam Deck mất sức hút vì giá tăng quá cao?

Sol One - Khi Satisfactory Kết Hợp Cùng The Planet Crafter