Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

Một nghiên cứu mới mang tên KellyBench từ startup General Reasoning (London) đã phơi bày một sự thật thú vị: Trí tuệ nhân tạo vẫn chưa thể khuất phục được sự "hỗn loạn" của thế giới thực. Trong bài kiểm tra giả lập toàn bộ mùa giải Ngoại hạng Anh 2023-24, các mô hình AI hàng đầu đã bộc lộ lỗ hổng lớn về khả năng suy luận dài hạn và quản lý rủi ro.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng phá sản vì dự đoán Ngoại hạng Anh

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Nghiên cứu đã đưa 8 mô hình AI vào một môi trường ngắt kết nối internet, cung cấp dữ liệu lịch sử chi tiết và yêu cầu chúng xây dựng chiến lược cá cược tối ưu lợi nhuận. Kết quả thật bất ngờ khi hầu hết các "bộ não" điện tử này đều kết thúc mùa giải trong tình trạng thua lỗ, thậm chí là phá sản.

Claude Opus 4.6 (Anthropic): Hoạt động ổn định nhất nhưng vẫn lỗ trung bình 11%.
Grok 4.20 (xAI): Gây thất vọng lớn khi phá sản ngay trong lần thử đầu tiên và không thể hoàn thành các bài thi sau đó.
Gemini 3.1 Pro (Google): Gương mặt hiếm hoi tạo ra điểm sáng với một lần thử đạt lợi nhuận 34%, dù ở lần thử khác cũng chịu thất bại tài chính.

Nhìn chung, hiệu suất của dàn siêu AI này vẫn thua xa so với những người chơi cá cược chuyên nghiệp – những người vốn dựa vào sự nhạy bén và kinh nghiệm thực tế.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng phá sản vì dự đoán Ngoại hạng Anh 2

Khoảng cách giữa phòng thí nghiệm và đời thực

Ross Taylor, CEO của General Reasoning và cựu chuyên gia tại Meta AI, nhận định rằng kết quả này phản ánh sự cường điệu quá mức về tự động hóa AI. Theo ông, các tiêu chuẩn đánh giá hiện nay quá tập trung vào "môi trường tĩnh" (như viết code, tóm tắt văn bản) mà bỏ qua tính thất thường, phụ thuộc hoàn cảnh của thực tế.

"Nếu bạn mang AI ứng dụng vào các nhiệm vụ thực tế có tầm nhìn dài hạn và biến số thay đổi liên tục, kết quả sẽ rất tệ," Taylor chia sẻ với Financial Times.

Bài học về khả năng suy luận thực tiễn

Thí nghiệm KellyBench chứng minh rằng khả năng tạo phần mềm hay giải quyết các vấn đề có cấu trúc không đồng nghĩa với việc AI có thể hiểu được các vòng phản hồi không chắc chắn của xã hội.

Dù các nhà phát triển đang nỗ lực thu hẹp khoảng cách giữa trí tuệ kỹ thuật số và khả năng suy luận thực tế, nhưng cho đến nay, những biến số như phong độ cầu thủ, chấn thương hay những khoảnh khắc xuất thần trên sân cỏ vẫn là một "bài toán khó" mà chưa thuật toán nào giải được trọn vẹn.

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

14/04/2026 17:04

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Khoảng cách giữa phòng thí nghiệm và đời thực

Bài học về khả năng suy luận thực tiễn

Valve phát triển bản vá lỗi VRAM cho Linux giúp tăng hiệu năng chơi game trên GPU 8GB

Apple thử nghiệm 4 thiết kế kính thông minh mới

Giá RAM DDR5 tăng mạnh đắt hơn cả GPU

Florida điều tra OpenAI giữa tin đồn IPO nghìn tỷ

Mac mini và Mac Studio cháy hàng do nhu cầu tăng cao

xAI kiện bang Colorado vì luật AI gây tranh cãi

CEO Amazon nhận thu nhập tăng mạnh giữa làn sóng sa thải 30.000 nhân viên

Hyperwork Ra Mắt Bàn Nâng Hạ Atlas Elite: Bộ Sản Phẩm All-In-One Cho Góc Setup Gaming Cao Cấp Đầu Tiên Tại Việt Nam

Realme C100 Chính Thức Ra Mắt: Siêu Pin Titan 8000mah Đột Phá Trong Phân Khúc Phổ Thông Với Khả Năng “Sạc Một Lần, Dùng 2 Ngày”

Review bộ đôi "vũ khí" từ ANTGAMER: Bàn phím nhôm AGK75 và chuột siêu nhẹ AGM535R

Yelena Belova Chính Thức Trở Thành Black Widow Mới Trong MCU

Thêm Ngay Trò Chơi Roguelike Hoàn Toàn Miễn Phí Này Trên Steam Trước Phiên Bản 1.0

Girls' Frontline 2: Lưu Đày mở đăng ký trước với sự kiện Săn Số Bí Mật

Minecraft Java Edition Bắt Đầu Nâng Cấp Mức Cấu Hình Tối Thiểu Và Đề Nghị

Cú "bẻ lái" hy hữu của làng Game: Koei Tecmo mở khảo sát hỏi người chơi có nên... tăng cân cho nữ chính Karia?

LMHT: Vé Đi Xem Chung Kết Thế Giới 2026 Trở Thành "Nạn Nhân" Của Giới Đầu Cơ

Nghiên cứu cho thấy ngay cả những mô hình AI tốt nhất cũng "phá sản" vì dự đoán Ngoại hạng Anh

14/04/2026 17:04

Dù làm mưa làm gió ở các bài kiểm tra lập trình hay giải toán, các hệ thống AI tiên tiến nhất thế giới từ Google, OpenAI hay xAI đều "ngã ngựa" khi đối đầu với sự biến hóa khôn lường của quả bóng tròn tại Premier League.

"Sát thủ" lập trình nhưng lại là "tay mơ" cá cược

Khoảng cách giữa phòng thí nghiệm và đời thực

Bài học về khả năng suy luận thực tiễn

Bài đọc nhiều nhất

Razer Ra Mắt Dòng Huntsman V3 HE Magnetic 8KHz

Tái ngộ cô bé Eri thời trung học: Anime ngắn "Học viện siêu anh hùng" tung hình ảnh xem trước, chốt lịch lên sóng đầu tháng 8

Nhà Làm Phim Guillermo del Toro Tiết Lộ Vẫn Chơi Angry Birds Mỗi Ngày

Bùng nổ thương hiệu Bandori: Phim điện ảnh "BanG Dream! Ave Mujica prima aurora" chốt lịch khởi chiếu tháng 10/2026 cùng chuỗi dự án âm nhạc đình đám

Bài mới trong ngày

Nintendo Bất Ngờ Hồi Sinh Hai Trò Chơi Từng Bị Hủy Bỏ Thông Qua Virtual Boy Nintendo Classic

Nhà Làm Phim Guillermo del Toro Tiết Lộ Vẫn Chơi Angry Birds Mỗi Ngày

Tái ngộ cô bé Eri thời trung học: Anime ngắn "Học viện siêu anh hùng" tung hình ảnh xem trước, chốt lịch lên sóng đầu tháng 8

Một Sai Sót Nhỏ Vô Tình Khiến Fan Skyrim Ngồi Tù Suốt 18 Tháng

Razer Ra Mắt Dòng Huntsman V3 HE Magnetic 8KHz