AI Đối Mặt Với Thử Thách Super Mario Bros

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo.

 Đánh giá khả năng của trí tuệ nhân tạo (AI) từ lâu đã là một vấn đề gây tranh cãi, khi các công ty thường bị chỉ trích vì chỉ khoe khoang những kết quả tích cực mà che giấu những hạn chế. Thay vì các bài kiểm tra logic hay toán học quen thuộc, một nhóm nghiên cứu tại Phòng thí nghiệm AI Hao thuộc Đại học California San Diego (UC San Diego) đã thử một cách tiếp cận độc đáo: dùng tựa game kinh điển Super Mario Bros. để thử thách các mô hình AI hàng đầu. Nếu một AI không thể vượt qua Goombas hay Koopa Troopas, liệu nó có đáng tin cậy trong thế giới phức tạp của chúng ta.

AI Đối Mặt Với Thử Thách Super Mario Bros

Trong thí nghiệm này, các nhà nghiên cứu sử dụng một phiên bản mô phỏng của Super Mario Bros., tích hợp với GamingAgent – một khuôn khổ do Hao Lab phát triển. GamingAgent cho phép AI điều khiển nhân vật Mario thông qua việc tạo mã Python, dựa trên các hướng dẫn đơn giản như “Nhảy qua kẻ thù” cùng hình ảnh chụp màn hình từ trò chơi. Dù trông như một tựa game 2D đơn giản, Super Mario Bros. đòi hỏi AI phải lập kế hoạch nhanh chóng và điều chỉnh chiến lược theo thời gian thực – một thách thức không hề nhỏ.

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo. Claude 3.5, phiên bản tiền nhiệm, cũng thể hiện không kém phần nổi bật. Trong khi đó, các mô hình nổi tiếng với khả năng lý luận như GPT-4o của OpenAI và Gemini 1.5 Pro của Google lại gặp khó khăn. Dù mạnh về tư duy logic, chúng không thể theo kịp nhịp độ nhanh của trò chơi.

AI Đối Mặt Với Thử Thách Super Mario Bros  2

Theo các nhà nghiên cứu, chìa khóa để thành công trong Super Mario Bros. không nằm ở lý luận mà là tốc độ. Một chút chậm trễ trong việc tính toán bước đi tiếp theo cũng có thể khiến Mario rơi xuống hố. Các mô hình quá “suy nghĩ” dường như mất quá nhiều thời gian để đưa ra quyết định, dẫn đến thất bại liên tiếp.

Dĩ nhiên, việc dùng một trò chơi điện tử cổ điển để đánh giá AI mang tính giải trí nhiều hơn là một thước đo nghiêm túc về hiệu quả thực tế. Khả năng chơi Super Mario Bros. không phản ánh trực tiếp giá trị của AI trong các ứng dụng thực tiễn. Tuy nhiên, cảnh tượng những mô hình tối tân “vật lộn” với một trò chơi tưởng chừng đơn giản vẫn khiến không ít người thích thú.

Cho những ai muốn tự mình khám phá, Hao AI Lab đã công khai mã nguồn của GamingAgent trên GitHub, mở ra cơ hội để cộng đồng thử nghiệm và trải nghiệm. Bạn nghĩ AI của mình có thể vượt qua Mario không? Hãy thử và tìm hiểu

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Honkai: Star Rail 3.7 – Khép lại chương Amphoreus cùng nhân vật 5 sao mới Cyrene

Honkai: Star Rail 3.7 – Khép lại chương Amphoreus cùng nhân vật 5 sao mới Cyrene

Khoa NguyenNguyễn Tiến Khoa

Hãng HoYoverse vừa chính thức công bố phiên bản 3.7 “Ngày Mai Trở Thành Hôm Qua” của Honkai: Star Rail, sẽ ra mắt ngày 5/11/2025, đánh dấu chương cuối cùng của hành trình Amphoreus. Đây là cột mốc quan trọng trong câu chuyện chính, khi Nhà Khai Phá cùng Đội Tàu Astral đối mặt với thử thách lớn nhất từ trước đến nay – và nhân vật 5 sao mới Cyrene sẽ lần đầu tiên gia nhập đội hình.

Game Online
Petit Planet – Game mô phỏng vũ trụ mới nhất của Hoyoverse mở đăng ký Closed Beta từ ngày 7/11

Petit Planet – Game mô phỏng vũ trụ mới nhất của Hoyoverse mở đăng ký Closed Beta từ ngày 7/11

Khoa NguyenNguyễn Tiến Khoa

HoYoverse – nhà phát triển đứng sau các bom tấn như Genshin Impact, Honkai: Star Rail và Zenless Zone Zero – vừa chính thức công bố dự án hoàn toàn mới mang tên Petit Planet, tựa game mô phỏng nhàn nhã đầu tiên của hãng. Đợt thử nghiệm Closed Beta, mang tên “The Coziness Test”, sẽ chính thức bắt đầu vào ngày 7/11 và dành cho người chơi trên PC và iOS.

Game Online
Lên đầu trang