AI Đối Mặt Với Thử Thách Super Mario Bros

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo.

 Đánh giá khả năng của trí tuệ nhân tạo (AI) từ lâu đã là một vấn đề gây tranh cãi, khi các công ty thường bị chỉ trích vì chỉ khoe khoang những kết quả tích cực mà che giấu những hạn chế. Thay vì các bài kiểm tra logic hay toán học quen thuộc, một nhóm nghiên cứu tại Phòng thí nghiệm AI Hao thuộc Đại học California San Diego (UC San Diego) đã thử một cách tiếp cận độc đáo: dùng tựa game kinh điển Super Mario Bros. để thử thách các mô hình AI hàng đầu. Nếu một AI không thể vượt qua Goombas hay Koopa Troopas, liệu nó có đáng tin cậy trong thế giới phức tạp của chúng ta.

AI Đối Mặt Với Thử Thách Super Mario Bros

Trong thí nghiệm này, các nhà nghiên cứu sử dụng một phiên bản mô phỏng của Super Mario Bros., tích hợp với GamingAgent – một khuôn khổ do Hao Lab phát triển. GamingAgent cho phép AI điều khiển nhân vật Mario thông qua việc tạo mã Python, dựa trên các hướng dẫn đơn giản như “Nhảy qua kẻ thù” cùng hình ảnh chụp màn hình từ trò chơi. Dù trông như một tựa game 2D đơn giản, Super Mario Bros. đòi hỏi AI phải lập kế hoạch nhanh chóng và điều chỉnh chiến lược theo thời gian thực – một thách thức không hề nhỏ.

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo. Claude 3.5, phiên bản tiền nhiệm, cũng thể hiện không kém phần nổi bật. Trong khi đó, các mô hình nổi tiếng với khả năng lý luận như GPT-4o của OpenAI và Gemini 1.5 Pro của Google lại gặp khó khăn. Dù mạnh về tư duy logic, chúng không thể theo kịp nhịp độ nhanh của trò chơi.

AI Đối Mặt Với Thử Thách Super Mario Bros  2

Theo các nhà nghiên cứu, chìa khóa để thành công trong Super Mario Bros. không nằm ở lý luận mà là tốc độ. Một chút chậm trễ trong việc tính toán bước đi tiếp theo cũng có thể khiến Mario rơi xuống hố. Các mô hình quá “suy nghĩ” dường như mất quá nhiều thời gian để đưa ra quyết định, dẫn đến thất bại liên tiếp.

Dĩ nhiên, việc dùng một trò chơi điện tử cổ điển để đánh giá AI mang tính giải trí nhiều hơn là một thước đo nghiêm túc về hiệu quả thực tế. Khả năng chơi Super Mario Bros. không phản ánh trực tiếp giá trị của AI trong các ứng dụng thực tiễn. Tuy nhiên, cảnh tượng những mô hình tối tân “vật lộn” với một trò chơi tưởng chừng đơn giản vẫn khiến không ít người thích thú.

Cho những ai muốn tự mình khám phá, Hao AI Lab đã công khai mã nguồn của GamingAgent trên GitHub, mở ra cơ hội để cộng đồng thử nghiệm và trải nghiệm. Bạn nghĩ AI của mình có thể vượt qua Mario không? Hãy thử và tìm hiểu

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Masashi Kishimoto xác nhận: “Boruto là tác phẩm của Ikemoto, không còn gì phải tranh cãi”

Masashi Kishimoto xác nhận: “Boruto là tác phẩm của Ikemoto, không còn gì phải tranh cãi”

hoanlagvnDũng Nhỏ TT

Từng bị cộng đồng fan tranh luận suốt nhiều năm về danh tính người đứng sau Boruto, hậu truyện nổi tiếng của Naruto nay đã chính thức được “định danh”. Trong cuộc phỏng vấn mới nhất, tác giả Masashi Kishimoto khẳng định: Mikio Ikemoto – trợ lý lâu năm của ông – mới là người toàn quyền sáng tạo nên Boruto, từ nội dung đến nét vẽ, còn bản thân Kishimoto chỉ đóng vai trò giám sát.

Giải trí
Nghề AV Ở Nhật: Sự Ngộ Nhận “Bình Thường Hóa” Của Thanh Niên Việt Và Thực Tế Khắc Nghiệt

Nghề AV Ở Nhật: Sự Ngộ Nhận “Bình Thường Hóa” Của Thanh Niên Việt Và Thực Tế Khắc Nghiệt

hoanlagvnDũng Nhỏ TT

Ngành công nghiệp phim người lớn (AV) tại Nhật Bản từ lâu đã là một chủ đề gây tranh cãi, đặc biệt với người nước ngoài, trong đó có không ít thanh niên Việt Nam. Nhiều người lầm tưởng rằng nghề AV ở Nhật được xã hội chấp nhận như một phần của “văn hóa đại chúng”, sánh ngang với manga, anime hay thần tượng idol.

Giải trí
Cựu biên tập viên Dragon Ball cảnh báo: Manga Nhật Bản đang đánh mất bản sắc, trở thành “Starbucks” và “McDonald’s”

Cựu biên tập viên Dragon Ball cảnh báo: Manga Nhật Bản đang đánh mất bản sắc, trở thành “Starbucks” và “McDonald’s”

hoanlagvnDũng Nhỏ TT

Trong một cuộc phỏng vấn mới đây tại Japan Expo 2025, Kazuhiko Torishima, cựu biên tập viên nổi tiếng của Dragon Ball, đã bày tỏ sự lo ngại về sự suy giảm bản sắc trong ngành manga Nhật Bản. Ông chỉ trích sự chuyển dịch sang nền tảng số và khẳng định rằng manga hiện nay đang trở nên giống nhau một cách đáng lo ngại, làm mất đi tính độc đáo và sáng tạo mà ngành từng nổi bật.

Giải trí
Lên đầu trang