AI Đối Mặt Với Thử Thách Super Mario Bros

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo.

Đánh giá khả năng của trí tuệ nhân tạo (AI) từ lâu đã là một vấn đề gây tranh cãi, khi các công ty thường bị chỉ trích vì chỉ khoe khoang những kết quả tích cực mà che giấu những hạn chế. Thay vì các bài kiểm tra logic hay toán học quen thuộc, một nhóm nghiên cứu tại Phòng thí nghiệm AI Hao thuộc Đại học California San Diego (UC San Diego) đã thử một cách tiếp cận độc đáo: dùng tựa game kinh điển Super Mario Bros. để thử thách các mô hình AI hàng đầu. Nếu một AI không thể vượt qua Goombas hay Koopa Troopas, liệu nó có đáng tin cậy trong thế giới phức tạp của chúng ta.

Trong thí nghiệm này, các nhà nghiên cứu sử dụng một phiên bản mô phỏng của Super Mario Bros., tích hợp với GamingAgent – một khuôn khổ do Hao Lab phát triển. GamingAgent cho phép AI điều khiển nhân vật Mario thông qua việc tạo mã Python, dựa trên các hướng dẫn đơn giản như “Nhảy qua kẻ thù” cùng hình ảnh chụp màn hình từ trò chơi. Dù trông như một tựa game 2D đơn giản, Super Mario Bros. đòi hỏi AI phải lập kế hoạch nhanh chóng và điều chỉnh chiến lược theo thời gian thực – một thách thức không hề nhỏ.

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo. Claude 3.5, phiên bản tiền nhiệm, cũng thể hiện không kém phần nổi bật. Trong khi đó, các mô hình nổi tiếng với khả năng lý luận như GPT-4o của OpenAI và Gemini 1.5 Pro của Google lại gặp khó khăn. Dù mạnh về tư duy logic, chúng không thể theo kịp nhịp độ nhanh của trò chơi.

AI Đối Mặt Với Thử Thách Super Mario Bros 2

Theo các nhà nghiên cứu, chìa khóa để thành công trong Super Mario Bros. không nằm ở lý luận mà là tốc độ. Một chút chậm trễ trong việc tính toán bước đi tiếp theo cũng có thể khiến Mario rơi xuống hố. Các mô hình quá “suy nghĩ” dường như mất quá nhiều thời gian để đưa ra quyết định, dẫn đến thất bại liên tiếp.

Dĩ nhiên, việc dùng một trò chơi điện tử cổ điển để đánh giá AI mang tính giải trí nhiều hơn là một thước đo nghiêm túc về hiệu quả thực tế. Khả năng chơi Super Mario Bros. không phản ánh trực tiếp giá trị của AI trong các ứng dụng thực tiễn. Tuy nhiên, cảnh tượng những mô hình tối tân “vật lộn” với một trò chơi tưởng chừng đơn giản vẫn khiến không ít người thích thú.

Cho những ai muốn tự mình khám phá, Hao AI Lab đã công khai mã nguồn của GamingAgent trên GitHub, mở ra cơ hội để cộng đồng thử nghiệm và trải nghiệm. Bạn nghĩ AI của mình có thể vượt qua Mario không? Hãy thử và tìm hiểu

AI Đối Mặt Với Thử Thách Super Mario Bros

23/03/2025 10:00

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo.

Apple bị kiện vì quảng cáo “thổi phồng” Apple Intelligence trên iPhone 16

Sony công bố The Last of Us Part II Remastered cho PC: Ra mắt tháng 4, yêu cầu 150GB dung lượng

Thị trường game PC bùng nổ với 907 triệu người chơi, 92% mê game cũ

Nhà Phát Hành Của Marvel Rivals Không Muốn Cân Bằng Game Cho Người Thích Tryhard

Microsoft chấm dứt hỗ trợ Windows 10 vào tháng 10/2025

Xiaomi công bố khắc phục lỗi sạc chậm và pin không đầy trên Redmi chạy HyperOS 2

Nvidia bán RTX 5080 và RTX 5090 từ xe lưu động tại GTC 2025, giá từ 23 triệu đồng

Nvidia công bố loạt GPU AI mới tại GTC 2025: Blackwell Ultra B300, Vera Rubin và Rubin Ultra

Bàn phím độc nhất với 1.020 phím, nhưng không ai muốn dùng

Counter-Strike 2 phá kỷ lục với 1,8 triệu người chơi cùng lúc trên Steam

Multi Mind Mayhem được chuyển thể thành anime, Yusuke Kobayashi lồng tiếng nhân vật chính

ByteDance lách luật cấm vận, chi 2,5 tỷ USD thuê "siêu máy chủ" 36.000 GPU Blackwell tại Malaysia

Nhà Làm Phim Steven Spielberg Tin Rằng Chúng Ta Không Hề Cô Đơn Trên Trái Đất

Where Winds Meet: Hướng Dẫn Nhiệm Vụ Encounter Mysterious IOU Ở Vùng Hà Tây

Valve cho rằng việc mở hòm tương tự như sưu tầm thẻ bài Pokemon, hơn là cờ bạc

Đồng Sáng Tạo Game Overwatch Quay Trở Lại Thị Trường Với Dự Án Game Mới

AI Đối Mặt Với Thử Thách Super Mario Bros

23/03/2025 10:00

Kết quả cho thấy Claude 3.7 của Anthropic là “người chơi” xuất sắc nhất, với phản xạ ấn tượng, thực hiện những cú nhảy chính xác và né tránh kẻ thù khéo léo.

Bài liên quan

Robot Có Khả Năng Nhìn và Phản Hồi Thời Gian Thực: Bước Tiến Mới trong Công Nghệ Thị Giác

Công nghệ AI mới giúp dự đoán tuổi thọ pin chỉ sau 50 chu kỳ thử nghiệm

AI tóm tắt kết quả tìm kiếm sức khỏe của Google đang “học” từ YouTube nhiều hơn cả cơ quan y tế

Nghiên Cứu Cisco: Thế Hệ và Vị Trí Địa Lý Ảnh Hưởng Đến Cách Nhận Thức Về AI

Bài đọc nhiều nhất

Ngành lồng tiếng Nhật Bản 2026: Khi các "quý ông" rượt đuổi ngoạn mục, đe dọa vị thế của phái đẹp

Phim Sinners Thắng 4 Giải Oscar Sau Kỷ Lục 16 Đề Cử Tại Oscars 2026

Diễn Viên Robert Downey Jr. Và Chris Evans Tái Hợp Tại Oscars 2026 Kỷ Niệm 14 Năm Avengers

Mua bộ linh kiện PC nghìn USD với giá 'hai triệu đồng' do lỗi hệ thống

Bài mới trong ngày

Bảng xếp hạng anime tuần thứ 10 năm 2026: Fire Force Season 3 Part 2 đứng đầu

One Battle After Another Thắng Phim Hay Nhất Oscar Giúp Paul Thomas Anderson Thoát “Cơn Khát” Tượng Vàng

Phim Sinners Thắng 4 Giải Oscar Sau Kỷ Lục 16 Đề Cử Tại Oscars 2026

Diễn Viên Robert Downey Jr. Và Chris Evans Tái Hợp Tại Oscars 2026 Kỷ Niệm 14 Năm Avengers

Mua bộ linh kiện PC nghìn USD với giá 'hai triệu đồng' do lỗi hệ thống