Google mở rộng quyền truy cập Project Genie, công cụ AI biến hình ảnh và văn bản thành thế giới có thể khám phá theo thời gian thực, hiện dành cho gói AI Ultra.
Google mở rộng Project Genie, AI tạo thế giới có thể khám phá
Google vừa mở rộng quyền truy cập Project Genie, một công cụ AI thử nghiệm có khả năng biến mô tả văn bản và hình ảnh thành các môi trường video tương tác. Thay vì tạo video thụ động, Project Genie cho phép người dùng di chuyển và khám phá thế giới do AI dựng nên theo thời gian gần thực, trực tiếp trên trình duyệt web.
![Google mo rong quyen truy cap Project Genie, AI bien anh va chu thanh the gioi co the kham pha Google mở rộng quyền truy cập Project Genie, AI biến ảnh và chữ thành thế giới có thể khám phá]()
Google mở rộng quyền truy cập Project Genie
Công nghệ world model thay thế engine game truyền thống
Project Genie phát triển từ mô hình Genie của Google DeepMind, thuộc nhóm world model. Hệ thống không dựng hình học 3D liên tục như engine game, mà tạo luồng khung hình video mới liên tục, phản hồi theo thao tác điều khiển. Cách tiếp cận này tạo cảm giác khám phá thế giới sống động dù thực chất là video AI được tái sinh từng khung hình.
Tạo thế giới từ ảnh và chữ với Gemini 3
Quy trình sử dụng bắt đầu bằng việc tạo ảnh tham chiếu thông qua mô hình Nano Banana Pro hoặc tải ảnh có sẵn. Ảnh này được đưa vào Genie để tạo môi trường 720p khoảng 60 giây, điều khiển bằng phím di chuyển quen thuộc. Việc tích hợp Gemini 3 giúp cải thiện tính nhất quán không gian và ánh sáng, dù bộ nhớ hình ảnh vẫn chỉ duy trì trong thời gian ngắn.
![Google mo rong quyen truy cap Project Genie, AI bien anh va chu thanh the gioi co the kham pha 2 Google mở rộng quyền truy cập Project Genie, AI biến ảnh và chữ thành thế giới có thể khám phá 2]()