Nghiên cứu của Google có thể cho phép AI tác động đến việc xây dựng thế giới ảo, sử dụng AI để đào tạo AI.
Google DeepMind mới đây đã ra mắt Genie, một trí tuệ nhân tạo (AI) có thể tạo ra các trò chơi tương tác nhỏ từ hình ảnh tĩnh. Google cho biết nền tảng của công nghệ này có thể hỗ trợ nhiều ứng dụng khác, chẳng hạn như đào tạo robot hỗ trợ AI.
Theo DeepMind, Genie được đào tạo trên 200.000 giờ cảnh quay game có sẵn. Điểm đáng chú ý là AI này không cần bất kỳ văn bản để phân tích. Genie hoạt động hoàn toàn dựa trên khung hình video, phân biệt yếu tố nào là nền tảng, yếu tố nào là nhân vật có thể điều khiển. Thậm chí, Genie còn có thể phân tích chiều sâu ba chiều trong hình ảnh để mô phỏng hiệu ứng cuộn parallax trong trò chơi được tạo ra.
Công cụ này có thể xây dựng các màn chơi nhỏ trong game từ tranh vẽ, phác thảo, hình ảnh render, ảnh chụp và các loại ảnh khác. Bởi vì Genie có thể làm việc với những hình ảnh chưa từng thấy trước đây, nên nó cũng có thể xây dựng môi trường từ nội dung do AI tạo ra, mở ra khả năng sử dụng nội dung từ một AI để tạo ra thứ gì đó trong một AI khác.
Tuy nhiên, Genie vẫn có một số hạn chế và gặp phải "ảo giác" như các mô hình AI khác. Ngoài ra, phiên bản đầu tiên này chỉ có thể hỗ trợ tối đa 16 khung hình, điều này hạn chế đáng kể kích thước của các cấp độ mà nó có thể xây dựng. Tốc độ hoạt động 1 khung hình/giây của mô hình cũng cần được cải thiện nhiều. Để đảm bảo độ chính xác, bản demo ban đầu của Genie tập trung vào việc sao chép các trò chơi nền tảng 2D. Tuy nhiên, Google cho rằng nó có thể được đào tạo để tạo ra các loại trò chơi và nội dung ảo khác.
Ví dụ, Google cho biết Genie có thể giúp đào tạo robot hiệu quả hơn. Việc đào tạo bằng mô phỏng do con người tạo ra chỉ cung cấp một loạt các tình huống hạn chế, nhưng Genie có thể xây dựng nhiều môi trường ảo và vật thể rộng hơn để robot học hỏi.
Trong tương lai, Genie có thể biến các bối cảnh tương tác thành lĩnh vực chính tiếp theo của AI tạo sinh. Video hiện đang trở thành trọng tâm, đặc biệt là kể từ khi OpenAI ra mắt Sora vào tháng trước, có khả năng tạo các clip 1080p 60 giây chân thực. Không ngạc nhiên, các cảnh quay do AI tạo ra không hoàn hảo, nhưng nó đại diện cho một bước tiến nhảy vọt đáng kể cho công nghệ này.