Công cụ AI mới "Make-A-Video" của Meta cho phép bạn tạo video bằng cách nhập văn bản
Việc mô tả trí tưởng tượng bằng video sẽ trở nên nhanh hơn nhiều với AI, nhưng đi kèm theo đó là một loạt mối nguy hại.
Trong thời gian gần đây, các trình AI tạo ra hình ảnh đang khá phổ biến cho thấy khả năng vượt xa bất cứ điều gì chúng ta có thể mong đợi vài năm trước. Giờ đây, các thuật toán đã đưa mọi thứ lên cấp độ tiếp theo khi bắt tay vào việc sản xuất video - và một AI mới dường như có khả năng làm được điều đó.
Xem thêm: Công nghệ AI vẽ những tác phẩm mô tả Pikachu ở Tokyo những năm 1920, vừa thực tế, vừa đáng sợ
Hãy tưởng tượng “một chú chó mặc trang phục Siêu anh hùng với chiếc áo choàng màu đỏ bay qua bầu trời”. Đó là tất cả những gì bạn nhập văn bản để tạo ra hình ảnh trên được chụp lại từ video. AI có tên gọi khô khan là Make-A-Video của Meta có thể tạo ra các video ngắn chỉ từ văn bản và trong khi hiệu ứng vẫn còn khá thô.
Make-A-Video chưa có sẵn cho công chúng (Meta cho biết họ sẽ ra mắt chính thức vào tháng 11), nhưng nó có vẻ hoạt động giống như các AI tạo hình ảnh. Để có được video mà bạn mong muốn, điều bạn cần làm chỉ là mô tả bằng văn bản sau đó chờ video được xuất.
Công nghệ đằng sau Make-A-Video được xây dựng dựa trên công việc hiện có được sử dụng trong tổng hợp văn bản thành hình ảnh. Trên thực tế, chỉ vài tháng trước, Meta đã công bố mô hình AI chuyển văn bản thành hình ảnh của riêng mình có tên Make-A-Scene .
Tuy nhiên, việc sản xuất video sẽ khó hơn nhiều so với hình ảnh. Từ góc độ công cụ AI, một video chỉ là một chuỗi hàng trăm hoặc hàng nghìn hình ảnh, có nghĩa là, đối với người mới bắt đầu, bạn cần đào tạo công cụ của mình với nhiều dữ liệu hơn. Các bộ video quy mô lớn có thể được sử dụng để đào tạo cũng khan hiếm hơn nhiều so với hình ảnh. Điều này có nghĩa là trong tương lai gần, ít nhất AI video có thể sẽ bị hạn chế đối với các công ty lớn.
Chỉ trong tháng trước, một startup AI Stability.AI đã tung ra Stable Diffusion, một hệ thống chuyển văn bản thành hình ảnh bằng mã nguồn mở, đã tạo nên xu hướng khi mà kênh Discord của công ty có hơn 2 triệu người dùng và DALL -E , AI tạo hình ảnh “thời đại mới” đầu tiên được công khai.
Nhưng trong khi các thuật toán này đang trong quá trình cải thiện, nhiều lo ngại được đặt ra khi mà nhiều người lạm dụng công nghệ AI này để tạo ra nhiều thông tin sai lệch hoặc các mục đích xấu khác.
Meta cũng thừa nhận mối nguy hiểm của việc tạo video chân thực theo yêu cầu người dùng. Công ty nói rằng họ muốn chống lại điều này bằng cách thêm hình mờ "giúp đảm bảo người xem biết video được tạo ra bằng AI và không phải là video đã quay".
“Chúng tôi muốn đặt vấn đề về cách chúng tôi xây dựng các hệ thống AI mới như thế này. Make-A-Video sử dụng bộ dữ liệu có sẵn công khai, giúp tăng thêm mức độ minh bạch cho nghiên cứu. Chúng tôi đang công khai chia sẻ kết quả và nghiên cứu AI mang tính phổ biến này với cộng đồng và cho phép người dùng phản hồi và sẽ tiếp tục sử dụng công nghệ AI bằng cả trách nhiệm, từ đó chúng tôi có thể tinh chỉnh và phát triển cách tiếp cận của chúng tôi đối với công nghệ mới nổi này.” Meta cho biết.
Bài cùng chuyên mục