Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Quên ChatGPT đi - Runway Gen 2 có thể chuyển văn bản thành video vô cùng chân thực chỉ trong vài giây.

Với tính năng dịch văn bản sang hình ảnh, các mô hình AI gần đây như Dall-E hoặc Stable Diffusion đã chứng minh được giá trị của nó. Nhưng cải tiến mới đây cho phép AI chuyển văn bản thành video dự kiến sẽ "làm mưa làm gió" trong tương lai.

Runway, một startup nổi tiếng về AI vừa công bố mô hình mới Gen 2, có thể chuyển đổi bất kỳ mô tả văn bản nào thành một video dài 3 giây, mở ra một thế giới mới cho những người tạo nội dung video. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Cris Valenzuela - đồng sáng lập và Giám đốc điều hành của Runway trình diễn một loạt ví dụ, trong đó cho thấy Gen 2 có thể tạo được cảnh quay "drone trên một vùng sa mạc" chỉ trong vài giây. Sự phát triển này là một dấu hiệu cho thấy việc chuyển văn bản thành video sắp trở thành hiện thực.

Việc tạo cảnh quay video từ các mô tả văn bản của AI giúp hợp lý hoá, giảm chi phí quá trình sản xuất video và cho phép đạo diễn, diễn viên biến tầm nhìn của họ thành hiện thực một cách dễ dàng nhất. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 2

Cùng với việc tạo hình ảnh, công cụ của Runway có thể sử dụng lời nhắc văn bản để thay đổi hình ảnh hiện có, tạo họa tiết cho đối tượng 3D và tô màu cho ảnh đen trắng. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 3

Các công cụ chỉnh sửa video của công ty có thể thêm hoặc bớt các yếu tố cảnh, nội suy khung hình, triển khai chuyển động chậm, kiểm duyệt khuôn mặt, tạo bản ghi và phụ đề, trích xuất thông tin độ sâu, theo dõi chuyển động và chỉnh sửa âm thanh. Bên cạnh đó cho phép người dùng xoá, làm mờ hoặc thay thế background trong video.

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 4

Hiện tại, Gen 2 vẫn chưa có sẵn cho tất cả mọi người. Những người muốn sử dụng tính năng này có thể đăng ký danh sách chờ trên kênh Discord. Dự kiến trong những tuần tới, công ty sẽ cung cấp quyền truy cập rộng rãi cho người dùng khắp nơi trên thế giới.

Việc tạo video bằng văn bản không phải là mới trong lĩnh vực AI. Những gã khổng lồ công nghệ như Meta và Google trước đây đã phát hành các tài liệu nghiên cứu về các mô hình AI chuyển văn bản thành video tương tự vào cuối năm 2022. 

 

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Bất chấp nguy hiểm để "câu view": Hai du khách Mỹ bị bắt giữ vì đột nhập chuồng khỉ nổi tiếng tại Nhật Bản

Bất chấp nguy hiểm để "câu view": Hai du khách Mỹ bị bắt giữ vì đột nhập chuồng khỉ nổi tiếng tại Nhật Bản

hoanlagvnDũng Nhỏ TT

Chỉ vì muốn sở hữu những thước phim độc lạ cho mạng xã hội, hai nam du khách người Mỹ đã liều lĩnh xâm nhập trái phép vào khu vực nuôi dưỡng khỉ tại vườn thú Ichikawa. Hành động bốc đồng này không chỉ khiến đàn thú rơi vào tình trạng hoảng loạn tột độ mà còn dẫn đến cái kết đắng khi cả hai phải đối mặt với cảnh sát Nhật Bản.

Giải trí
Khi "cha đẻ" bị chính tác phẩm của mình "phản bội": Mangaka Nhật Bản mất trắng tài khoản Google vì lưu trữ Manga cũ

Khi "cha đẻ" bị chính tác phẩm của mình "phản bội": Mangaka Nhật Bản mất trắng tài khoản Google vì lưu trữ Manga cũ

hoanlagvnDũng Nhỏ TT

Một tình huống hy hữu nhưng đầy nghiệt ngã vừa xảy ra với họa sĩ truyện tranh nổi tiếng Itosugi Masahiro. Chỉ vì tải lên Google Drive bộ manga do chính tay mình sáng tác nhiều năm trước, vị tác giả này đã bị hệ thống "khai tử" toàn bộ tài khoản cá nhân, mở ra một cuộc tranh luận gay gắt về giới hạn của kiểm duyệt thuật toán.

Giải trí
Lên đầu trang