Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Quên ChatGPT đi - Runway Gen 2 có thể chuyển văn bản thành video vô cùng chân thực chỉ trong vài giây.

Với tính năng dịch văn bản sang hình ảnh, các mô hình AI gần đây như Dall-E hoặc Stable Diffusion đã chứng minh được giá trị của nó. Nhưng cải tiến mới đây cho phép AI chuyển văn bản thành video dự kiến sẽ "làm mưa làm gió" trong tương lai.

Runway, một startup nổi tiếng về AI vừa công bố mô hình mới Gen 2, có thể chuyển đổi bất kỳ mô tả văn bản nào thành một video dài 3 giây, mở ra một thế giới mới cho những người tạo nội dung video. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây

Cris Valenzuela - đồng sáng lập và Giám đốc điều hành của Runway trình diễn một loạt ví dụ, trong đó cho thấy Gen 2 có thể tạo được cảnh quay "drone trên một vùng sa mạc" chỉ trong vài giây. Sự phát triển này là một dấu hiệu cho thấy việc chuyển văn bản thành video sắp trở thành hiện thực.

Việc tạo cảnh quay video từ các mô tả văn bản của AI giúp hợp lý hoá, giảm chi phí quá trình sản xuất video và cho phép đạo diễn, diễn viên biến tầm nhìn của họ thành hiện thực một cách dễ dàng nhất. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 2

Cùng với việc tạo hình ảnh, công cụ của Runway có thể sử dụng lời nhắc văn bản để thay đổi hình ảnh hiện có, tạo họa tiết cho đối tượng 3D và tô màu cho ảnh đen trắng. 

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 3

Các công cụ chỉnh sửa video của công ty có thể thêm hoặc bớt các yếu tố cảnh, nội suy khung hình, triển khai chuyển động chậm, kiểm duyệt khuôn mặt, tạo bản ghi và phụ đề, trích xuất thông tin độ sâu, theo dõi chuyển động và chỉnh sửa âm thanh. Bên cạnh đó cho phép người dùng xoá, làm mờ hoặc thay thế background trong video.

Mô hình AI mới có thể chuyển văn bản thành video chỉ trong vài giây 4

Hiện tại, Gen 2 vẫn chưa có sẵn cho tất cả mọi người. Những người muốn sử dụng tính năng này có thể đăng ký danh sách chờ trên kênh Discord. Dự kiến trong những tuần tới, công ty sẽ cung cấp quyền truy cập rộng rãi cho người dùng khắp nơi trên thế giới.

Việc tạo video bằng văn bản không phải là mới trong lĩnh vực AI. Những gã khổng lồ công nghệ như Meta và Google trước đây đã phát hành các tài liệu nghiên cứu về các mô hình AI chuyển văn bản thành video tương tự vào cuối năm 2022. 

 

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Sức nóng World Cup tại Tokyo: "Quái vật nhạc số" Ado hóa tượng thần may mắn, tiếp lửa cho đội tuyển Nhật Bản

Sức nóng World Cup tại Tokyo: "Quái vật nhạc số" Ado hóa tượng thần may mắn, tiếp lửa cho đội tuyển Nhật Bản

hoanlagvnDũng Nhỏ TT

Sự kiện độc đáo này nhanh chóng trở thành tâm điểm chú ý của giới truyền thông và người hâm mộ. Sự giao thoa mạnh mẽ giữa bóng đá, thời trang đường phố và âm nhạc đại chúng tại Shibuya đã chứng minh một tư duy làm thương hiệu vô cùng khác biệt và đẳng cấp của người Nhật.

Giải trí
"Vua Săn Mộ" tung trailer nghẹt thở: Bom tấn hoạt hình Webtoon chốt lịch đổ bộ màn ảnh tháng 7

"Vua Săn Mộ" tung trailer nghẹt thở: Bom tấn hoạt hình Webtoon chốt lịch đổ bộ màn ảnh tháng 7

hoanlagvnDũng Nhỏ TT

Dự án hoạt hình được chuyển thể từ bộ Webtoon tỷ view cùng tên này hiện đang là một trong những cái tên được săn đón nhất mùa hè năm nay. Sự kết hợp giữa cốt truyện lôi cuốn vốn có và kỹ nghệ sản xuất tân tiến hứa hẹn sẽ mang đến một trải nghiệm thị giác bùng nổ cho các mọt phim.

Giải trí
Lên đầu trang