AI Của Alibaba Có Thể "Biến" Bức Hoạ Monalisa Biết Nói Và Hát

mô hình Emote Portrait Live là một bước tiến quan trọng trong việc biến ảnh tĩnh thành chuyển động.

Các kỹ sư Trung Quốc tại Viện Điện toán Thông minh (IIC) của Alibaba, vừa phát triển một ứng dụng AI có tên Emote Portrait Live, có thể "biến hình" một bức ảnh tĩnh có thể nói và hát được.

Công nghệ đằng sau mô hình Emote Portrait Live dựa trên khả năng tổng hợp của các mô hình khuếch tán. Mô hình khuếch tán là một mô hình toán học được sử dụng để mô tả cách mọi thứ lan truyền hoặc khuếch tán theo thời gian. Trong trường hợp này, mô hình khuếch tán được sử dụng để mô tả cách các chuyển động trên khuôn mặt lan truyền từ một điểm khởi đầu đến các phần khác của khuôn mặt.

AI Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát

Mô hình Emote Portrait Live sử dụng mô hình khuếch tán để tổng hợp trực tiếp video đầu nhân vật từ hình ảnh được cung cấp và bất kỳ clip âm thanh nào. Quá trình này bỏ qua nhu cầu xử lý trước phức tạp hoặc biểu diễn trung gian, do đó đơn giản hóa việc tạo video đầu người biết nói.

Mục tiêu của nhóm nghiên cứu là phát triển một khung đầu biết nói có thể nắm bắt được nhiều biểu cảm thực tế trên khuôn mặt, bao gồm cả những biểu cảm vi mô tinh tế và cho phép chuyển động đầu tự nhiên. Để làm được điều đó, các nhà nghiên cứu đã đưa các cơ chế điều khiển ổn định vào mô hình của họ, cụ thể là bộ điều khiển tốc độ và bộ điều khiển vùng mặt, để cải thiện độ ổn định trong quá trình tạo ra.

AI Của Alibaba Có Thể Biến Bức Hoạ Monalisa Biết Nói Và Hát 2

So với các AI trước đây chỉ có thể biến đổi miệng và một phần của khuôn mặt, thì Emote có thể tạo nét mặt, tư thế, nhíu mày hoặc lắc lư. Đặc biệt, phần miệng được AI tạo ra trông rất tự nhiên.

Trong một số video do Alibaba công bố, hình ảnh sẽ biến thành video và hát các bài được nhập vào nhanh chóng như bức hoạ Mona Lisa kể lại đoạn độc thoại của Rosalind trong As You Like It , Màn 3, Cảnh 2 của Shakespeare.

AI Của Alibaba Có Thể "Biến" Bức Hoạ Monalisa Biết Nói Và Hát

13/03/2024 11:42

mô hình Emote Portrait Live là một bước tiến quan trọng trong việc biến ảnh tĩnh thành chuyển động.

Apple Vision Pro Hỗ Trợ Thành Công Ca Phẫu Thuật Đầu Tiên Tại Anh

Elon Musk Sẽ Bắt Đầu Mở Mã Nguồn Chatbot AI Grok Của Mình Trong Tuần Này

ChatGPT Ngốn Điện Gấp 17.000 Lần Mức Sử Dụng Trong Một Hộ Gia Đình

Elon Musk Lên Kế Hoạch Ra Mắt Ứng Dụng TV Mới, Cạnh Tranh Với YouTube

Cựu Giám Đốc Activision Bobby Kotick Cân Nhắc Mua Lại TikTok

Mô Hình AI Mới Của Google Có Thể Biến Hình Ảnh Thành Mini Game Có thể Chơi Được

Phát Triển Thành Công "Pin Nước" Rẻ Hơn, Có Thể Tái Chế Và Không Gây Nguy Hiểm

Ấn Độ xây dựng siêu máy tính 10.000 GPU để tự phát triển AI

Máy Chơi Game PC Cầm Tay MSI Claw Chính Thức Lên Kệ Với Giá 17 Triệu Đồng

Apple Bắt Đầu Giúp Việc Chuyển Đổi Từ IPhone Sang Android Sẽ Dễ Dàng Hơn

200.000 tế bào thần kinh người trên vi mạch chơi được Doom, Cortical Labs trình diễn CL1

Media Do thâu tóm Seven Seas Entertainment với giá 80 triệu USD, mở rộng mạnh sang thị trường Mỹ

Razer ra mắt bao đựng laptop tích hợp sạc không dây

Resident Evil Requiem: Cốt Truyện Tổng Thể Trước Các Sự Kiện Trong Game (Phần 1)

"Dandelion" của tác giả Gintama lên sóng Anime: Bản giao hưởng tâm linh đầy tính nhân văn trên Netflix

Quảng cáo gây tranh cãi: Musk, Altman và Bezos về già “dùng” người thất nghiệp để điều khiển AI

AI Của Alibaba Có Thể "Biến" Bức Hoạ Monalisa Biết Nói Và Hát

13/03/2024 11:42

mô hình Emote Portrait Live là một bước tiến quan trọng trong việc biến ảnh tĩnh thành chuyển động.

Bài liên quan

Lamborghini hủy dự án siêu xe điện đầu tiên, chuyển hướng sang hybrid

Caberg ra mắt Tanami Carbon: Mũ bảo hiểm siêu nhẹ dưới 1,5 kg, tích hợp SOS và kết nối Bluetooth

YouTube sập tại Mỹ: Hơn 280.000 người dùng báo lỗi, xuất hiện thông báo “Something went wrong”

Robot Có Khả Năng Nhìn và Phản Hồi Thời Gian Thực: Bước Tiến Mới trong Công Nghệ Thị Giác

Bài đọc nhiều nhất

LMHT: Bùng Nổ Nghi Vấn Gian Lận Ở LPL Split 1 Đến Từ Tuyển Thủ TOP Esports

Do You Like Big Girls? tung trailer, visual mới và ca khúc opening trước khi lên sóng

Điện thoại lượng tử Trung Quốc 'nói không với nghe lén' chính thức ra mắt sau 17 năm

Sentenced to Be a Hero: Emi Lo và Dawn M. Bennett chia sẻ về vai lồng tiếng Teoritta và Kivia

Bài mới trong ngày

Vivo X300 Ultra: Khi ranh giới giữa Smartphone và máy ảnh chuyên nghiệp bị xóa nhòa

Sentenced to Be a Hero: Emi Lo và Dawn M. Bennett chia sẻ về vai lồng tiếng Teoritta và Kivia

Marlon Wayans Tuyên Bố Scary Movie 6 Sẽ “Hủy Bỏ Văn Hóa Tẩy Chay”, Đưa Hài Kịch Trở Lại Đúng Bản Chất

LMHT: Bùng Nổ Nghi Vấn Gian Lận Ở LPL Split 1 Đến Từ Tuyển Thủ TOP Esports

Do You Like Big Girls? tung trailer, visual mới và ca khúc opening trước khi lên sóng