Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn

Nhiệm vụ của đội ngũ là dựng lại hình ảnh khuôn mặt của một người từ một đoạn ghi âm giọng nói.

Các nhà khoa học tại Viện Công nghệ Massachusetts (MIT-Mỹ) lần đầu tiên thành công trong việc áp dụng thuật toán phục dựng chân dung chỉ từ giọng nói.

Một thuật toán AI có tên Speech2Face, được phát triển bởi các nhà khoa học trí tuệ nhân tạo (AI) tại Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT, giúp tái tạo khuôn mặt của một người chỉ trong nháy mắt chỉ với một đoạn ghi âm giọng nói ngắn và kết quả rất ấn tượng.

Đầu tiên, các nhà nghiên cứu đã thiết kế và đào tạo một mạng nơ-ron nhân tạo học, sử dụng hàng triệu video từ YouTube và internet của những người đang nói chuyện.

Trong quá trình đào tạo này, AI đã học được mối tương quan giữa âm thanh của giọng nói và vẻ bề ngoài của người nói. Những mối tương quan đó cho phép AI đưa ra những phỏng đoán tốt nhất về tuổi, giới tính và quốc gia của người nói.

Không có sự tham gia của con người vào quá trình đào tạo. AI chỉ được cung cấp một lượng lớn video và có nhiệm vụ tìm ra mối tương quan giữa đặc điểm giọng nói và đặc điểm khuôn mặt.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn 2

Sau khi được đào tạo, AI rất giỏi trong việc tạo ra các bức chân dung chỉ dựa trên các bản ghi âm giọng nói giống với những gì người nói thực sẽ trông như thế nào.

Để phân tích sâu hơn về độ chính xác của việc tái tạo khuôn mặt, các nhà nghiên cứu đã chế tạo một "bộ giải mã khuôn mặt". Bộ giải mã sẽ tạo ra một bản tái tạo chuẩn khuôn mặt của một người từ ảnh tĩnh của họ, bỏ qua "các biến thể không liên quan", chẳng hạn như tư thế và ánh sáng. Điều này cho phép các nhà khoa học dễ dàng so sánh các bản dựng lại giọng nói với các tính năng thực tế của âm thanh.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn 3

Một lần nữa, kết quả của AI rất khớp với khuôn mặt thật trong nhiều trường hợp được nghiên cứu từ nhiều độ tuổi, giới tính và sắc tộc khác nhau.

AI kết xuất giọng nói có thể tạo hình ảnh động của một người trong cuộc gọi điện thoại hoặc cuộc gọi hội nghị video khi danh tính của người đó không xác định và họ không muốn chia sẻ khuôn mặt thật của mình.

Các nhà nghiên cứu đã viết trong bài báo được công bố tại một hội nghị về thị giác máy tính và nhận dạng mẫu (CVPR): "Các khuôn mặt được tái tạo cũng có thể được sử dụng trực tiếp để chỉ định giọng nói do máy tạo ra được sử dụng trong các thiết bị gia dụng và trợ lý ảo".

Cơ quan pháp luật cũng có thể sử dụng AI để tạo chân dung nghi phạm từ bằng chứng duy nhất là đoạn ghi âm giọng nói. Tuy nhiên, các ứng dụng của chính phủ nhất định sẽ là chủ đề của rất nhiều cuộc tranh luận và tranh luận liên quan đến quyền riêng tư.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn

11/04/2022 15:00

Nhiệm vụ của đội ngũ là dựng lại hình ảnh khuôn mặt của một người từ một đoạn ghi âm giọng nói.

Google Maps sẽ cho phép hiển thị đèn giao thông, biển báo trong tương lai

Nghiên cứu mới cho thấy các công ty bán dẫn có thể sản xuất chip từ mật ong

Google lên kế hoạch vô hiệu hoá các ứng dụng lỗi thời trên Play Store

Những câu chuyện đằng sau logo Apple mà không phải ai cũng biết

Lego hợp tác Epic Games xây dựng một metaverse an toàn hơn cho trẻ em

Không chỉ The Witcher, đây là danh sách 20 tựa game sử dụng công nghệ Unreal Engine 5

Nếu đã lỡ cài đặt các ứng dụng chống virus trên điện thoại của bạn, hãy nhanh tay xoá ngay

Chính quyền Đức "xoá sổ" thị trường web đen lớn nhất thế giới, hàng triệu bitcoin bị thu giữ

Sky Mavis gọi vốn thành công 150 triệu USD và ra mắt game NFT mới sau vụ hack thế kỷ

Công ty mẹ Facebook, Meta đang phát triển tiền ảo có tên 'Zuck Bucks'

Cơn bão truyền thông: Trang tin Kotaku hứng "gạch đá" vì kêu gọi tẩy chay siêu phẩm anime "Mushoku Tensei"

Assassin's Creed Hexe Rò Rỉ Thêm Hình Ảnh Nữ Chính Anika Cùng Một Nhân Vật Khác

Kevin Feige Xác Nhận Có Kế Hoạch Đưa Miles Morales Vào MCU Sau Khi Spider-Verse Khép Lại

Modder Trung Quốc chế card đồ họa GeForce RTX 4060 Windows 11 trên máy trạm Huawei Arm

Pháp muốn cấm trẻ dưới 15 tuổi dùng mạng xã hội từ tháng 9

Chạm vào ký ức: "Ngất ngây" trước không gian lãng mạn của Frieren và Dũng sĩ Himmel tại khu nghỉ dưỡng THE FARM (Chiba)

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn

11/04/2022 15:00

Nhiệm vụ của đội ngũ là dựng lại hình ảnh khuôn mặt của một người từ một đoạn ghi âm giọng nói.

Bài liên quan

Review UGREEN Nexode Pro 25.000mAh (200W): Khi sạc dự phòng giờ đây đủ sức thay thế cả củ sạc laptop

Chỉ với khoảng 5 USD, lập trình viên biến ESP32 thành máy chủ DNS chặn hơn 500.000 tên miền quảng cáo

Cuộc đại chúng hóa Kính AI: Meta ra mắt dòng kính thông minh tự thiết kế với mức giá "mềm" chưa từng có

"Gậy ông đập lưng ông": Meta khẩn cấp dừng dự án theo dõi nhân viên vì làm rò rỉ dữ liệu nhạy cảm cho... toàn công ty xem chung

Bài đọc nhiều nhất

Review UGREEN Finder Pro và UGREEN Smart Finder: Nên chọn thiết bị định vị nào?

"Tuyên chiến" với đầu cơ: Chính phủ Nhật Bản chính thức can thiệp, dẹp nạn tội phạm và "bão giá" thẻ bài Pokémon

X-Men '97 Mùa 2: Giải Mã Sáng Kiến X-Men Mới Nhất Được Lấy Cảm Hứng Từ Truyện Tranh

Johnny Depp Gây Bão Comic-Con 2026 Với Màn Trêu Đùa Cosplayer Edward Scissorhands

Bài mới trong ngày

Review UGREEN Finder Pro và UGREEN Smart Finder: Nên chọn thiết bị định vị nào?

Độc lạ Marketing Nhật Bản: Ajinomoto in thẳng mặt sao hạng A lên 10.000 cây xà lách để giải cứu nông sản mùa nóng

Johnny Depp Gây Bão Comic-Con 2026 Với Màn Trêu Đùa Cosplayer Edward Scissorhands

Santa Monica Studio Có Thể Là Lựa Chọn Lý Tưởng Cho Game Chuyển Thể The Odyssey

X-Men '97 Mùa 2: Giải Mã Sáng Kiến X-Men Mới Nhất Được Lấy Cảm Hứng Từ Truyện Tranh