Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn

Nhiệm vụ của đội ngũ là dựng lại hình ảnh khuôn mặt của một người từ một đoạn ghi âm giọng nói.

Các nhà khoa học tại Viện Công nghệ Massachusetts (MIT-Mỹ) lần đầu tiên thành công trong việc áp dụng thuật toán phục dựng chân dung chỉ từ giọng nói.

Một thuật toán AI có tên Speech2Face, được phát triển bởi các nhà khoa học trí tuệ nhân tạo (AI) tại Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo (CSAIL) của MIT, giúp tái tạo khuôn mặt của một người chỉ trong nháy mắt chỉ với một đoạn ghi âm giọng nói ngắn và kết quả rất ấn tượng.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn

Đầu tiên, các nhà nghiên cứu đã thiết kế và đào tạo một mạng nơ-ron nhân tạo học, sử dụng hàng triệu video từ YouTube và internet của những người đang nói chuyện. 

Trong quá trình đào tạo này, AI đã học được mối tương quan giữa âm thanh của giọng nói và vẻ bề ngoài của người nói. Những mối tương quan đó cho phép AI đưa ra những phỏng đoán tốt nhất về tuổi, giới tính và quốc gia của người nói.

Không có sự tham gia của con người vào quá trình đào tạo. AI chỉ được cung cấp một lượng lớn video và có nhiệm vụ tìm ra mối tương quan giữa đặc điểm giọng nói và đặc điểm khuôn mặt.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn 2

Sau khi được đào tạo, AI rất giỏi trong việc tạo ra các bức chân dung chỉ dựa trên các bản ghi âm giọng nói giống với những gì người nói thực sẽ trông như thế nào.

Để phân tích sâu hơn về độ chính xác của việc tái tạo khuôn mặt, các nhà nghiên cứu đã chế tạo một "bộ giải mã khuôn mặt". Bộ giải mã sẽ tạo ra một bản tái tạo chuẩn khuôn mặt của một người từ ảnh tĩnh của họ, bỏ qua "các biến thể không liên quan", chẳng hạn như tư thế và ánh sáng. Điều này cho phép các nhà khoa học dễ dàng so sánh các bản dựng lại giọng nói với các tính năng thực tế của âm thanh.

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn 3

Một lần nữa, kết quả của AI rất khớp với khuôn mặt thật trong nhiều trường hợp được nghiên cứu từ nhiều độ tuổi, giới tính và sắc tộc khác nhau.

AI kết xuất giọng nói có thể tạo hình ảnh động của một người trong cuộc gọi điện thoại hoặc cuộc gọi hội nghị video khi danh tính của người đó không xác định và họ không muốn chia sẻ khuôn mặt thật của mình.

Các nhà nghiên cứu đã viết trong bài báo được công bố tại một hội nghị về thị giác máy tính và nhận dạng mẫu (CVPR): "Các khuôn mặt được tái tạo cũng có thể được sử dụng trực tiếp để chỉ định giọng nói do máy tạo ra được sử dụng trong các thiết bị gia dụng và trợ lý ảo".

Chỉ với giọng nói, công nghệ AI có thể phục dựng chân dung khớp với khuôn mặt của bạn 4

Cơ quan pháp luật cũng có thể sử dụng AI để tạo chân dung nghi phạm từ bằng chứng duy nhất là đoạn ghi âm giọng nói. Tuy nhiên, các ứng dụng của chính phủ nhất định sẽ là chủ đề của rất nhiều cuộc tranh luận và tranh luận liên quan đến quyền riêng tư.

 

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Shin - Cậu bé bút chì "đổ bộ" rạp Việt: Cuộc tái ngộ đầy cảm xúc sau 6 năm chờ đợi

Shin - Cậu bé bút chì "đổ bộ" rạp Việt: Cuộc tái ngộ đầy cảm xúc sau 6 năm chờ đợi

hoanlagvnDũng Nhỏ TT

Dịp lễ 1/5 năm nay, màn ảnh rộng Việt Nam sẽ trở nên rộn ràng hơn bao giờ hết với sự xuất hiện của một người bạn cũ nhưng chưa bao giờ hết "nhiệt": Shinnosuke. Với tên gọi đầy hứa hẹn “Phim Shin – Cậu bé bút chì: Quậy tung! Vương Quốc Nguệch Ngoạc và 4 Dũng Sĩ Bất Ổn”, bộ phim đánh dấu một cột mốc quan trọng khi nhà phát hành quyết tâm đưa phần phim này lên rạp, xóa tan mọi khoảng trống mà dịch bệnh đã gây ra từ năm 2020.

Giải trí
Cơn sốt MARRIAGETOXIN: Khi "Độc sư" đi tìm vợ và cú nổ 2 triệu view chỉ sau 3 tập

Cơn sốt MARRIAGETOXIN: Khi "Độc sư" đi tìm vợ và cú nổ 2 triệu view chỉ sau 3 tập

hoanlagvnDũng Nhỏ TT

Ra mắt chính thức từ ngày 7/4/2026, bản chuyển thể anime của MARRIAGETOXIN đã nhanh chóng trở thành tâm điểm của cộng đồng Otaku. Dưới bàn tay nhào nặn của "ông lớn" Studio BONES – cái tên bảo chứng cho chất lượng hành động đỉnh cao – bộ phim đã tạo nên một làn sóng thảo luận sôi nổi trên khắp các nền tảng mạng xã hội và các kênh YouTube của Muse.

Giải trí
"Vương triều" Crunchyroll lung lay: Netflix và YouTube chính thức "soán ngôi" nền tảng Anime số 1 toàn cầu

"Vương triều" Crunchyroll lung lay: Netflix và YouTube chính thức "soán ngôi" nền tảng Anime số 1 toàn cầu

hoanlagvnDũng Nhỏ TT

Theo dữ liệu mới nhất từ GEM Partners dựa trên cuộc khảo sát quy mô lớn với hơn 15.000 người tại 15 quốc gia, thị trường Anime đang chứng kiến một sự dịch chuyển quyền lực chưa từng có. Những nền tảng "đa nội dung" giờ đây không còn xem Anime là món phụ, mà đã biến nó thành vũ khí chiến lược để thâu tóm người dùng toàn cầu.

Giải trí
Lên đầu trang