Meta công bố mô hình AI có thể dịch và phát biểu với hơn 100 ngôn ngữ khác nhau

Seamless M4T, có thể hỗ trợ dịch giữa văn bản và lời nói ở gần 100 ngôn ngữ.

Meta, công ty mẹ của Facebook vừa phát hành một mô hình AI có khả năng dịch và chép lại các nội dung bằng lời nói hoặc văn bảng với hàng chục ngôn ngữ. Mô hình AI này có thể trở thành nền tảng để phát triển các công cụ giao tiếp thời gian thực bất chấp sự khác biệt về ngôn ngữ.

Trong thông báo của mình, Meta cho biết mô hình AI Seamless M4T có thể hỗ trợ dịch giữa văn bản và lời nói ở gần 100 ngôn ngữ, cũng như dịch toàn bộ nội dung văn bản sang 35 ngôn ngữ, kết hợp các công nghệ trước đây chỉ có trong các mô hình riêng biệt.

Meta công bố mô hình AI có thể dịch và phát biểu với hơn 100 ngôn ngữ khác nhau

Giám đốc điều hành của Meta, Mark Zuckerberg cho biết ông hình dung ra được các công cụ như công cụ này tạo điều kiện thuận lợi cho sự tương tác giữa người dùng từ khắp nơi trên thế giới trong metaverse, một loạt các thế giới ảo được kết nối với nhau mà ông đặt cược vào tương lai của công ty. Meta cung cấp mô hình này cho công chúng sử dụng mà không nhằm mục đích thương mại.

Công ty truyền thông xã hội lớn nhất thế giới đã phát hành một số mô hình AI, hầu hết là miễn phí trong năm nay, bao gồm cả mô hình ngôn ngữ lớn có tên Llama, đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.

Meta công bố mô hình AI có thể dịch và phát biểu với hơn 100 ngôn ngữ khác nhau 2

Zuckerberg cho biết hệ sinh thái AI mở là một lợi thế cho Meta, vì công ty có thể đạt được nhiều lợi ích hơn bằng cách thu thập các khoản đóng góp để xây dựng các công cụ tiêu dùng cho nền tảng xã hội của mình hơn là thu phí để truy cập vào các mô hình đó.

Tuy nhiên, Meta sẽ phải đối mặt với các câu hỏi pháp lý tương tự trong lĩnh vực AI liên quan đến dữ liệu đào tạo được sử dụng để xây dựng mô hình của mình.

Vào tháng 7, diễn viên hài Sarah Silverman và hai tác giả khác đã đệ đơn kiện Meta và OpenAI vi phạm bản quyền, cáo buộc rằng các công ty này đã sử dụng sách của họ làm dữ liệu đào tạo mà không được phép.

Đối với Seamless M4T, các nhà nghiên cứu Meta đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ "âm thanh thô có nguồn gốc từ kho lưu trữ dữ liệu web có thể truy cập công khai". Trong khi đó, dữ liệu văn bản được lấy từ một tập dữ liệu được tạo ra vào năm ngoái từ Wikipedia và các trang web tương tự. 

 

Bài đọc nhiều nhất

Bài mới trong ngày

Ẩn dụ "Nhện giăng lưới Bướm" trong Chainsaw Man: Liệu Reze mới là người sập bẫy tình?

Ẩn dụ "Nhện giăng lưới Bướm" trong Chainsaw Man: Liệu Reze mới là người sập bẫy tình?

hoanlagvnDũng Nhỏ TT

Kể từ khi siêu phẩm điện ảnh Chainsaw Man – The Movie: Reze Arc chính thức trình làng, sức hút của cặp đôi Denji và Reze vẫn chưa bao giờ hạ nhiệt. Mới đây, một phân tích mang tính bước ngoặt trên X (Twitter) đã khiến người hâm mộ phải "quay xe" khi lật lại ý nghĩa thực sự của hình ảnh ẩn dụ "Nhện và Bướm" trong phân cảnh hồ bơi đầy mê hoặc.

Giải trí
"Bạn Gái Thuê" Mùa 5 Tung Visual Rực Lửa: Chizuru và Mimi "Đọ Dáng" Bikini, Hẹn Gặp Fan Vào Tháng 4/2026!

"Bạn Gái Thuê" Mùa 5 Tung Visual Rực Lửa: Chizuru và Mimi "Đọ Dáng" Bikini, Hẹn Gặp Fan Vào Tháng 4/2026!

hoanlagvnDũng Nhỏ TT

Sau một thời gian dài để người hâm mộ đồn đoán, trang web chính thức của bộ anime đình đám Rent a Girlfriend (Kanojo, Okarishimasu) đã tạo nên một cú nổ truyền thông khi tung ra Key Visual đầu tiên cho mùa thứ 5. Không ngoài dự đoán, sự xuất hiện của dàn "bóng hồng" trong trang phục bikini gợi cảm đã ngay lập tức chiếm trọn tâm điểm của các diễn đàn Anime toàn cầu.

Giải trí
Lên đầu trang