Công nghệ này có thể sao chép giọng nói của một người chỉ bằng đoạn âm thanh dài 15 giây của họ đang nói. Nhưng hiện tại, OpenAI chỉ phát hành Voice Engine cho một số đối tác được chọn.
Được gọi là Voice Engine, công nghệ này có thể sao chép giọng nói của bất kỳ ai chỉ bằng cách nghe một đoạn clip ngắn. Công nghệ này không chỉ sao chép giọng nói mà còn có khả năng truyền tải cảm xúc và nhịp điệu tự nhiên, tạo ra đoạn hội thoại giả mạo rất chân thực.
Tuy nhiên, OpenAI hiện chỉ phát hành hệ thống này cho một số đối tác được chọn lọc. Công ty đã lựa chọn tiếp cận thận trọng, cho rằng xã hội chưa sẵn sàng hoàn toàn cho công nghệ này, ít nhất là trong thời điểm hiện tại.
Trong một bài đăng trên blog, OpenAI đã cung cấp một số ví dụ về cách Voice Engine có thể được sử dụng. Công nghệ này đã được thử nghiệm với một nhóm nhỏ các đối tác đáng tin cậy và đã chứng minh tiềm năng trong nhiều lĩnh vực, từ trợ lý đọc sách cho học sinh đến dịch giả đa ngôn ngữ. Ngoài ra, công nghệ nhân bản giọng nói cũng có thể hỗ trợ những người mất khả năng nói.
Tuy nhiên, OpenAI nhấn mạnh rằng công nghệ này có thể bị lạm dụng, đặc biệt là trong việc tạo ra thông tin sai lệch hoặc mạo danh. Do đó, công ty đã quyết định chỉ phát hành Voice Engine cho những đối tác cam kết không sử dụng công nghệ này một cách bất hợp pháp, và yêu cầu họ phải rõ ràng tiết lộ với khán giả rằng giọng nói mà họ đang nghe là do AI tạo ra.
OpenAI cũng đã bổ sung hệ thống hình mờ để giúp phát hiện âm thanh do AI tạo ra từ Voice Engine. Tuy nhiên, công ty vẫn chưa đưa ra cam kết về việc phát hành rộng rãi công nghệ này. Họ cho biết quyết định cuối cùng sẽ phụ thuộc vào phản ứng của xã hội và những cuộc thử nghiệm tiếp theo. Đồng thời, họ hy vọng sẽ bắt đầu một cuộc đối thoại có trách nhiệm về việc triển khai công nghệ này và cách xã hội có thể thích ứng với những khả năng mới mẻ này.