Sora sẽ được cập nhật thêm âm thanh trong thời điểm ra mắt.
OpenAI sẽ ra mắt công cụ tạo văn bản thành video Sora vào cuối năm nay, tuy nhiên quá trình triển khai sẽ bị trì hoãn do lo ngại rằng công nghệ này có thể đe dọa việc làm và truyền bá thông tin sai lệch.
Theo WSJ, CTO OpenAI Mira Murati cho biết Sora rất tốn chi phí để tạo ra các video clip thực tế, tuy nhiên công ty đang tối ưu hóa công nghệ để yêu cầu ít sức mạnh tính toán hơn cho bản phát hành sắp tới.
Hiện tại, Sora chỉ có thể tạo clip dài tối đa 60 giây, không có bất kỳ giọng nói hay âm thanh nào. Nhưng Murati cho biết OpenAI đang lên kế hoạch sẽ bổ sung âm thanh vào công nghệ Sora sớm nhất có thể.
Việc Sora tạo ra các video trông thực tế hơn các trình tạo video bằng văn bản khác gây lo ngại rằng có thể khiến một số người ở Hollywood mất việc làm trong tương lai. Nhưng Murati lưu ý rằng Sora vẫn gặp một số lỗi, chẳng hạn như hiểu sai lời nhắc của người dùng hoặc gặp khó khăn trong vẽ bàn tay con người hoặc chuyển động của những chiếc ô tô đi ngang qua.
Để giải quyết những lo ngại về việc sử dụng sai mục đích, OpenAI có kế hoạch thêm watermark và siêu dữ liệu vào tất cả các video clip mà Sora xuất ra, giúp người xem dễ dàng xác định các cảnh quay do AI tạo ra hơn. Ngoài ra, Sora sẽ bị cấm tạo ra hình ảnh của các nhân vật của công chúng, hạn chế khả năng giả mạo các chính trị gia và người nổi tiếng.
Sora cũng có thể phải đối mặt với những thách thức pháp lý, một vấn đề mà OpenAI đang gặp phải với ChatGPT.
Theo Murati, OpenAI đã sử dụng các video có sẵn công khai và dữ liệu được cấp phép, bao gồm nội dung từ nhà cung cấp hình ảnh chứng khoán Shutterstock, để huấn luyện trình tạo video sống động như thật. Nhưng không rõ liệu Sora cũng đã được đào tạo về video trên YouTube hay Facebook hay chưa. Đáng ngạc nhiên là Murati cho biết cô không biết liệu video từ YouTube, Instagram và Facebook có được đưa vào dữ liệu đào tạo hay không,