OpenAI đã công bố Dall-E 3, phiên bản mới nhất của mô hình tổng hợp hình ảnh AI với loạt cải tiến mới khi được tích hợp cùng ChatGPT.
OpenAI công bố phiên bản nâng cấp của công cụ chuyển đổi prompt từ văn bản sang hình ảnh, Dall-E 3. Theo OpenAI, phiên bản mới này có thể hiểu bối cảnh tốt hơn, không bỏ qua những từ cụ thể và xử lý "nhiều sắc thái và chi tiết hơn" so với phiên bản trước đó.
Công cụ mới của OpenAI, Dall-E 3, sử dụng ChatGPT để giúp điền lời nhắc. Thông qua ChatGPT, những người đăng ký gói ChatGPT cao cấp của OpenAI, ChatGPT Plus và ChatGPT Enterprise, có thể nhập yêu cầu về hình ảnh và trau dồi nó thông qua các cuộc trò chuyện với chatbot nhận kết quả trực tiếp trong ứng dụng trò chuyện.
ChatGPT sẽ đưa ra prompt chỉ vài từ ngắn và mang tính mô tả hơn, cung cấp thêm hướng dẫn cho Dall-E 3.
Bên cạnh viêc tích hợp ChatGPT, Dall-E 3 còn hứa hẹn sẽ tạo ra bàn tay con người chính xác hơn, một nhiệm vụ mà nhiều trình tạo hình ảnh AI không thể làm được. Đối thủ Midjourney cũng đưa ra thông báo tương tự vào tháng trước, với tính năng mới cho phép người dùng chỉ yêu cầu chỉnh sửa một phần hình ảnh (xoá một ngón tay).
Ngoài việc công bố những tính năng có trên Dall-E 3, OpenAI cũng bày tỏ mối lo ngại ngày càng tăng xung quanh tính lừa đảo của hình ảnh do AI tạo ra. OpenAI cho biết: “Chúng tôi cũng đang nghiên cứu những cách tốt nhất để giúp mọi người xác định thời điểm hình ảnh được tạo ra bằng AI”.
Công ty đang nghiên cứu một công cụ nội bộ có thể phân tích các tác phẩm do AI tạo ra khác gì so với với nghệ thuật do con người tạo ra. Hiện tại, OpenAI đang làm việc hồi sinh công cụ phát hiện văn bản do AI tạo ra, công cụ này đã vào tháng 7 do hiệu suất kém.
Trong email của OpenAI, Dall-E 3 đã được đào tạo từ chối các yêu cầu tạo hình mang phong cách của những nghệ sĩ còn sống hoặc chân dung các nhân vật của công chúng. Ngoài ra, các nghệ sĩ giờ đây có thể từ chối sử dụng một số - hoặc tất cả - tác phẩm nghệ thuật của họ để đào tạo các thế hệ mô hình chuyển văn bản thành hình ảnh OpenAI trong tương lai.
Theo OpenAI, một trong những tính năng mới của Dall-E 3 sẽ được triển khai cho người dùng ChatGPT Plus vào tháng 10.