Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

MM1, mô hình ngôn ngữ lớn của Apple có bước đột phát vượt bậc, có thể xác định và đếm vật thể trong hình ảnh mà không cần đào tạo.

Các nhà nghiên cứu của Apple đã phát triển MM1, một phương pháp mới để đào tạo các mô hình ngôn ngữ lớn (LLM) kết hợp cả thông tin văn bản và hình ảnh.

Trong một báo cáo mới từ nhà nghiên cứu của hãng cho biết, MM1 là một phần của nhóm mô hình đa phương thức bao gồm tới 30 tỷ tham số, sử dụng tập dữ liệu bao gồm các cặp chú thích hình ảnh, tài liệu văn bản-hình ảnh xen kẽ và dữ liệu chỉ có văn bản.

Apple giải thích mô hình ngôn ngữ lớn đa phương thức (MLLM) là các mô hình nền tảng quy mô lớn xử lý dữ liệu hình ảnh và văn bản để tạo ra kết quả đầu ra văn bản.

Apple tuyên bố rằng MM1 có khả năng đếm các vật thể, xác định từng chủ thể và vật thể trong hình ảnh, thể hiện kiến thức từ ngữ và hiểu biết thông thường về các vật thể hàng ngày cũng như thực hiện các hàm toán học cơ bản.

Ngoài ra, mô hình cũng hỗ trợ học tập trong ngữ cảnh, nghĩa là MM1 không cần đào tạo lại hoặc tinh chỉnh cho từng truy vấn mà có thể hiểu truy vấn dựa trên ngữ cảnh được cung cấp. Mô hình cũng có khả năng suy luận đa hình ảnh, cho phép nó diễn giải và rút ra kết luận từ nhiều hình ảnh.

Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

"MM1 chỉ là sự khởi đầu và hãng đang trong giai đoạn phát triển mô hình tiếp theo." Brandon McKinzie, kỹ sư nghiên cứu cấp cao của Apple và là người đang nghiên cứu các mô hình đa phương.

Tin tức về MM1 được đưa ra trong khi gần đây nhiều thông tin cho rằng Apple hiện đang đàm phán để tích hợp công nghệ Gemini AI của Google lên các tính năng cho Phone thế hệ tiếp theo. Sự hợp tác này sẽ giúp mở rộng lượng người dùng Google Gemini và giúp Apple có quyền truy cập vào một số công nghệ AI tiên tiến nhất hiện có.

Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

20/03/2024 18:12

MM1, mô hình ngôn ngữ lớn của Apple có bước đột phát vượt bậc, có thể xác định và đếm vật thể trong hình ảnh mà không cần đào tạo.

iPhone 17 Sẽ Được Trang Bị Màn Hình Chống Phản Chiếu, Siêu Cứng Mới

Nvidia Trình Làng Project GR00T, Nền Tảng Hiện Thực Hoá Robot Hình Người

Sony Tạm Dừng Sản Xuất PlayStation VR2 Vì... Không Ai Mua

Elon Musk Thừa Nhận Sử Dụng "Mai Thuý" Hàng Tuần

Nvidia Ra Mắt Chip AI Mới Nhanh Hơn H100 Gấp 30 Lần

Tapjoy của Unity ra mắt Daily Rewards tạo nhiều lợi ích cho người dùng

Giới trẻ Trung Quốc "Quẹt" Tinder Để Kiếm Việc Làm Trong Thời Điểm Kinh Tế Khó Khăn

Những nguy cơ và cách để phòng tránh việc phát nổ ở Pin lithium

Đột Phá Công Nghệ Mới Giúp Tăng Tốc Độ PC Cũ Mà Không Cần Phải Nâng Cấp Phần Cứng

PS5 Pro Sẽ Ra Mắt Vào Cuối Năm Nay Với Hiệu Suất Nhanh Gấp 3 Lần PS5

Halo: Campaign Evolved Bất Ngờ Yêu Cầu Duy Trì Kết Nối Mạng Trên PlayStation 5

Cơn thịnh nộ toàn cầu: Crunchyroll bị tẩy chay dữ dội vì ép fan trả phí gói cao cấp mới được... mua đồ lưu niệm

Báo lớn Philippines phá lệ ca ngợi "Thất nghiệp chuyển sinh": Kiệt tác gai góc phá vỡ mọi lối mòn của dòng phim Isekai

Sao Nam Xolo Maridueña Trở Lại Vai Blue Beetle Trong Hậu Truyện Superman: Man of Tomorrow

"Cụ tổ" ngành nghỉ hưu sớm tái xuất: Siêu phẩm The Greatest Magicmaster's Retirement Plan chính thức chốt lịch hóa Anime

Smartphone AI đầu tiên muốn vượt mặt Apple và OpenAI, dùng AI thay thế ứng dụng truyền thống

Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

20/03/2024 18:12

MM1, mô hình ngôn ngữ lớn của Apple có bước đột phát vượt bậc, có thể xác định và đếm vật thể trong hình ảnh mà không cần đào tạo.

Bài đọc nhiều nhất

Palit ra mắt phiên bản mới, NVIDIA dường như chưa muốn khai tử huyền thoại Ampere

Chuột gaming đầu tiên tích hợp quạt Noctua sắp ra mắt

Đỉnh cao nhập vai: Siêu coser Hane Ame gây bão toàn cầu với bộ ảnh "Thất nghiệp chuyển sinh" đẹp nghẹt thở

Heartstopper Forever Khép Lại Hành Trình 10 Năm Đầy Cảm Xúc

Bài mới trong ngày

EU chính thức buộc Google chia sẻ dữ liệu tìm kiếm và mở Android cho AI bên thứ ba

Bóc trần góc khuất Tokyo: Anime "Chainsmoker Cat" phơi bày thực trạng nghèo đói tàn khốc bị che giấu tại Nhật Bản

Rò Rỉ Tin Đồn Assassin's Creed Hexe Có Thể Ra Mắt Giữa Năm 2027

ASUS tung BIOS Beta mới, tối ưu RAM DDR5 CXMT trên bo mạch chủ AMD X670/X870

Diễn Viên Liam Neeson Rượt Đuổi Nghẹt Thở Trong Trailer Đầu Tiên Của The Mongoose