Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

MM1, mô hình ngôn ngữ lớn của Apple có bước đột phát vượt bậc, có thể xác định và đếm vật thể trong hình ảnh mà không cần đào tạo.

Các nhà nghiên cứu của Apple đã phát triển MM1, một phương pháp mới để đào tạo các mô hình ngôn ngữ lớn (LLM) kết hợp cả thông tin văn bản và hình ảnh. 

Trong một báo cáo mới từ nhà nghiên cứu của hãng cho biết, MM1 là một phần của nhóm mô hình đa phương thức bao gồm tới 30 tỷ tham số, sử dụng tập dữ liệu bao gồm các cặp chú thích hình ảnh, tài liệu văn bản-hình ảnh xen kẽ và dữ liệu chỉ có văn bản.

Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

Apple giải thích mô hình ngôn ngữ lớn đa phương thức (MLLM) là các mô hình nền tảng quy mô lớn xử lý dữ liệu hình ảnh và văn bản để tạo ra kết quả đầu ra văn bản.

Apple tuyên bố rằng MM1 có khả năng đếm các vật thể, xác định từng chủ thể và vật thể trong hình ảnh, thể hiện kiến ​​thức từ ngữ và hiểu biết thông thường về các vật thể hàng ngày cũng như thực hiện các hàm toán học cơ bản. 

Ngoài ra, mô hình cũng hỗ trợ học tập trong ngữ cảnh, nghĩa là MM1 không cần đào tạo lại hoặc tinh chỉnh cho từng truy vấn mà có thể hiểu truy vấn dựa trên ngữ cảnh được cung cấp. Mô hình cũng có khả năng suy luận đa hình ảnh, cho phép nó diễn giải và rút ra kết luận từ nhiều hình ảnh.

Apple Tiết Lộ Bước Đột Phá AI Mới Để Đào Tạo LLM Về Hình Ảnh Và Văn Bản

"MM1 chỉ là sự khởi đầu và hãng đang trong giai đoạn phát triển mô hình tiếp theo." Brandon McKinzie, kỹ sư nghiên cứu cấp cao của Apple và là người đang nghiên cứu các mô hình đa phương.

Tin tức về MM1 được đưa ra trong khi gần đây nhiều thông tin cho rằng Apple hiện đang đàm phán để tích hợp công nghệ Gemini AI của Google lên các tính năng cho Phone thế hệ tiếp theo. Sự hợp tác này sẽ giúp mở rộng lượng người dùng Google Gemini và giúp Apple có quyền truy cập vào một số công nghệ AI tiên tiến nhất hiện có.

 

Bài đọc nhiều nhất

Bài mới trong ngày

COLORFUL STAGE! The Movie: Khi Miku Không Thể Hát và Hành Trình Âm Nhạc Đem Lại Sức Sống

COLORFUL STAGE! The Movie: Khi Miku Không Thể Hát và Hành Trình Âm Nhạc Đem Lại Sức Sống

hoanlagvnDũng Nhỏ TT

Dựa trên thế giới đầy màu sắc và âm nhạc sôi động của tựa game Project SEKAI, COLORFUL STAGE! The Movie kể câu chuyện về một Miku không thể hát và hành trình của các nhân vật nỗ lực giúp cô tìm lại tiếng hát. Bộ phim không chỉ dành riêng cho fan hâm mộ lâu năm mà còn là lời mời gọi khám phá sức mạnh của âm nhạc và tình bạn.

Giải trí
Anime Free Fire công bố dàn nhân lực, Kelly chính thức trở thành nhân vật trung tâm

Anime Free Fire công bố dàn nhân lực, Kelly chính thức trở thành nhân vật trung tâm

hoanlagvnDũng Nhỏ TT

Garena hợp tác cùng Kadokawa đã tung ra teaser đầu tiên cùng hình ảnh visual chính thức của anime Free Fire, đánh dấu lần đầu tiên tựa game di động nổi tiếng toàn cầu này được chuyển thể thành phim hoạt hình. Với Kelly, nhân vật biểu tượng quen thuộc làm trung tâm câu chuyện, dự án được kỳ vọng sẽ mang đến một trải nghiệm mới mẻ.

Giải trí
MSI 2025: Trận Đấu Giữa T1 Và Gen.G Sở Hữu Lượng Người Xem Cao Thứ 2 Lịch Sử

MSI 2025: Trận Đấu Giữa T1 Và Gen.G Sở Hữu Lượng Người Xem Cao Thứ 2 Lịch Sử

sonlagSơn Xéo Xắc

5 ván đấu giữa T1 và Gen.G tại kỳ MSI 2025 năm nay đã chứng kiến một kỷ lục khác được thiết lập khi nó trở thành trận đấu được xem nhiều nhất trong năm nay. Không chỉ vậy, nó còn phá vỡ kỷ lục về trận đấu LMHT có lượng người xem cao thứ 2 trong lịch sử LMHT chuyên nghiệp.

eSports
Lên đầu trang