Google giới thiệu bộ API nhận diện đối tượng TensorFlow mới cho lập trình viên

Bộ API TensorFlow mới này kỳ vọng giúp các nhà phát triển thực hiện công việc của mình trên các thiết bị ít phức tạp hơn.

Google vừa phát hành bộ API nhận diện đối tượng TensorFlow mới của mình, để giúp các nhà phát triển và các nhà nghiên cứu xác định các đối tượng trong những bức ảnh dễ dàng hơn. Google đang cố gắng cung cấp chúng một cách đơn giản và hiệu năng cao nhất có thể - các mô hình vừa được phát hành có hiệu năng rất tốt khi chạy benchmark và đang được sử dụng thường xuyên trong nghiên cứu.

Các mô hình này có bộ API nhận diện với những mạng lưới thần kinh nhân tạo dạng xoắn nặng nề và các mô hình tinh gọn được thiết kế để hoạt động trên những cỗ máy ít phức tạp hơn – bộ dò đơn MobileNets được tối ưu để có thể chạy trên thiết bị di động theo thời gian thực.

 

Google giới thiệu bộ API nhận diện đối tượng TensorFlow mới cho lập trình viên

Đầu tuần vừa qua, Google cũng cho ra mắt họ một loạt mô hình thị giác MobileNets cho các máy tính cấu hình thấp. Các mô hình này có thể xử lý các tác vụ như nhận diện đối tượng, nhận diện khuôn mặt và nhận diện các mốc vị trí trong không gian.

Các smartphone ngày nay đều không có những tài nguyên điện toán như những chiếc máy tính để bàn hay các thiết bị máy chủ, làm các nhà phát triển chỉ còn hai lựa chọn: Dựa vào các mô hình máy học chạy trên đám mây nhưng sẽ làm gia tăng độ trễ, và đòi hỏi phải có kết nối internet – do vậy nó khó có thể áp dụng trong nhiều trường hợp sử dụng thông thường. Một cách tiếp cận khác là đơn giản hóa bản thân các mô hình để đánh đổi lấy việc triển khai được ở nhiều nơi hơn.

Google, Facebook và Apple đang rót nhiều nguồn lực của mình vào các mô hình di động này. Mùa thu năm ngoái, Facebook giới thiệu khung chương trình Caffe2Go để xây dựng các mô hình có thể chạy trên smartphone – bước triển khai lớn đầu tiên của framework này chính là bộ lọc hình ảnh dựa trên kỹ thuật Style Transfer của Facebook.

 

Google giới thiệu bộ API nhận diện đối tượng TensorFlow mới cho lập trình viên 2

Ngoài ra, tại hội nghị nhà phát triển I/O vào đầu năm nay, Google đã phát hành TensorFlow Lite, một phiên bản của khung chương trình máy học tinh gọn. Gần đây nhất tại hội nghị WWDC, Apple cũng giới thiệu CoreML, nỗ lực của họ trong việc giảm mức độ phức tạp của các mô hình máy học đang chạy trên những thiết bị iOS.

Tất nhiên, các dịch vụ đám mây công cộng của Google giúp họ có vị thế khác biệt hơn hẳn so với cả Facebook và Apple, và từ lâu họ đã giới thiệu các dịch vụ tầm nhìn máy tính trên quy mô lớn thông qua bộ API Cloud Vision.

Nếu bạn quan tâm, bạn có thể tìm thấy bộ API nhận diện đối tượng TensorFlow ở đường link sau: https://github.com/tensorflow/models/tree/master/object_detection . Google muốn làm nó trở nên dễ sử dụng hơn bao giờ hết, vì vậy toàn bộ bộ API này đã được đóng gói trước trong một chiếc notebook Jupyter.

Theo Techcrunch

Bài liên quan

Bài đọc nhiều nhất

Bài mới trong ngày

Record Of Ragnarok mùa 3: Khi nào ra mắt và những trận đấu kịch tính nào đang chờ đợi?

Record Of Ragnarok mùa 3: Khi nào ra mắt và những trận đấu kịch tính nào đang chờ đợi?

hoanlagvnDũng Nhỏ TT

Sau khi mùa 2 kết thúc trong sự phấn khích của người hâm mộ, mùa 3 của bộ anime “Record Of Ragnarok” đang nhận được sự mong đợi lớn từ cộng đồng yêu thích thể loại hành động - thần thoại. Hãy cùng điểm qua những thông tin quan trọng về phần tiếp theo này, bao gồm thời gian phát sóng và các cặp đấu hứa hẹn sẽ khuấy đảo màn ảnh nhỏ.

Giải trí
Hai Đội Tuyển Việt Nam Cạnh Tranh Ngôi Vô Địch Thế Giới PUBG Mobile Tại Vòng Chung Kết 2025 PMGC

Hai Đội Tuyển Việt Nam Cạnh Tranh Ngôi Vô Địch Thế Giới PUBG Mobile Tại Vòng Chung Kết 2025 PMGC

Khoa LêLê Khoa

D’Xavier và Team Flash sẽ là hai đại diện của PUBG Mobile Việt Nam nhận vinh dự tranh tài ở Vòng Chung Kết 2025 PMGC - sự kiện Thể thao điện tử toàn cầu đỉnh cao của các bộ môn thể loại sinh tồn cũng như là lễ hội văn hóa hoành tráng đang phủ sóng thành phố Bangkok (Thái Lan).

eSports
Lên đầu trang