Google Đột Phá Với AI Robot Có Thể Hoạt Động Không Cần Đến Đám Mây

Google vừa công bố một bước tiến quan trọng trong lĩnh vực robot thông minh với phiên bản AI mới có thể hoạt động hoàn toàn độc lập mà không cần kết nối đám mây. Đột phá này hứa hẹn mở ra kỷ nguyên mới cho các thiết bị robot tự hành.

AI Đa Năng Trên Thiết Bị – Tương Lai Của Ngành Robot

Theo Carolina Parada, trưởng bộ phận robot tại Google DeepMind, mô hình VLA (Vision Language Action) mới này cho phép robot hiểu và tương tác với thế giới thực theo cách chưa từng có. Khác với các hệ thống trước đây phụ thuộc vào xử lý đám mây, phiên bản mới hoạt động hoàn toàn trên thiết bị, mang lại khả năng phản ứng nhanh và độ tin cậy cao hơn.

Điều đặc biệt là đây cũng là phiên bản đầu tiên cho phép các nhà phát triển tùy chỉnh mô hình cho các ứng dụng cụ thể của họ. “Nó kế thừa khả năng hiểu biết đa phương thức của Gemini để thực hiện những nhiệm vụ hoàn toàn mới”, Parada giải thích.

Robot Thông Minh Hơn, Phản Ứng Nhanh Hơn

Trước đây, các hệ thống robot AI thường sử dụng mô hình kết hợp: một mô hình nhỏ chạy trên thiết bị và mô hình lớn hơn xử lý trên đám mây. Tuy nhiên, cách tiếp cận này khiến robot phản ứng chậm vì phải chờ xử lý từ xa. Với phiên bản mới, robot có thể:

  • Xử lý tức thì các lệnh đơn giản như buộc dây giày, gấp quần áo
  • Hoạt động trong môi trường không có kết nối mạng ổn định
  • Đảm bảo tính riêng tư khi xử lý dữ liệu hình ảnh tại chỗ

Theo Google, mô hình mới chỉ kém chính xác hơn một chút so với phiên bản kết hợp đám mây, nhưng vẫn đủ khả năng xử lý đa số tác vụ cơ bản.

Đào Tạo Robot: Từ Lý Thuyết Đến Thực Hành

Google đã phát hành bộ SDK đầy đủ để các nhà phát triển có thể huấn luyện robot cho các tác vụ mới. Đáng chú ý là quá trình “biểu diễn” trong AI robot khác biệt so với các lĩnh vực AI khác.

“Chúng tôi điều khiển robot thủ công để hoàn thành nhiệm vụ, từ đó giúp mô hình học cách xử lý công việc đó một cách tự động”, Parada chia sẻ. Mặc dù dữ liệu tổng hợp là một phần của quá trình đào tạo, nhưng với những hành vi phức tạp đòi hỏi sự khéo léo, dữ liệu thực tế vẫn là yếu tố không thể thay thế.

An Toàn Vẫn Là Ưu Tiên Hàng Đầu

Google áp dụng cách tiếp cận đa tầng để đảm bảo an toàn cho hệ thống robot Gemini. Phiên bản đầy đủ bao gồm:

  • Mô hình đánh giá độ an toàn của hành động
  • VLA tạo ra các lựa chọn thực thi
  • Bộ điều khiển cấp thấp kiểm soát các yếu tố an toàn quan trọng

Tuy nhiên, với phiên bản trên thiết bị chỉ bao gồm VLA, các nhà phát triển sẽ cần tự triển khai các biện pháp an toàn bổ sung. Google khuyến nghị kết nối với API Gemini Live tiêu chuẩn (có tích hợp lớp bảo mật) và triển khai bộ điều khiển cấp thấp để kiểm tra an toàn.

Những ai quan tâm đến việc thử nghiệm Gemini Robotics On-Device có thể đăng ký tham gia chương trình người dùng thử nghiệm đáng tin cậy của Google. Theo Parada, đây mới chỉ là khởi đầu của một kỷ nguyên mới trong phát triển robot thông minh.

Chỉ mục