Công cụ Open Computer Agent mới của Hugging Face có thể thao tác trên trình duyệt như con người, mở ra tiềm năng ứng dụng rộng rãi trong tương lai.
Open Computer Agent – một sản phẩm trí tuệ nhân tạo mới từ Hugging Face – đang thu hút sự chú ý với khả năng duyệt web tự động, điền form và thực hiện các tác vụ trực tuyến mà không cần người dùng chạm vào chuột. Công cụ này là bước tiến mới trong xu hướng phát triển AI Agent – những trợ lý ảo có thể tương tác với website và ứng dụng thay con người.
AI thao tác như người dùng thực
Open Computer Agent hoạt động dựa trên trình duyệt thực, mô phỏng cách con người sử dụng chuột và bàn phím. Khi được yêu cầu tìm đường đi, nó tự động mở Google Maps, nhập điểm xuất phát và đích đến, sau đó hiển thị kết quả. Tương tự, nó có thể đặt vé, kiểm tra giờ mở cửa cửa hàng hoặc lướt qua các menu website.
“Đây không phải là một sản phẩm hoàn thiện, mà là bản demo minh họa tiềm năng của AI Agent”, Hugging Face nhấn mạnh. Hiện tại, người dùng vẫn phải can thiệp thủ công với các bước như đăng nhập hoặc giải CAPTCHA.
We're launching Computer Use in smolagents! 🥳
— m_ric (@AymericRoucher) May 6, 2025
-> As vision models become more capable, they become able to power complex agentic workflows. Especially Qwen-VL models, that support built-in grounding, i.e. ability to locate any element in an image by its coordinates, thus to… pic.twitter.com/mI8MuWZkIS
Mã nguồn mở – Ưu điểm và hạn chế
Khác với nhiều công cụ AI độc quyền, Open Computer Agent được phát hành miễn phí dưới dạng mã nguồn mở. Điều này cho phép cộng đồng developer tự do chỉnh sửa, phát triển phiên bản phù hợp với nhu cầu riêng. Tuy nhiên, do lượng truy cập lớn, bản demo đang gặp tình trạng delay và lỗi.
Hugging Face không đơn độc trong cuộc đua AI Agent. OpenAI, Opera hay Proxy 1.0 cũng đã giới thiệu các công cụ tương tự. Nhưng điểm khác biệt ở đây là triết lý “smolagents” – tập trung vào những AI nhỏ gọn, linh hoạt thay vì hệ thống phức tạp.
Tương lai của AI Agent
Dù còn non trẻ, Open Computer Agent hứa hẹn trở thành một phần không thể thiếu trong thói quen sử dụng internet. Giống như AI tạo ảnh từng là khái niệm xa lạ vài năm trước, việc AI tự động xử lý tác vụ web có thể sớm trở nên phổ biến.
“Người dùng sẽ không cần tự lọc thông tin hay click từng bước – chỉ một câu lệnh đơn giản là đủ”, một chuyên gia nhận định. Tuy nhiên, thách thức về bảo mật và độ chính xác vẫn cần được giải quyết trước khi công nghệ này được ứng dụng rộng rãi.
Độc giả quan tâm có thể trải nghiệm bản demo của Open Computer Agent trên trang chủ Hugging Face, nhưng hãy kiên nhẫn vì tình trạng quá tải server.