Sản phẩm mới từ OpenAI mang tên Operator hứa hẹn sẽ thay đổi cách người dùng tương tác trên internet, với khả năng thực hiện nhiệm vụ một cách tự động.
OpenAI vừa giới thiệu Operator, một AI agent đa năng có khả năng kiểm soát trình duyệt web và thực hiện các nhiệm vụ độc lập. Đây là bước tiến mới nhất của OpenAI sau những thành công của ChatGPT. Hiện tại, Operator được cung cấp dưới dạng bản xem trước nghiên cứu và sẽ triển khai đầu tiên cho người dùng gói Pro trị giá 200 USD/tháng tại Mỹ. OpenAI cũng cho biết sẽ mở rộng tính năng này tới các gói Plus, Team, và Enterprise trong tương lai.
Operator không chỉ là một công cụ thông thường. AI này có thể tự động thực hiện nhiều tác vụ như đặt vé du lịch, đặt bàn tại nhà hàng, hoặc mua sắm trực tuyến. Người dùng có thể kích hoạt Operator qua một cửa sổ trình duyệt riêng biệt, nơi AI thực hiện các hành động và cung cấp giải thích chi tiết về từng bước.
Công nghệ đột phá đằng sau Operator
Operator được phát triển dựa trên mô hình Computer-Using Agent (CUA), kết hợp khả năng xử lý hình ảnh của GPT-4o với khả năng lập luận từ các mô hình AI tiên tiến khác. Điều này cho phép AI tương tác trực tiếp với giao diện trang web giống như con người, thay vì cần các API do nhà phát triển cung cấp.
Điểm nổi bật của Operator là sự hợp tác với các công ty lớn như DoorDash, eBay, Instacart và Uber để đảm bảo tuân thủ các điều khoản dịch vụ của họ. Hơn nữa, hệ thống luôn yêu cầu người dùng xác nhận trước khi thực hiện các hành động có ảnh hưởng bên ngoài, như gửi email hay đặt hàng.
Những giới hạn hiện tại của Operator
Mặc dù mang đến nhiều tiềm năng, Operator vẫn tồn tại một số hạn chế. OpenAI thừa nhận rằng AI này chưa đủ mạnh để xử lý các tác vụ phức tạp như tạo slide trình bày chi tiết hay quản lý hệ thống lịch biểu phức tạp. Ngoài ra, Operator cần người dùng giám sát các nhiệm vụ nhạy cảm như nhập thông tin thẻ tín dụng hoặc tương tác với các giao diện web phi chuẩn.
Hơn nữa, AI có thể gặp khó khăn khi đối mặt với các trường hợp như CAPTCHA hoặc các trường mật khẩu phức tạp. Khi đó, Operator sẽ yêu cầu người dùng can thiệp để tiếp tục nhiệm vụ.

Tương lai của AI tự động hóa
Operator không chỉ là sản phẩm của công nghệ mà còn là bước tiến chiến lược trong việc đưa AI vào thực tiễn cuộc sống. Theo OpenAI, sản phẩm này được thiết kế để giảm thiểu nguy cơ bị lạm dụng, với hệ thống giám sát tự động và con người nhằm đảm bảo an toàn cho người dùng. Các công cụ bảo mật cũng được tích hợp để hạn chế khả năng AI bị khai thác cho mục đích xấu, như tấn công mạng hoặc lừa đảo trực tuyến.
Dù mới chỉ là bước khởi đầu, Operator đánh dấu nỗ lực lớn nhất của OpenAI trong việc đưa AI từ vai trò cung cấp thông tin sang thực hiện hành động thực tế. Với tiềm năng thay đổi cách con người sử dụng internet, Operator có thể trở thành nhân tố quan trọng trong tương lai của công nghệ AI.