通信世界网消息(CWW)1月23日晚,OpenAI宣布推出最新AI Agent工具Operator。OpenAI表示Operator可以自动执行预订旅行住宿、预订餐厅和在线购物等任务。用户可以在Operator界面中选择多个任务类别,包括购物、送货、餐饮和旅行。
据悉,在核心功能与创新方面,Operator依托全新的Computer-Using Agent(CUA)模型,结合GPT-4o的视觉能力与强化学习驱动的推理能力,能与图形用户界面(GUI)交互,可实现表单填写、订购杂货、制作表情包等任务自动化处理,无需定制API,极大扩展了AI应用范围。用户能在Operator界面选择购物、送货、餐饮和旅行等多个任务类别,还可个性化工作流,如设置网站偏好或保存常用提示。
此外,Operator在WebArena和WebVoyager等关键浏览器交互测试中取得行业标杆成绩,但在创建幻灯片或管理日历等复杂任务上存在一定局限。
在隐私与安全保障方面,OpenAI强调Operator在隐私与安全设计上有三层防护。
一是用户优先控制,在处理登录凭据等时采用接管模式,重要操作需用户确认,还拒绝处理高风险任务。
二是数据管理透明,用户可关闭相关选项确保数据不用于模型训练,还能一键清除浏览数据等。
三是对抗恶意行为,可检测并忽略提示注入等行为,有专属监控模型和人工审查系统监测潜在威胁。
不过,OpenAI也承认该系统仍存在错误或滥用风险,将持续优化。
下一步,OpenAI计划将支持Operator的CUA模型开放至API,方便开发者构建自定义AI代理工具。同时,持续提升Operator执行更复杂任务的能力,未来会向Plus、Team和Enterprise用户开放,并逐步整合至ChatGPT,支持实时和异步任务处理。
此外,OpenAI正与DoorDash、Instacart、Uber等企业合作,探索电商、物流等领域应用,例如与加州斯托克顿市(City of Stockton)协作,简化市民注册服务的流程。
目前,Operator处于预览版状态,仅提供给美国Pro用户使用,很快会扩大应用范围。