OpenAI首个AI智能体来了,可自主帮东谈主订餐购物
发布日期:2025-03-03 06:16 点击次数:195
界面新闻记者 | 宋佳楠
AI智能体正在加快尝试代替东谈主类去作念一些“力所能及”的事情。
当地时刻1月23日,OpenAI发布了首个AI智能Operator。据该公司CEO奥特曼先容,这款智能体能像东谈主类同样使用网页浏览器,并点击按钮、打字输入内容等,能自动完成预订旅行住宿、餐厅预约、在线购物等复杂任务。
不仅如斯,系统还赈济多任务并行科罚,比如在某购物网站上订购珐琅马克杯之时,也能同步在另一平台预定露营地。
Operator赈济个性定制,用户可为特定网页或全站添加自界说教导,并在主页保存,完毕跨聊天窗口的多任务科罚,如诞生订机票时的首选航司等。
其本事旨趣主要由Computer-Using Agent(CUA)模子驱动,并聚首了GPT-4o的视觉识别才能和基于强化学习的高档推理功能,使得Operator能 “看见” 网页,使用鼠标和键盘与网页互动。
现在,Operator征询预览版最初向订阅200好意思元Pro筹划的好意思国用户绽放,后续将缓缓膨胀至Plus、Team和 Enterprise级别用户。OpenAI示意,但愿很快将Operator集成到其总共ChatGPT欺诈中。
从现存体验来看,Operator在基础网页操作和近似性任务方面施展出色,如搜索筛选、创建购物清单和音乐播放列表等任务奏效力较高。但在科罚复杂的房产搜索等任务时,奏效力相对较低;在科罚不熟习的UI界面和文本裁剪时施展欠佳。
在发布演示和用户测试中,Operator出现了网页无法奏效加载等情况,标明其在运行表露性上存在不及。此外,由于部分网站可能会屏蔽AI走访,导致智能体无法在这些网站上施行任务,使其欺诈鸿沟受到一定完毕。
据OpenAI方面先容,这款智能体在WebArena测试中得分58.1%,而在WebVoyager测试中实际网站导航奏效力达87%,OSWorld测试的得分则为38.1%。WebArena是由卡耐基梅隆大学等机构推出的一项用于测试智能代理在蚁合环境中施行任务才能的测试。WebVoyager测试主要在亚马逊、开源网站GitHub和谷歌舆图等真确网站上测试模子的性能。而OSWorld测试用于评估模子限度Windows和macOS等完整操作系统的才能。
尽管还谈不上完整,但“这款家具是咱们进攻智能体规模的启动。”奥特曼在直播中这么示意。
不错说,Operator是OpenAI向通用东谈主工智能(AGI)估量迈进的紧要一步,也将进一步增强该公司在AI规模的竞争力。但筹商到Operator在代替用户施行任务时可能需要输入敏锐信息,若何幸免潜在安全风险将成为紧要问题。