OpenAI突发Operator!十足自主玩转浏览器,奥特曼:Level 3时期开启
发布日期:2025-03-02 06:48 点击次数:65
明敏 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI
OpenAI热炒已久的智能体,刚刚精致发布!
OpenAI官方先容:
Operator是我们的首批智能体之一。这些AI简略沉寂为你完成责任—— 只需给它一个任务,它就会实施。
Operator是我们的首批智能体之一。这些AI简略沉寂为你完成责任—— 只需给它一个任务,它就会实施。
be like,给它一个购物清单,Operator就能十足自主地帮你买好东西。
不错看到操作老哥的双手依然离开键盘,屏幕上的所有操作齐是Operator我方完成。
还能让它来预定餐厅:
张开剩余87%这边奥特曼直播刚达成,OpenAI总裁Brockman就迫不足待地通告:
2025是智能体之年。
2025是智能体之年。
况兼这一次,Operator官宣即上线——只不外,暂时只面向Pro用户,对,即是一个月200刀 (约合东谈主民币1458元)的阿谁大会员。
看罢直播,网友们还瑕瑜常振作的,直呼“恣意星期四”。
然而嘛……
嗯,Operator很香,但如果开源就更棒了,DeepSeek、Meta快卷起来(doge)。
玩转浏览器,无需东谈主类援手
口说无凭,我们如故先通过官方Demo,来望望Operator到底有多“自作宗派”。
它险些不错使用任何网站,无需东谈主类的操作援手。
比如从Allrecipes上找到一份蛤蜊扁面条的食谱,然后把所有的食材齐放到我instacart的购物车里?
它操作这一切的逻辑和东谈主类不异,看到了哪些图片、该点击哪些按钮。
这和其他使用API或者基于编程接口的Agent不同,它是基于文本的念念维链进行推理。
证明佳肴单后,去哪个店下单买菜呢?
东谈主类进一步给出指示,使用Gus’s,然后Operator就会到对应的网站运转下单。
遭受登录、支付等操作时,Operator会将操作权交还给用户。
在用户实测中,有博主发现如果Operator被Reddit墙了,它还会我方在搜索时就加入“Reddit”要害词以找到联系帖子。
用户也不错通过添加自界说指示,获取个性化体验。比如成就订机票时的首选航司。
Operator允许用户保存辅导,以便在主页上快速访谒,十分符合重迭任务,如在购物网站上补货。
Operator的底层使用了一个全新的模子 Computer-Using-Agent(CUA)。
通过将GPT-4o的视觉智力和高等推理强化学习相谋划,CUA不错进行GUI交互。
Operator不错看到网页界面的施行,使用鼠标、键盘允许的所有操作。由此它不错自动操作,而无需自界说的API集成。
如果遭受问题或者出现纰缪, Operator不错行使推聪慧力自我纠错。并在它卡住需要匡助时,将升天权交还给用户。
CUA在WebArena和WebVoyager两个基准测试中齐取得了SOTA。
刻下,好意思区的Pro会员依然不错通过operator.chatgpt.com来使用Operator。Plus、Team、Enterprise等付用度户和其他地区的胖友们,还得再等等,但OpenAI情愿改日会将这些功能集成到ChatGPT中。
OpenAI迈入“Level 3”
2024年7月,OpenAI发布了“从AI到AGI的五步流程”:
Level 1:Chatbots,AI不错以对话的面容与东谈主互动。
Level 2:Reasoners,AI科技握住东谈主类水平的问题。
Level 3:Agents,AI不错动作系统实施一些行径任务。
Level 4:Innovators,AI不错开垦翻新性的AI。
Level 5:Organizations,AI不错完成一个组织完成的责任。
Level 1:Chatbots,AI不错以对话的面容与东谈主互动。
Level 2:Reasoners,AI科技握住东谈主类水平的问题。
Level 3:Agents,AI不错动作系统实施一些行径任务。
Level 4:Innovators,AI不错开垦翻新性的AI。
Level 5:Organizations,AI不错完成一个组织完成的责任。
在其时的界说和筹备中,OpenAI暗意我方还只处于Level 1阶段,正在围聚Level 2。
而刻下,跟着Operator的发布,奥特曼通告:
这是我们投入Level 3的运转。
这是我们投入Level 3的运转。
值得珍视的是,就像开首提到,OpenAI暗暗画了个重心:Operator还仅仅“ 首批”而非惟一智能体。
在直播中,奥特曼也预报了:
我们还将在改日几周和几个月内推出更多智能体。
我们还将在改日几周和几个月内推出更多智能体。
One More Thing
就在OpenAI今天这场直播之前,还有一个小小的花絮。
Operator发布2小时前,OpenAI发了一条推文,暗意确立了ChatGPT和API纰缪率高的问题。
又虚晃了网友们一枪(doge)。
另一个好音书是,奥特曼还预报,ChatGPT免费版就能用上o3-mini。
— 完—
量子位智库年终发布 三大年度论说!
带你沿路纪念2024年 东谈主工智能、 智能驾驶、 Robotaxi新趋势, 预料2025年科技行业新机遇!
2024年度AI十大趋势论说
Robotaxi2024年度形态论说
智能驾驶2024年度论说
发布于:北京市