栏目分类
热点资讯
你的位置:科技前沿网 > 创新应用 > OpenAI突发Operator!十足自主玩转浏览器,奥特曼:Level 3时期开启

创新应用

OpenAI突发Operator!十足自主玩转浏览器,奥特曼:Level 3时期开启

发布日期:2025-03-02 06:48    点击次数:65

OpenAI突发Operator!十足自主玩转浏览器,奥特曼:Level 3时期开启

明敏 鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI热炒已久的智能体,刚刚精致发布!

OpenAI官方先容:

Operator是我们的首批智能体之一。这些AI简略沉寂为你完成责任—— 只需给它一个任务,它就会实施。

Operator是我们的首批智能体之一。这些AI简略沉寂为你完成责任—— 只需给它一个任务,它就会实施。

be like,给它一个购物清单,Operator就能十足自主地帮你买好东西。

不错看到操作老哥的双手依然离开键盘,屏幕上的所有操作齐是Operator我方完成。

还能让它来预定餐厅:

张开剩余87%

这边奥特曼直播刚达成,OpenAI总裁Brockman就迫不足待地通告:

2025是智能体之年。

2025是智能体之年。

况兼这一次,Operator官宣即上线——只不外,暂时只面向Pro用户,对,即是一个月200刀 (约合东谈主民币1458元)的阿谁大会员。

看罢直播,网友们还瑕瑜常振作的,直呼“恣意星期四”。

然而嘛……

嗯,Operator很香,但如果开源就更棒了,DeepSeek、Meta快卷起来(doge)。

玩转浏览器,无需东谈主类援手

口说无凭,我们如故先通过官方Demo,来望望Operator到底有多“自作宗派”。

它险些不错使用任何网站,无需东谈主类的操作援手。

比如从Allrecipes上找到一份蛤蜊扁面条的食谱,然后把所有的食材齐放到我instacart的购物车里?

它操作这一切的逻辑和东谈主类不异,看到了哪些图片、该点击哪些按钮。

这和其他使用API或者基于编程接口的Agent不同,它是基于文本的念念维链进行推理。

证明佳肴单后,去哪个店下单买菜呢?

东谈主类进一步给出指示,使用Gus’s,然后Operator就会到对应的网站运转下单。

遭受登录、支付等操作时,Operator会将操作权交还给用户。

在用户实测中,有博主发现如果Operator被Reddit墙了,它还会我方在搜索时就加入“Reddit”要害词以找到联系帖子。

用户也不错通过添加自界说指示,获取个性化体验。比如成就订机票时的首选航司。

Operator允许用户保存辅导,以便在主页上快速访谒,十分符合重迭任务,如在购物网站上补货。

Operator的底层使用了一个全新的模子 Computer-Using-Agent(CUA)。

通过将GPT-4o的视觉智力和高等推理强化学习相谋划,CUA不错进行GUI交互。

Operator不错看到网页界面的施行,使用鼠标、键盘允许的所有操作。由此它不错自动操作,而无需自界说的API集成。

如果遭受问题或者出现纰缪, Operator不错行使推聪慧力自我纠错。并在它卡住需要匡助时,将升天权交还给用户。

CUA在WebArena和WebVoyager两个基准测试中齐取得了SOTA。

刻下,好意思区的Pro会员依然不错通过operator.chatgpt.com来使用Operator。Plus、Team、Enterprise等付用度户和其他地区的胖友们,还得再等等,但OpenAI情愿改日会将这些功能集成到ChatGPT中。

OpenAI迈入“Level 3”

2024年7月,OpenAI发布了“从AI到AGI的五步流程”:

Level 1:Chatbots,AI不错以对话的面容与东谈主互动。

Level 2:Reasoners,AI科技握住东谈主类水平的问题。

Level 3:Agents,AI不错动作系统实施一些行径任务。

Level 4:Innovators,AI不错开垦翻新性的AI。

Level 5:Organizations,AI不错完成一个组织完成的责任。

Level 1:Chatbots,AI不错以对话的面容与东谈主互动。

Level 2:Reasoners,AI科技握住东谈主类水平的问题。

Level 3:Agents,AI不错动作系统实施一些行径任务。

Level 4:Innovators,AI不错开垦翻新性的AI。

Level 5:Organizations,AI不错完成一个组织完成的责任。

在其时的界说和筹备中,OpenAI暗意我方还只处于Level 1阶段,正在围聚Level 2。

而刻下,跟着Operator的发布,奥特曼通告:

这是我们投入Level 3的运转。

这是我们投入Level 3的运转。

值得珍视的是,就像开首提到,OpenAI暗暗画了个重心:Operator还仅仅“ 首批”而非惟一智能体。

在直播中,奥特曼也预报了:

我们还将在改日几周和几个月内推出更多智能体。

我们还将在改日几周和几个月内推出更多智能体。

One More Thing

就在OpenAI今天这场直播之前,还有一个小小的花絮。

Operator发布2小时前,OpenAI发了一条推文,暗意确立了ChatGPT和API纰缪率高的问题。

又虚晃了网友们一枪(doge)。

另一个好音书是,奥特曼还预报,ChatGPT免费版就能用上o3-mini。

— 完—

量子位智库年终发布 三大年度论说!

带你沿路纪念2024年 东谈主工智能、 智能驾驶、 Robotaxi新趋势, 预料2025年科技行业新机遇!

2024年度AI十大趋势论说

Robotaxi2024年度形态论说

智能驾驶2024年度论说

发布于:北京市