栏目分类
热点资讯
你的位置:科技前沿网 > 创新应用 > AI算力开销超140亿,DeepSeek遭受好意思国OpenAI全新o3-mini模子反击|钛媒体AGI

创新应用

AI算力开销超140亿,DeepSeek遭受好意思国OpenAI全新o3-mini模子反击|钛媒体AGI

发布日期:2025-03-10 05:21    点击次数:126

AI算力开销超140亿,DeepSeek遭受好意思国OpenAI全新o3-mini模子反击|钛媒体AGI

(图片来源:钛媒体AGI剪辑林志佳拍摄)

中国AI模子DeepSeek激勉的全球筹商高涨抓续近半个月,好意思国OpenAI公司终于发布新模子对此进行“反击”。

北京时辰2月1日凌晨,OpenAI CEO奥尔特曼(Sam Altman)在 2 周前预报后,今天在ChatGPT和API工作中推出 AI 推理模子o3-mini,性能反应速率比o1-mini擢升 24%,谜底准确性也有所提高。

面前ChatGPT免用度户初度不错体验一个有限速率的o3-mini版块,速率法律解释与现存的 GPT-4o 法律解释肖似;Plus用户可选拔o3-mini-high更高智能版块;每月支付200好意思元的 Pro 用户可无尽使用o3-mini和o3-mini-high;API层面,o3-mini输入1.10好意思元/百万token、输出4.40好意思元/百万token,价钱比o1-mini低廉63%,比满血版o1低廉93%,但仍是GPT-4o mini的7倍控制。

OpenAI默示,o3-mini的发布是在追求高服从智能技巧说念路上的又一蹙迫里程碑。通过优化科学(Science)、技巧(Technology)、工程(Engineering)和数学(Mathematics)范围的推奢睿力,同期保抓较低的成本,让高质料AI技巧变得愈加夷易近东说念主。

事实上,以前一周内,DeepSeek R1和V3两款开源 AI 模子皆颠覆寰宇对于“方法定律”(Scaling Law)的观念,其模子的优异阐述以及不足OpenAI近1/20的算力成本令OpenAI里面回荡,而且让华尔街驱动质疑 AI 公司是否需要在算力成本插足多量资金已毕AGI模子迭代,英伟达股价通宵暴跌17%,亏欠近6000亿好意思元市值。

关系词,据SemiAnalysis,与外界以为DeepSeek公司领有5万张H100 GPU筹画卡观念不同,该机构以为,DeepSeek堆积了6万张英伟达GPU卡,其中包括1万张H100、1万张H100、1万张“特供版”H800、3万张“特供版”H20,算力成本开销的总体领有成本(TCO)杰出140亿元,达19.96亿好意思元(约合东说念主民币143.45亿好意思元)。其中,CapEx总工作器成本开销12.81亿元、运营成本7.15亿好意思元。

要知说念,英伟达以前一年内才出产100万张“特供版”GPU卡。

最新音信是,OpenAI正在进行新一轮400亿好意思元的融资,软银将领投,公司价值高达3000亿好意思金(约合东说念主民币2.16万亿元),对此OpenAI并未置评。

而在o3mini细腻推出之时,奥特曼今晨在回答网友问题时,忽视承认OpenAI 以前在开源方面一直站在“历史失误的一边”。他默示,“我个东说念主以为,咱们在这里站在了历史的失误一边,需要找出一个不同的开源策略。OpenAI中并非统统东说念主皆认可这一不雅点,这也不是咱们面前的最高优先事项。”这意味着,OpenAI正在商量开源。

那么,跟着DeepSeek好评如潮,OpenAI 这个昔日AI霸主怎样对战?140亿(算力)VS 2.16万亿(公司价值),一场围绕中国、好意思国两家有实力的 AI 公司干戈也曾打响。

模子转向后测验和算法,300万好意思金的AI智力也能超GPT

追念以前4年,“DeepSeek诞生者”梁文锋率领200多东说念主的团队围绕 AI 大模子进行深入研发。

由于DeepSeek背后的幻方量化是国内少数领很是百亿处置范围的量化私募基金机构,既不缺钱又不融资,以至DeepSeek莫得准备作念To B/To C生意化,手里的万卡算力也莫得作念云筹画生意。

东说念主才层面,DeepSeek面前约有不到200名研发东说念主员,况兼只从中国招聘东说念主才,不敬重过往阅历,高度关注智力和修业欲,据称为研发东说念主员提供最精好意思过130万好意思元的年薪,远超中国其他科技大厂,以及“大模子六小虎”这类 AI 创业公司。

简便来说,梁文锋以为的DeepSeek,即是兴趣心驱使,不需要靠大模子成绩,只为鼓吹AGI(通用东说念主工智能)。因此,基于梁文锋对于高端算力法律解释的需求,DeepSeek继续堆砌数万张英伟达 AI 算力卡。

SemiAnalysis称,即便商量到出口不停身分,DeepSeek和幻方在GPU上的投资也杰出5亿好意思元。

从驱逐上来看,这种“降本增效”的后果是很好的:DeepSeek V3模子统统这个词测验在2048块英伟达H800 GPU集群上完成,仅奢华57天、估计约557.6万好意思元,不到其他顶尖模子测验成本的十分之一;最新的开源多模态模子Janus-Pro-7B用256张英伟达A100 GPU卡测验了14天,最少的10亿参数模子用128张英伟达A100测验7天,成本仅数千好意思金。

这种低成本滚动模子智力和应用落地,与所谓的“杰文斯悖论”(Jevons Paradox)时势有些肖似。

“杰文斯悖论”是由英国经济学家威廉·斯坦利·杰文斯(William Stanley Jevons)在1865年发现的蹙迫时势:蒸汽机效率的提高并非减少了,而是导致了对煤炭需求的抓续增长,这是因为高效的蒸汽机渐渐进入了社会出产的每一个边缘。

因此,相较于OpenAI GPT-4这类大言语模子(LLM),不管是GPT-o1、o3系列,照旧DeepSeek R1,中枢即是用更低的成本已毕更高的(推理)模子性能和更多的智能想维智力。而筹画智力越强,推理模子就不错想考更多方法,从而提高得出正确谜底的可能性,在这其中,算力软件优化成为要津要素。

清华大学筹画机系长聘阐述、高性能筹画不绝所长处、清程极智首席科学家翟季冬默示,DeepSeek在MoE架构算法、系统软件头绪作念了许多窜改,它给咱们的启示,更多在于如安在有限的算力情况下,通过算法和软件的协同窜改,充分挖掘硬件的极致性能,对中国改日发展 AI 产业至关蹙迫。

翟季冬以为,在预测验模子完成后,还有一个很蹙迫的阶段即是后测验(post training)。以OpenAI o1/o3 为代表的后测验技巧,为统统这个词测验流程带来了新的挑战。此后测验包括生成阶段、推理阶段和微调阶段,每个阶段的负载特质皆不同,最优的并行策略也会不同,弗成简便地追求每个阶段的局部最优,因为阶段之间的切换也会产生开销。咱们要从统统这个词pipeline(管说念)的角度来商量优化策略。后测验还濒临着负载不平衡的问题,需要探索怎样有用重复不同阶段以提高资源应用率。

如今,o3 mini和DeepSeek R1皆使用多量监督微调 (SFT)、强化学习 (RL) 、合成数据以及稀疏化MoE等智力。

苹果公司不绝团队和麻省理工学院的攀附者 Harshay Shah近期共同发表的《参数与 FLOPs:夹杂巨匠言语模子最优稀疏度的缩放定律》自满,包括DeepSeek 和其他最近窜改在内,稀疏性是这类模子发展的要津要素,证明DeepSeek通过关闭越来越多的会聚部分,在筹画智力较低的情况下达到相易或更好的驱逐,因为蹙迫的是模子的稀疏性,它能找到AI模子和可用筹画之间的最好匹配。

很彰着,有用使用有限的筹画智力,将模子发展的要津要素。

AI独角兽零一万物独创东说念主兼CEO李开复曾默示,当今一个模子测验只用了2000张GPU,测验周期仅一个半月,成本只须300多万好意思元,是马斯克的xAI成本的1%、2%。

举座来说,正如SemiAnalysis所讲,到面前为止,这种“降本增效”花式的驱逐是,每年算法的杰出速率快4倍,这意味着每过一年,已毕相易功能所需的筹画量就会减少4倍。举座来说,成本随时辰变化,算法的纠正和优化使成本裁减了10倍,而智力提高了数倍。

Anthropic首席实施官Dario Amodei以为,算法的杰出速率更快,不错带来10倍的纠正。就GPT-3质料的推理订价而言,成本已下落了1200倍。

OpenAI准备开源?竣工版o3最快几周内上线

事实上,大模子推理成本的下落是一个势必趋势。OpenAI在发布o3 mini时默示,其团队裁减了token价钱。自推出GPT-4以来,每个token的价钱裁减了95%,但同期保抓了顶级的推奢睿力。

“是的,咱们在筹商。我个东说念主以为咱们在某些方面可能站错了历史的一边,需要找出不同的开源策略;并不是统统来自OpenAI的东说念主皆抓有这种不雅点,这也不是咱们面前的最高优先事项。”

这是奥尔特曼初度正面承认OpenAI的闭源“是一个失误”。在DeepSeek高涨刺激下,奥尔特曼终于野心把推理o1,或基座GPT模子进行开源,在一定进程上,这将是一个摧毁性事件。

今晨发布的o3-mini模子,主要包括高、中、低三个版块,莫得想考技巧——奥尔特曼称将很快上线。

OpenAI默示,o3-mini模子擅长科学、数学和编码,测试东说念主员在56%的时辰里更心爱o3-mini的回答,并不雅察到在贫穷的施行问题上要紧失误减少了 39%。在中等推理奋力下,o3-mini在一些最具挑战性的推理和智力评估(包括 AIME 和 GPQA)上的阐述与o1相称。因此,与o1-mini比较,o3-mini的谜底更准确、更了了,推奢睿力更强。

左证OpenAI发布对于o3-mini不绝论文自满,OpenAI o3-mini已在各式数据集上进行了预测验,其中包括多种公开数据,以及里面开拓的定制数据集,因此,OpenAI o3-mini 在某些基准上的阐述与来源进的⽔平相称。通过筹商允许用户使⽤ChatGPT o3-mini 搜索互联⽹并汇总驱逐,OpenAI但愿o3-mini成为⼀个有⽤且安全的模子。

幻觉方面,OpenAI有深远,o3-mini PersonQA 幻觉率(越低越好)低至14.8%,比4o的52%幻觉率大大裁减,但PersonQA准确率却莫得尽头“缩水”。o3-mini举座阐述与OpenAI o1-mini⽐较相通,但在暧昧性问题的准确性、明确问题的准确性上均略有下落。

OpenAI API不绝主宰Michelle Pokrass默示:“咱们发现o3-mini与好意思国托管的Deepseek版块比较具有竞争力。咱们以为对于这种级别的智能来说,这是一个真实实惠的选拔。”

谈及DeepSeek,奥尔特曼在Reddit回答中默示,“这是一个相称好的模子!咱们将出产出更好的模子,但最初上风将比前几年有所松开。”

那么,OpenAI管帐划提高plus会员的价钱吗?奥尔特曼恢复称:“本色上我想跟着时辰的推移减少它。”

对于竣工版o3模子发布时辰,奥尔特曼一如既往驱动画饼:“我猜会是几周以上,几个月以下。”

对于许多东说念主皆柔柔的GPT-5,奥尔特曼默示还没偶而辰表,但会有一些行将发布如高等语音花式的更新。

“是的,高等语音花式的更新行将到来!我以为咱们会称之为 GPT-5 而不是 GPT-5o。(GPT-5)还没偶而辰表。”奥尔特曼称。

面前,DeepSeek正濒临好意思国政企等各方面的走访承压。其中,微软和OpenAI皆已驱动走访DeepSeek是否遴选其模子数据;好意思国总统特朗普申饬称,DeepSeek为好意思国科技行业敲响了警钟,需要对好意思国AI洞开、抓续法律解释对华AI半导体出口;而好意思国商务部、好意思国议员皆纷繁条目走访DeepSeek,以及抓续法律解释半导体出口不停。

Dario Amodei近期发文默示,DeepSeek最新模子在特定基准测试中已靠近好意思国顶尖水平,基于此,他坦承,DeepSeek 的摧毁正在倒逼好意思国从头评估技巧闭塞战术的有用性,“我以为DeepSeek的进展反而令出口不和谈术显得比一周前更具存提神思意思上的蹙迫性。”在Dario看来,好意思国要在 AI 发展中保抓最初地位,力所能及的情况下,好意思国不应将技巧上风拱手让给中国。

在全球看来,对DeepSeek,中好意思的反应最好皆限制冷却。对中国来说,要在庆祝和自重的同期警惕危急,防护媒体和社会的“捧杀”;对好意思国而言,要客不雅感性看待DeepSeek的得手,用本色步履进行竞争,不管是OpenAI o3-mini,照旧阿里通义新模子,皆证明了这少量。

DeepSeek对于中国来说无疑是要紧的新年礼物,如今只须+86手机号才能注册,这将对好意思国来说产生“壁垒”。

不管中好意思两国怎样博弈,但以前一周的公论场,也曾对中好意思下一阶段 AI 竞争产生了深远影响。

中欧海外工商学院决议科学与处置信息系统阐述谭寅亮对钛媒体AGI默示,对于DeepSeek这么的产物来说,其得手更多依赖于高效的算力调整和模子优化智力,而非单纯堆积硬件资源。因此,出口不停等外部法律解释可能影响行业发展速率,但并不一定会辞让原土大模子的恒久竞争力和全球化膨胀。

“DeepSeek的得手标明,中国企业在AI应用层面和用户体验上具有远大的窜改智力,尤其是在产物快速迭代和市集化方面更具上风。这为中国在全球AI竞争中提供了蹙迫的信心,尽头是在C端市集阐述上,中国团队对用户需求的深刻颐养起到了要津作用。但从技巧底层来看,好意思国在基座模子和前沿不绝上的抓续最初仍是蹙迫赞助,举座竞争神志依然呈现‘底层技巧好意思国强、应用场景中国快’的场面。DeepSeek的崛起进一步鼓吹了这种竞争的动态化发展。”谭寅亮默示。

(本文首发于钛媒体App,作家|林志佳,剪辑|胡润峰)