栏目分类
热点资讯
你的位置:科技前沿网 > 数字趋势 > 英伟达市值挥发创记载,DeepSeek掀翻AI算力创新意味着什么?|甲子光年

数字趋势

英伟达市值挥发创记载,DeepSeek掀翻AI算力创新意味着什么?|甲子光年

发布日期:2025-03-06 06:27    点击次数:113

英伟达市值挥发创记载,DeepSeek掀翻AI算力创新意味着什么?|甲子光年

AI算力的“武备竞赛”逻辑,正在被中国公司的算法创新改写。

作家| 王博 王艺

AI规模的Killer App(杀手级应用)出现了。

国产DeepSeek-R1模子发布不到一周,就让发布不到12天的DeepSeek App冲到了苹果APP store国区和好意思区免费总榜的第别称。

DeepSeek也引爆了海表里的酬酢网站,比较DeepSeek-R1刚发布时的多数时期分析和圈内征询,这次更多是用户的施行使用体验——DeepSeek破圈了。

游戏科学首创东谈主、CEO,《黑据说:悟空》制作主谈主冯骥直呼:“DeepSeek,可能是个国运级别的科技效果。”

伸开剩余91%

图片着手:冯骥 微博账号

微软CEO萨提亚·纳德拉(Satya Nadella)在X上发帖称:“跟着东谈主工智能越来越高效,越来越容易获取,咱们将看到它的使用率急剧飞腾,成为咱们用之不尽的商品。”而网友则径直给他留言:“这要归功于DeepSeek。”

图片着手:Satya Nadella X账号

咱们跟好多东谈主聊过Killer App,也设计过Killer App产生的条目和场景,从第一性旨趣来说,Killer App的出现离不开模子智力的爆发。

但模子智力爆发后,要是等闲东谈主用不到也很难称之为Killer App,比如需要付费才可使用接入了OpenAI o1模子的ChatGPT。DeepSeek-R1对处所等于OpenAI o1,而DeepSeek-R1开源、免费。

ChatGPT收费机制,图片着手:OpenAI

DeepSeek的爆火告诉扫数东谈主, 一个会念念考、够精明、易使用且免费的AI应用等于Killer App。

在甲辰龙年的末尾,DeepSeek给AI行业添上了切中时弊的一笔。

但英伟达CEO黄仁勋的年怕是过不好了,适度好意思东时期1月27日上昼11点, 英伟达股票一度下挫进步13%,市值挥发约4650亿好意思元,创了好意思股市值挥发记载。

英伟达股票走势,图片着手:Nasdaq

DeepSeek的时期性情「甲子光年」在一文中有过分析。其真的性能和开源除外,DeepSeek更让硅谷惊骇的,是其R1模子通过从头设计磨砺经过, 在保持高准确性的同期权贵镌汰了内存占用和计议开销,仅用了少许的低端GPU(以A100为主)就完了了高端GPU(以H100为代表)才有的性能, 这为正本以算力为中枢逻辑驱动的大模子行业开辟了新的谈路。

硅谷科技圈反映过来了,X上不少网友惊呼:DeepSeek是在戳好意思股泡沫啊,是在革英伟达的命啊!

一位名为Kakashiii网友发表暴论:“英伟达的一切齐将运转剖判。”当今,该帖文阅读量已进步130万次。

备注:Magnificent 7指的是Apple、Amazon、Microsoft、Alphabet、Meta、Tesla、NVIDIA这七大巨头,图片着手:@kakashiii111 X账号

一朝大模子企业不再囤卡,不再搞算力的武备竞赛,英伟达的“壁垒”还会幽静吗?

1.进犯的DeepSeek

kakashiii的话并不是骇东谈主闻听。

一直以来,Scaling Law(规模章程)齐是大模子发展的中枢定律,大厂之间算力的武备竞赛也从未罢手。微软、谷歌、Meta、亚马逊等大厂离别领有几十到上百万块H100,马斯克也屡次示意算力决定存一火,为旗下的xAI搭建了10万卡的磨砺集群。

然而DeepSeek展现了“隐痛的东方力量”,其在最近的一个月内接连发布了DeepSeek-V3基座模子和DeepSeek-R1系列推理模子。

其中,DeepSeek-V3仅用2048块英伟达H800 GPU和557.6万好意思元的成本,便完成了6710亿参数模子的磨砺,而同等规模的GPT-4磨砺成本高达10亿好意思元;

DeepSeek-R1则通过从头设计磨砺经过、以“少许SFT数据+多轮强化学习”的办法,在提高了模子准确性的同期,也权贵镌汰了内存占用和计议开销——百万输入 tokens 1 元(缓存射中)/ 4 元(缓存未射中),每百万输出tokens 16元,纵情是 OpenAI o1运行成本的三很是之一。

不错说,算法结构的优化,让DeepSeek完了了系数的“降本增效”,径直对AI行业“堆砌算力”的既有样子发起了冲击。

「甲子光年」分析,这一时期旅途的篡改将带来两大影响。

AI初创企业生涯样子将会计议。一些依赖高价GPU集群的AI企业可能因成本破绽歇业,导致二手阛阓GPU供给激增,中小AI企业将会更倾向去购买更低廉的低端GPU。

硬件需求也将迎来结构性转机。从前年运转,以磨砺为主导的算力需求就在向推理侧转机,而今后,这种趋势还将络续,多数中小AI企业将不再磨砺基座模子,转而投向DeepSeek这么的开源模子的怀抱。英伟达在磨砺阛阓的地位也将濒临价值重估。

2.撺拳拢袖的AMD

DeepSeek的时期打破巧合成为AMD挑战英伟达的“杠杆”。

1月25日,AMD晓示在其Instinct MI300X GPU上集成了全新的DeepSeek-V3模子,并与SGLang集成。这意味着AMD将连续DeepSeek共建ROCm开源框架,通过优化推感性能和英伟达争夺阛阓份额。

图片着手:AMD X账号

ROCm(Radeon Open Compute Platform)是AMD建筑的一个开源软件平台,旨在为高性能计议(HPC)、东谈主工智能(AI)和机器学习(ML)提供撑持。它允许建筑者在AMD的GPU上运行并行计议任务,一样于NVIDIA的CUDA平台。

此前,好意思国初创云基础门径企业TensorWave就与AMD的相助,通过时骗AMD的硬件和ROCm软件平台,为AI用户提供更为浅薄和高效的计议科罚有研究。

TensorWave连续首创东谈主兼CEO达里克·霍顿(Darrick Horton)前年10月告诉科技媒体TechCrunch,AMD MI300X的价钱要比英伟达H100低廉得多,何况基准测试裸露,MI300X在运行(但不磨砺)AI模子时性能越过了H100,格外是在Llama 2这么的文本生成模子上。

就在AMD晓示在其Instinct MI300X GPU上集成了全新的DeepSeek-V3模子后,TensorWave官方X账号就转发了AMD东谈主工智能和镶嵌式营销崇敬东谈主布莱恩·马登(Bryan Madden)的辩驳“要是您想拜访MI300X集群,请与咱们的一又友TensorWave关连”。

DeepSeek的出现,进一步收缩了硬件绑定效应,再加上DeepSeek以MIT合同开源模子权重,允许建筑者解放修改,昇腾、寒武纪、摩尔线程等其他芯片厂商也将有契机将DeepSeek集成到我方的平台中,这些齐对英伟达CUDA生态形成了潜在威逼。

更值得一提的是,DeepSeek遴荐的开源战略正在加快生态分化。通过发布基于Qwen、Llama开源模子的六个蒸馏“小模子”, DeepSeek撑持在非CUDA的环境中进行模子微调;HuggingFace还发起了Open-R1面貌,进一步推进了时期扩散。

图片着手:HuggingFace

3.危与机并存的英伟达

Kakashiii发表的“英伟达的一切齐将运转剖判”的不雅点也遭到了不少东谈主的质疑。

亚马逊云科技零卖和消费类电子居品生成式东谈主工智能左右迈克尔·康纳(Michael Connor)就辩驳谈:“雄壮的显卡在磨砺和推理中齐是必需的,即使使用 DeepSeek。”

图片着手:Michael Connor X账号

一直比较看好英伟达的花旗分析师阿提夫·马利克(Atif Malik)合计:“天然 DeepSeek的建树可能是始创性的,但咱们质疑的是,要是莫得使用先进的GPU对其进行微调或通过蒸馏时期构建最终模子所基于的底层LLMs,DeepSeek的建树就不行能完了。”

马利克同期分析,天然好意思国公司在首先进AI模子方面的主导地位可能会受到挑战,但好意思国获取更先进芯片的契机是一个上风,因此他预测起始的AI企业不会拆除更先进的GPU。

“因为这些GPU在规模上能提供更具招引力的$/TFLOPs(一个计算计议性能性价比的研究) 。”马利克说,“咱们合计,星际之门(Stargate)等最近晓示的AI成本支拨等于对先进芯片需求的回报。”

Panoptes Group前首创东谈主、东谈主工智能谈论员、现牛津大学在读博士JundeWu就示意, 好多东谈主惦记DeepSeek的低成本磨砺会冲击显卡阛阓,但他合计是利好。

他的不雅点之一是,好多东谈主合计师法DeepSeek就不需要那么多卡了,但其实DeepSeek-R1的低成本磨砺纪律亦然不错Scaling的。在DeepSeek出来之前,其他大模子用PRM(Process Reward Model)的时候,由于需要非常的卡磨砺PRM模子来监督推理过程,照旧不雅察到Scaling Law失效、角落效应递减了,然而DeepSeek的出现讲明注解了多一张卡、性能就成正比培植,这对显卡阛阓显明是一种利好。

图片着手:JundeWu X账号

他的不雅点之二是,好多东谈主合计DeepSeek作念的是推理,但其实DeepSeek-R1是通事后磨砺,来磨砺模子有更强的推聪敏力,这种磨砺和预磨砺对显卡的需求莫得施行区别。

因此,JundeWu合计,改日对显卡阛阓和Scaling Law最大的威逼不是模子,而是数据。

还有业内东谈主士分析,天然磨砺耗尽的算力较少,然而由于智能的赓续升级和相应的用户需求飞腾,推理模子也会需要更多的算力;另外,DeepSeek的时期将导致模子智力走向分化,唯有那些领有高端GPU的东谈主才有智力创建更复杂的模子。

除了酬酢收集上的征询,在更为隐痛和专科的小圈子里,关于这次DeepSeek-R1的爆红和其对英伟达生态的影响的征询则更为感性。

「甲子光年」获取的一份来自“拾象”的《DeepSeek-R1闭门学习征询》文献纪要中,就有参会者示意,DeepSeek-R1仅仅站在巨东谈主的肩膀上取得的到手,但探索大模子最前沿的时期需要的时期和东谈主力成本还要高好多,R1的出现并不代表以后的磨砺成本会同期镌汰。

「甲子光年」分析,短期内英伟达仍持有三大上风:

高端芯片的管辖力:预测2025年英伟达从Blackwell架构居品线获取的收入有可能会进步阛阓的预期,进步Hopper架构创造的记录,最多可达到2100亿好意思元的水平,何况大型云厂商的订单已消失改日数年产能。

CUDA生态壁垒:90%的AI建筑者依赖CUDA平台,移动成本极高。

供应链收敛:台积电CoWoS(一种先进的半导体封装时期)产能优先分拨英伟达,2025年预测英伟达占据CoWoS总需求的63%,标明其在遴荐CoWoS时期方面的拓荒地位。

高端芯片的管辖力:预测2025年英伟达从Blackwell架构居品线获取的收入有可能会进步阛阓的预期,进步Hopper架构创造的记录,最多可达到2100亿好意思元的水平,何况大型云厂商的订单已消失改日数年产能。

CUDA生态壁垒:90%的AI建筑者依赖CUDA平台,移动成本极高。

供应链收敛:台积电CoWoS(一种先进的半导体封装时期)产能优先分拨英伟达,2025年预测英伟达占据CoWoS总需求的63%,标明其在遴荐CoWoS时期方面的拓荒地位。

DeepSeek掀翻的AI算力创新,并不是要替代英伟达,而是迫使行业从头念念考算力干预的性价比。

模子进化带来的算力创新,这其中有着太多不祥情,但惟一详情的是: AI算力的“武备竞赛”逻辑,正在被中国公司的算法创新改写。

(封面图着手:电影《星际穿越》)

发布于:北京市