栏目分类
热点资讯
你的位置:科技前沿网 > 数字趋势 > 50好意思元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

数字趋势

50好意思元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

发布日期:2025-03-21 15:09    点击次数:51

50好意思元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

作家 | 硬 AI

剪辑 | 硬 AI

春节时辰,中国AI的期间变革在全天下掀翻波涛。

继DeepSeek的低资本推理模子胆怯硅谷和华尔街之后,昨日,李飞飞等斯坦福大学和华盛顿大学参议东谈主员发布的最新参议遵循再次激励业界热议:基于阿里通义千问Qwen2.5-32B-Instruct开源模子为底座,仅使用16块H100 GPU,通过26分钟的监督微调,便打造出了性能不凡并列OpenAI的O1和DeepSeek的R1等顶端推理模子的s1-32B模子。

这一模子不仅在数学及编码才调上与OpenAI的o1和DeepSeek的R1等顶尖推理模子特别,在竞赛数知识题上的发扬更是比o1-preview跳跃27%。

不外,值得顾惜的是,诚然媒体报谈中强调s1模子唯有不到50好意思元资本,但s1模子的考验并非从零启动,而是基于阿里云通义千问(Qwen)模子进行监督微调。

这意味着,s1模子的神奇“低资本”,是斥地在已具备强壮才调的通义千问开源基础模子“巨东谈主肩膀”之上完成的。

如斯惊东谈主的效果,再次阐明了通义千问模子的期间实力。

阿里的开源模子股东AI普惠,激励产业变革

在李飞飞团队之前,AI初创公司DeepSeek也弃取了通义千问当作中枢期间底座。DeepSeek官方清爽,他们将DeepSeek-R1的强壮推理才调生效蒸馏到6个开源模子中,其中4个齐基于Qwen系列。特别是基于Qwen-32B蒸馏的模子,一经已毕了对标OpenAI o1-mini的不凡性能。这一系列生效案例再次诠释了通义千问在开源社区的雄壮影响力和风雅口碑,逐步取代Llama成为开源社区最首要的标杆基座模子。

自2023年8月开源以来,阿里云通义千问已接踵推出Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模子,涵盖大说话模子、多模态模子、数学模子和代码模子等数十款产物。这些模子在HuggingFace的Open LLM Leaderboard、Chatbot Arena大模子盲测榜单、司南OpenCompass等多个国表里巨擘评测中屡创佳绩,展现出巨匠率先的性能水平。

通义千问率先在业界已毕了"全尺寸、全模态、多场景"的开源布局。从1.5B到72B乃至110B的全系列开源,为开发者和企业提供了最大的弃取空间。数据骄贵,2024年仅Qwen2.5-1.5B-Instruct一款模子就占据巨匠模子下载量的26.6%,远超第二名Llama-3.1-8B-Instruct-GGUF的6.44%。在视觉结伙规模,Qwen-VL及Qwen2-VL两款模子的巨匠下载量更是冲突3200万次。一周前,Qwen2.5-VL的全新升级再次激励开源社区的强烈反映。

现在,通义千问在海表里开源社区的养殖模子数目已冲突9万,超过Llama系列,成为天下最大的生成式说话模子族群。这一建树不仅体现了通义千问的期间实力,更突显了其在股东AI普惠方面的首要孝顺。

中国大模子激励巨匠关爱,阿里巴巴股东中国AI财富重估

通过捏续开源率先模子,阿里云不仅隆盛了AI开发生态,更诱骗越来越多的开发者和企业用上先进的云臆度基础要领,从而股东了“云+AI”从期间立异到贸易良性轮回的完满闭环。

这一收货展现了阿里云"强壮模子+满盈算力+完满云平台"的详细实力。

本年1月29日春节时辰,阿里云发布的通义千问Qwen2.5-Max超大规模MoE模子,在Chatbot Arena大模子盲测中以1332分位列巨匠第七,超过DeepSeek-V3、OpenAI o1-mini和Claude-3.5-Sonnet等强劲敌手,成为非推理类中国大模子中的杰出人物。

外资机构对这一趋势予以了高度关爱。大摩、高盛、德银以为,DeepSeek和阿里通义打响了中国大模子"AI普惠"的第一枪,这种期间冲突与旧年北好意思云臆度劳动商的发展轨迹高度雷同。

左证大摩此前的研报,低资本高性能模子也将重塑数据中心行业款式:关于中国数据中心而言,短期内,若是大型科技公司弃取访佛期间门路,可能减少AI考验关系需求。但从长久来看,低资本模子将股东推理需求增长,对一线城市数据中心造成利好。

瑞银在昨日的研报更所以"冰雪消融,遍地开花,又到了追涨中概互联网的季节"这样放荡的标题,来看多以阿里巴巴为代表的中国AI财富。

跟着国内LLM从模子到哄骗的高贵发展,数据中心和基础要领将迎来新一轮增长机遇。臆度才调需求的扩大不仅带来规模效应,更将擢升系数产业链的订价才调。

DeepSeek昨日因劳动器病笃而暂停API充值劳动的情况,恰是印证了算力和云劳动需求的进军性。

国泰君何在当天的禀报中示意,在以DeepSeek为首的低资本推理模子的逐步普及下,推理资本及价钱大幅削减例必会带来哄骗测的隆盛,这反过来还会拉动成倍数的总算力需求擢升。

将来可期

阿里云通过开源政策和捏续立异,正在股东巨匠AI期间长远发展。其"开源引颈+云劳动"的双轮驱动模式,一方面通过率先的开源模子裁减AI哄骗门槛,股东期间普惠;另一方面借助日益增长的算力需求,带动云管业绩务快速发展。

现时,跟着AI普惠波涛兴起,云臆度基础要领的首要性愈发突显。阿里云凭借期间积存和平台上风,正成为相连AI立异与产业升级的关节纽带,也将从这波产业变革中获取更大的发展机遇。

本文来自微信公众号“硬AI”,关爱更多AI前沿资讯请移步这里

风险指示及免责条件 阛阓有风险,投资需严慎。本文不组成个东谈主投资提议,也未琢磨到个别用户特殊的投资缱绻、财务景色或需要。用户应试虑本文中的任何看法、不雅点或论断是否相宜其特定景色。据此投资,拖累自诩。

上一篇:DeepSeek与AI烧钱大战--赢家的追悼!

下一篇:没有了