栏目分类
热点资讯
你的位置:科技前沿网 > 创新应用 > 量化巨头放大招!大模子性价比之王来了

创新应用

量化巨头放大招!大模子性价比之王来了

发布日期:2025-01-26 05:30    点击次数:195

量化巨头放大招!大模子性价比之王来了

12月26日晚,杭州深度求索东说念主工智能基础工夫计划有限公司(简称“深度求索”)晓谕,全新系列模子 DeepSeek-V3 首个版块上线并同步开源,API职业已同步更新,接口建立无需蜕变。

公开信息浮现,深度求索劝诱于2023年7月17日,由盛名量化资管巨头幻方量化创立,幻方量化独创东说念主梁文峰在量化投资和高性能筹画领域具有深厚的布景和丰富的教会。

深度求索暗示,DeepSeek-V3在常识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平比拟前代 DeepSeek-V2.5权臣缓助,接近现时发挥最佳的模子Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。

在好意思国数学竞赛(AIME 2024, MATH)和寰宇高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅跳跃了其他统共开源闭源模子。另外,在生成速率上,DeepSeek-V3的生成吐字速率从20TPS(Transactions Per Second每秒完成的事务数目)大幅提高至60TPS,比拟V2.5模子结束了3倍的缓助,未必带来愈加通顺的使用体验。 

△ DeepSeek-V3和其他模子的比较。图片开头:Deep Seek微信公众号

据滂湃新闻报说念,Meta AI计划科学家田渊栋对DeepSeek-V3各个方朝上的进展齐暗示歌唱,称“这是一项了不得的责任”。

据官方工夫论文表示,DeepSeek-V3模子的总查验本钱为557.6万好意思元,而GPT-4o等模子的查验本钱约为1亿好意思元。深度求索暗示,“这是一个全新的开动。”

据财联社报说念,OpenAI的相接独创东说念主之一Andrej Karpathy也发文赞誉说念:看成参考,要达到这种级别的才略,经常需要约1.6万个GPU的筹画集群。不仅如斯,现时业界正在部署的集群界限致使仍是达到了10万个GPU。比如,Llama 3 405B破费了3080万GPU小时,而看起来更广泛的DeepSeek-V3却只用了280万GPU小时。

性能更强、速率更快的DeepSeek-V3上线,幻方量化给出的订价是几许呢?

深度求索暗示,“咱们的模子 API 职业订价也将退换为每百万输入 tokens 0.5 元(缓存射中)/ 2 元(缓存未射中),每百万输出 tokens 8 元。”据财联社报说念,加总本钱是10元东说念主民币。

上一代模子Deepseek-V2.5的价钱是,输入:0.14好意思元/百万Token,输出为:0.28好意思元/百万Token,加总本钱是0.14+0.28=0.42好意思元,梗概3元东说念主民币。

这里的Token是大模子在解决数据时的最小单位,一般而言,100万Token相等于70万-100万英文单词,或接近100万华文汉字。列夫•托尔斯泰的名著《干戈与和平》的英文版梗概是梗概有1200-1500页、58万英文单词,把它翻译为华文,梗概有100-130万字,让DeepSeek-V3读透澈文只需要2元附近。

尽管提价,但与同类型模子比拟,DeepSeek-V3依旧极具性价比。比如OpenAI的GPT 4o订价相等高,输入:5好意思元/百万Token,输出:15好意思元/百万Token,加总本钱是20好意思元,约合东说念主民币140元。

本文抽象DeepSeek微信公众号、滂湃新闻、财联社

(声明:著述实践仅供参考,不组成投资冷漠。投资者据此操作,风险自担。)

更多实践请下载21财经APP