栏目分类
热点资讯
你的位置:科技前沿网 > 创新应用 > 姚班天才创办的大模子公司,卖了

创新应用

姚班天才创办的大模子公司,卖了

发布日期:2025-04-08 06:08    点击次数:170

姚班天才创办的大模子公司,卖了

白交 发自 凹非寺

量子位 | 公众号 QbitAI

最新音信,斯隆奖得主、姚班学友马腾宇大模子创业效果,被收购!

收购方是MongoDB,一家开源数据库上市龙头。

而距离他2023年11月官宣创业Voyage AI不到一年半的时分。其时创业气势终点之正式和豪华,李飞飞曼宁等大佬担任参谋人。

他们主如果作念针对RAG(检索增强生成)成心优化的镶嵌模子,为智能 AI 讹诈要道提供相沿。

在这短短一年多时分里,模子更新到了第三个版块,终澄澈来源进的检索精度和向量存储资本的大幅缩短;期间完成了两轮融资,总筹集金额达到2800万好意思元。

这次收购,具体金额还未知道。

但在马腾宇公司博客中知道了他们摄取被MongoDB收购的原因。

绵薄来说即是,两者强强纠合,将AI检索模子获胜引入数据库,在更和解的堆栈下带来更高效的建设体验,还能提升AI讹诈要道的性能和准确性。

不少业内东谈主士,在马腾宇推文下面暗示了祝福。

5年时分作念出SOTA镶嵌模子

当初创业时,他们曾知道一个蹙迫的创业原因是以为业界对镶嵌模子的嗜好进程远远不够。

镶嵌模子与生成式模子有一定相似之处,但愈加侧重于语义清楚,通过神经蚁集(频频是Transformer)架构来对语义坎坷文进行拿获和压缩。

难度上,考试镶嵌模子和生成式模子相同艰难——考试高质料的镶嵌模子需要在架构、数据、耗损函数等很多方面进行反复实验。

于是,他们用了5年时分,汇集了海量考试数据和预/后处理步调,最终打造出了一款SOTA的镶嵌模子。

而在创业之后,模子的迭代还在赓续。

Voyage发布了诸多系列模子,包括通用镶嵌模子、代码检索镶嵌模子、多模态镶嵌模子,他们王人在往常三个月期间王人纷纷升级到了第三个版块。

通用和多讲话镶嵌模子voyage-3-large:该模子在涵盖 100 个数据集的八个评估领域中名轮番一,包括法律、金融和代码,坎坷文长度为32K。通过俄罗斯套娃表征学习(MRL)和量化感知考试,相沿更小的尺寸和 int8 和二进制量化,可明显缩短 vectorDB 资本,同期对检索质料的影响最小。

基于代码检索的镶嵌模子voyage-code-3。在一组32个代码检索数据集上,它的性能区分比 OpenAI-v3-large 和 CodeSage-large 平均跨越 13.80%和16.81%。通过使用 Matryoshka 学习和量化样式(如 int8 和二进制样式)相沿更小的维度,voyage-code-3 还能显贵缩短存储和搜索资本,同期将对检索质料的影响降至最低。

多模态镶嵌模子voyage-multimodal-3,可用于包含丰富视觉和文本的文档。与现存的多模态镶嵌模子不同,voyage-multimodal-3 能够对交错文本和图像进行矢量化处理,并从 PDF、幻灯片、表格、数字等截图中捕捉重要视觉特征,从而省去了复杂的文档融会经由。在对 3 个多模态检索任务(共 20 个数据集)进行评估时,voyage-multimodal-3 比性能仅次于它的多模态镶嵌模子平均提升了 19.63% 的检索准确率。

与此同期,还积蓄了一众顶尖的合营伙伴,包括AWS、Databricks、Anthropic、Harvry、LangChain、Replit等等闻明公司。

这次收购之后,Voyage AI不错MongDB带来什么?

用一张图就不错抽象之。

以往建设东谈主员需要依靠各式安适组件来构建AI讹诈要道,这些组件的次优摄取(举例镶嵌模子)可能导致数据检索关联性低和生成输出质料低下。这种分散的步调对建设东谈主员来说既复杂又腾贵,服从低下,况兼繁琐。

现时,他们无需实施变通步调或管制单独的系统,而是不错从及时操作数据中生成高质料的镶嵌、存储向量、实践语义搜索并优化收尾 - 统共这些王人在 MongoDB 中完成。

关于这次收购,MongDB CEO暗示:

AI有后劲调动每个行业,但其讹诈因“幻觉”可能带来的风险而受到戒指。通过将先进的AI启动搜索和检索才退换合至咱们高度活泼的数据库系统中,MongoDB和Voyage AI将匡助企业纯粹构建能够创造要紧业务影响的可靠AI讹诈。通过这次收购,MongoDB再行界说了AI期间的数据库。

马腾宇则暗示:要使AI讹诈要道施展一齐潜能,企业必须信任其输出收尾,因此需要将检索与操作数据深度集成,以确保其准确性和关联性。加入MongoDB使咱们能够将前沿的AI检索时刻带给更平方的受众,并将其无缝集成到重要任务讹诈中。通过将咱们在镶嵌和重排序方面的专科学问与MongoDB一流的数据库相吞并,咱们不错匡助组织构建能够大畛域提供更准确、更可靠收尾的AI讹诈,使他们能够自信地将AI讹诈于高风险用例。

清华姚班学友,和陈丹琦同学

马腾宇,现任斯坦福大学助理讲授,接头标的包括机器学习、算法过火表面等多项履行。

其学生王人分散在各个顶尖大厂和机构从事科研探索。

他本科毕业于清华姚班,和陈丹琦是同班同学。随后去到普林斯顿攻读博士学位导师是表面算计机科学家、两届哥德尔奖得主Sanjeev Arora讲授。

读博期间,马腾宇得到了表面算计机标的的西蒙斯奖等诸多奖项,被导师夸赞“比我方还聪惠”。

博士毕业后,MIT、哈佛、斯坦福等顶尖高校王人给了他助理讲授的Offer,马腾宇最终摄取了斯坦福。

2021年,马腾宇得到了具有“诺奖风向标”之称的斯隆奖,成为继鬲融之后清华姚班又别称获此奖项的学友。

时分来到2023年11月,他官宣创业Voyage。不外创业期间,他长期还在斯坦福进行一些前沿探索。

比如他与Google Brain推理团队创建者Denny Zhou联手讲明,惟有念念维链有余长,Transformer就不错贬包袱何问题。通过数学步调,他们讲明了Transformer有才调模拟淘气多项式大小的数字电路,论文已入选ICLR 2024。

而就在月初,他还忽视了STP, 一种不错无尽揣摸和讲明的自玩算法,从而终了在有限的数据情况下不停地考订模子。其时他的单元是斯坦福。

至于公司被收购后的下一步产业动向,马腾宇还莫得知道。不祥接下来还不错期待更多学术效果~

参考通顺:[1]https://ai.stanford.edu/~tengyuma/[2]https://blog.voyageai.com/2025/02/24/joining-mongodb/[3]https://www.mongodb.com/blog/post/redefining-database-ai-why-mongodb-acquired-voyage-ai[4]https://x.com/dittycheria/status/1894026445606826095[5]https://x.com/VoyageAI[6]https://x.com/tengyuma/status/1894029783245451572

— 完 —

量子位 QbitAI · 头条号签

眷注咱们,第一时分获知前沿科技动态约