腾讯策划院AI速递 20241203
发布日期:2024-12-29 06:25 点击次数:90
生成式AI
一、 人人五大巨头GPU总量曝光!2025年等效H100或超1240万块
1. 2025年,人人五大AI巨头展望将领有卓越1240万块等效H100 GPU算力,微软、谷歌、Meta、亚马逊和xAI将无间彭胀其算力。
2. 英伟达展望2025年销量将达到650万到700万块GPU,H100和Blackwell系列将占据主导地位。
3. 各大公司在AI侦查中依赖巨量算力,OpenAI和谷歌的侦查资本和资源亏本最大,xAI也在赶紧彭胀超算。
二、 好意思欧亚三洲拓荒者联手,人人首个组团侦查的大模子,全经由开源
1. Prime Intellect告示开源人人首个去中心化侦查的10B大模子INTELLECT-1,展示去中心化侦查概况终了大范围模子;
2. 模子侦查通过3个大洲、112台H100 GPU完成,选拔去中心化框架Prime,晋升揣摸遵循和容错性;
3. 将来认识是彭胀至AGI,推动社区参与和优化侦查框架,确保AI发张敞开、说合。
张开剩余75%三、 DeepMind用话语游戏让AI学AlphaGo自我博弈,突破数据适度
1. DeepMind引入“苏格拉底式学习”,通过话语游戏终了智能体自我博弈,讲理数据适度;
2. 话语游戏机制为智能体提供了无穷的数据生成与自我完善道路,同期提供响应以改进手段;
3. 该身手撑合手递归自我改良,使智能体不仅能从环境中学习,还能退换本人结构,鞭策AGI的发展。
四、 Adobe AI音效MultiFoley,一键生成电影级音效,同步精度惊东说念主!
1. MultiFoley是一款概况字据文本、音频或视频样本生成电影级音效的AI系统,具备超高同步精度;
2. 时刻突破在于其48kHz高带宽音频输出和多种输入身手(文本、音频、视频)的集成,终了精准同步;
3. 与现存系统比较,MultiFoley在音视频同步和语义一致性方面进展优秀,将来有望集成至Adobe家具,推动创作行业变嫌。
五、 特斯拉FSD V13初始推送:代码重写,干净轻松堪比猛禽3引擎
1. 特斯拉FSD V13版块进行了悉数重写,优化了端到端详聚,撑合手从泊车位到泊车位的自动驾驶;
2. V13版块在多个方面进行大幅晋升,包括数据处理、视频输入、侦查揣摸彭胀和适度延伸镌汰;
3. 特斯拉展望FSD将于2025岁首超越东说念主类驾驶员,预备推出Robotaxi做事,但悉数无东说念主监管可能要比及V14版块。
六、 中科院联手腾讯打造AI带货王AnchorCrafter,看成边幅当然到位
1. 中科院与腾讯合作推出的AnchorCrafter能创建当然清醒的造谣主播,搞定了传统造谣主播僵硬、呆滞的问题;
2. 用户只需提供主播像片和商品信息,AI便能生成带货视频,并可精准适度主播的看成与边幅;
3. AnchorCrafter通过高质料的商品收复与手部互动侦查,终明显与真东说念主比好意思的带货后果。
七、 清华智谱6000亿合成交错语音文本预侦查,问答性能晋升近3倍
1. 清华和智谱团队建议了一种基于大范围合成交错语音文本数据的身手,突破了传统语音-文本数据集的适度;
2. 该身手通过从文本中生谚语音片断,排斥了对大量并行语音-文本数据的需求,晋升了语音话语模子(SpeechLM)预侦查遵循;
3. 实验标明,模子在语音书答性能上得到近3倍晋升,问答准确率从13%晋升至31%,终明显在语音聊天等任务中的显耀高出。
前沿科技
八、 苹果进攻AI智能眼镜,新专利曝光:模块化想象,个性化体验
1. 苹果的新专利波及模块化智能眼镜,撑合手添加音频诞生、替换镜框等配件;
2. 眼镜撑合手造谣推行、增强推行及夹杂推行功能,餍足不同需求的定制化用户体验;
3. 用户可字据需求退换功能组件,如高区分率走漏或长续航,以合乎不同使用场景。
九、 精准属性适度,湖大、西电重新药物想象AI身手,登Nature子刊
1. 湖南大学与西安电子科技大学建议DeepBlock,一种基于块的深度学习药物想象身手;
2. DeepBlock集中卵白质序列生因素子构件,并通过优化算法适度生因素子的属性;