财经

直指端侧痛点,豆包新模型架构最高降本83%

来源: 作者:自媒体小编 2025-02-12 17:01:23 我要评论

2月12日讯,据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出一种全新的稀疏模型架构UltraMem,该架构在保证模

2月12日讯,据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出一种全新的稀疏模型架构——UltraMem,该架构在保证模型效果的前提下,推理速度较传统的MoE架构提升2-6倍,推理成本最高可降低83%。这项创新成果已被机器学习和AI领域的顶级会议ICLR 2025接收,为解决大模型推理效率和扩展能力问题提供了全新思路。

 

转载请注明出处。

本站页面、图片和视频等资料部分由互联网编辑生成,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,若本站收录的页面无意侵犯了贵司版权,请 联系我们

网友点评
0相关评论