李飞飞团队 s1 模型基于 Qwen 训练？阿里云确认：基于 Qwen2.5-32B-Instruct 模型训练_财经_资讯

财经

李飞飞团队 s1 模型基于 Qwen 训练？阿里云确认：基于 Qwen2.5-32B-Instruct 模型训练

来源：作者：自媒体小编 2025-02-07 16:37:02 我要评论

李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型，该模型在数学和编码

李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型，该模型在数学和编码能力测试中的表现与 OpenAl 的 o1 和 Depsek 的 R1 等尖端推理模型类似，引发广泛关注。不过很快，该 s1 模型被指「并非从零开始训练」，其基座模型为「阿里通义千问（Qwen）模型」。对此，新浪科技向阿里云方面求证，阿里云方面确认了这一消息，并回应称：「他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座，在 16 块 H100 GPU 上监督微调 26 分钟，训练出新模型 s1-32B，取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。」

转载请注明出处。

[db:tag]

本站页面、图片和视频等资料部分由互联网编辑生成，版权归原创者所有，本网站只提供web页面服务，并不提供资源存储，若本站收录的页面无意侵犯了贵司版权，请联系我们

• 百度发布文心4.5及X1两款大模型，可在官网免费	• 被315晚会点名！啄木鸟发布第二次声明：放弃公
• 小米将“智能家居”商业模式引入日本，计划2025	• 兑吧就央视3·15点名致歉：将全面核查业务风险
• 针对“3·15”晚会曝光问题，市监总局、工信部	• 深圳市：国家有关部门正研究育儿补贴方案，市
• 啄木鸟发布整改承诺书，将推进全面核查投诉订单	• 京东：京东外卖目前已覆盖全国126城
• 优音通信回应被315晚会点名：将积极配合相关部	• 2025款G6与G9焕新上市，何小鹏践行“科技平权”