小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

AI竞赛激烈,小米也加入战局!

4月30日,小米推出专注推理能力的开源大模型MiMo,仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里32B规模的QwQ。

据小米介绍,Xiaomi MiMo诞生之初探索的核心问题就是激发模型推理潜能,这款模型联动预训练到后训练,全面提升推理能力。

国内外AI竞争日趋白热化,本周阿里前脚发布Qwen 3,马斯克后脚就官宣Grok 3.5。而据此前媒体报道,小米正在建设万卡GPU集群,并引入顶尖AI人才,显示出对大模型领域的全面投入。

性能突破:小参数量实现大能力

Xiaomi MiMo这款模型最引人注目之处在于,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

更值得注意的是,在相同强化学习(RL)训练数据条件下,MiMo-7B在数学和代码领域展现出的强化学习潜力明显领先于业界广泛使用的其他模型,包括DeepSeek-R1-Distill-7B和Qwen2.5-32B等知名强化学习起步模型。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术关键:预训练与后训练双轮驱动

据小米介绍,MiMo模型的成功并非偶然,而是来自于预训练和后训练两个阶段的多层面创新。

在预训练阶段,小米团队着重挖掘富含推理模式的语料,并合成了约200B tokens的推理数据。训练过程采用三阶段策略,逐步提升训练难度,累计训练了25T tokens,这一训练量在同等规模模型中处于领先水平。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

后训练阶段的创新更为关键,小米团队提出了"Test Difficulty Driven Reward"机制,有效解决了困难算法问题中奖励稀疏的问题。同时引入"Easy Data Re-Sampling"策略,显著提升了强化学习训练的稳定性。在框架层面,他们设计了"Seamless Rollout"系统,使得强化学习训练速度提升2.29倍,验证速度提升1.96倍。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术之外:小米的AI全面投入战略

据界面新闻报道,小米正在搭建自己的GPU万卡级集群,将对AI大模型进行大力投入。一名知情人士透露,该计划已经实施数月之久,小米创始人雷军亲自参与领导。该人士强调:"在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不'all in'是不可能的。"

小米的AI人才布局也在加速。12月20日,第一财经报道称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。罗福莉是MLA(Multi-head Latent Attention)技术的核心开发者之一,该技术在降低大模型使用成本上发挥了关键作用。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:华尔街见闻,转转请注明出处:https://www.anesthesia.org.cn/7469.html

(0)
华尔街见闻的头像华尔街见闻
上一篇 2025年4月30日 下午3:00
下一篇 2025年4月30日 下午3:00

相关推荐

  • 赛道Hyper | 微软2025财年Q3业绩超预期

    作者:周源/华尔街见闻 美东时间5月1日盘后,微软公布的2025财年第三财季财报引发全球科技圈震动:实现营收700.66亿美元,同比增长13%,超过分析师684.2亿美元的平均预期;录得258.24亿美元净利润,同比增长18%;经调整后每股收益3.46美元,分析师预计3.21美元,上年同期为2.94美元。 其中,Azure云计算收入268亿美元,同比增长33…

    2025年5月2日
    3700
  • 国产特医食品首单IPO在望?圣桐特医的红利与焦虑

    在中国的特殊医学用途配方食品(以下简称“特医食品”)领域,有望诞生第一家上市公司。 近日,圣桐特医(青岛)营养健康科技股份公司(简称“圣桐特医”)向港交所递交招股书。 圣桐特医由奶粉企业圣元的特医食品事业部脱胎而来。 作为首家在美上市的中国奶粉企业,圣元的昔日市场地位不容小觑,早在二十年前就关注到婴幼儿特医食品的机遇,成为国内最早布局的企业之一。 先发优势奠…

    2025年6月7日
    1600
  • “减肥神药”进入口服时代,礼来登顶“减肥药王”?

    礼来公司的口服减肥药Orforglipron在三期临床试验中表现出色,可以媲美甚至超越注射型GLP-1药物。 市场对礼来的突破性进展反应强烈。4月17日,礼来股价收涨超14%,盘中暴涨16%,创下自2023年8月以来的最大单日涨幅。 与此同时,长期占据GLP-1市场主导地位的诺和诺德股价则大幅收跌近8%。 根据礼来公布发布的新闻稿,其口服GLP-1药物orf…

    2025年4月18日
    8800
  • 商务部:中欧双方电动汽车案价格承诺磋商进入最后阶段,但仍需双方努力

    联合网6月7日消息,今日,商务部新闻发言人就王文涛部长赴法国期间与欧盟委员会贸易和经济安全委员谢夫乔维奇会谈答记者问。 资料配图 图据视觉中国 问:电动汽车反补贴案的价格承诺磋商是否有新的进展?能否介绍最新情况? 答:王文涛部长与谢夫乔维奇委员围绕电动汽车案进行了专业、深入的讨论,推动该案向妥善解决的正确方向又迈进了一大步。目前,中欧双方电动汽车案价格承诺磋…

    2025年6月7日
    1500
  • 中国石化一季度投资收益亏损38亿元,财务总监回应

    在2025年第一季度业绩说明会上,中国石化财务总监寿东华回应公司一季度投资收益同比下降69.9%至16.47亿元、亏损38.25亿元时表示,中国石化开展商品类金融衍生品业务符合金融衍生品业务的监管要求,配合实货经营需求,运行规范,实现了平抑价格波动、防范市场风险的目标。一季度公司衍生品业务经营健康稳健,投资收益中的套期保值业务盈亏变动是衍生品业务结算在会计上…

    2025年4月29日
    4400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信