小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

AI竞赛激烈,小米也加入战局!

4月30日,小米推出专注推理能力的开源大模型MiMo,仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里32B规模的QwQ。

据小米介绍,Xiaomi MiMo诞生之初探索的核心问题就是激发模型推理潜能,这款模型联动预训练到后训练,全面提升推理能力。

国内外AI竞争日趋白热化,本周阿里前脚发布Qwen 3,马斯克后脚就官宣Grok 3.5。而据此前媒体报道,小米正在建设万卡GPU集群,并引入顶尖AI人才,显示出对大模型领域的全面投入。

性能突破:小参数量实现大能力

Xiaomi MiMo这款模型最引人注目之处在于,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

更值得注意的是,在相同强化学习(RL)训练数据条件下,MiMo-7B在数学和代码领域展现出的强化学习潜力明显领先于业界广泛使用的其他模型,包括DeepSeek-R1-Distill-7B和Qwen2.5-32B等知名强化学习起步模型。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术关键:预训练与后训练双轮驱动

据小米介绍,MiMo模型的成功并非偶然,而是来自于预训练和后训练两个阶段的多层面创新。

在预训练阶段,小米团队着重挖掘富含推理模式的语料,并合成了约200B tokens的推理数据。训练过程采用三阶段策略,逐步提升训练难度,累计训练了25T tokens,这一训练量在同等规模模型中处于领先水平。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

后训练阶段的创新更为关键,小米团队提出了"Test Difficulty Driven Reward"机制,有效解决了困难算法问题中奖励稀疏的问题。同时引入"Easy Data Re-Sampling"策略,显著提升了强化学习训练的稳定性。在框架层面,他们设计了"Seamless Rollout"系统,使得强化学习训练速度提升2.29倍,验证速度提升1.96倍。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术之外:小米的AI全面投入战略

据界面新闻报道,小米正在搭建自己的GPU万卡级集群,将对AI大模型进行大力投入。一名知情人士透露,该计划已经实施数月之久,小米创始人雷军亲自参与领导。该人士强调:"在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不'all in'是不可能的。"

小米的AI人才布局也在加速。12月20日,第一财经报道称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。罗福莉是MLA(Multi-head Latent Attention)技术的核心开发者之一,该技术在降低大模型使用成本上发挥了关键作用。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:华尔街见闻,转转请注明出处:https://www.anesthesia.org.cn/7469.html

(0)
华尔街见闻的头像华尔街见闻
上一篇 2025年4月30日 下午3:00
下一篇 2025年4月30日 下午3:00

相关推荐

  • 特朗普的贸易战正在摧毁美国的“金融霸权”

    外资纷纷出逃美元资产?媒体警告:警惕贸易冲突升级为“资本战”的危险信号。 据央视新闻报道,当地时间16日,美国与日本政府在华盛顿围绕美国加征关税展开首轮贸易谈判。周一亚洲市场交易时段,美元指数盘中跌破99点,美元/日元震荡下行,日内跌幅逾1%,美债收益率持续窄幅震荡。 由于特朗普的关税政策“反复无常”,美债市场一度经历史诗级暴跌,与此同时,通常作为“避风港”…

    2025年4月21日
    4900
  • 一周重磅日程:美欧一季度GDP、美国非农、中国PMI、巴菲特股东大会、微软苹果Meta亚马逊财报

    4月28日至5月4日当周重磅财经事件一览,以下均为北京时间: 重磅事件方面,巴菲特旗下伯克希尔·哈撒韦将举办股东大会、Meta举办首届AI开发者大会、日本央行公布利率决议、美日或进行第二轮谈判; 数据方面,关注美国和欧元区一季度GDP、美国4月非农就业报告、3月PCE物价指数、中国4月制造业PMI。财报方面,关注微软、Meta、苹果、亚马逊、辉瑞制药、礼来、…

    2025年4月28日
    9200
  • 科创板注册失效后,新通药物IPO“卷土重来”

    部分沪深IPO失败项目正在“重回战场”。 日前,西安新通药物研究股份有限公司(下称“新通药物”)向陕西证监局递交了IPO辅导。 这是新通药物第二次冲刺IPO。 与不少中途败北的IPO项目不同,新通药物曾走完整个上市流程,距离上市成功仅差临门一脚。 2021年12月末,新通药物向上交所递交了科创板IPO申请,此后经过二轮问询后在2023年初顺利过会,并于当年4…

    2025年4月23日
    1800
  • 华为发布智能辅助驾驶安全倡议,11家汽车品牌高管联合署名

    联合网4月27日消息,今日,华为乾崑智能汽车解决方案官方微博发布《智能辅助驾驶安全倡议》。 倡议中共有11家汽车品牌的高管署名,他们在4月22日举办的华为乾崑智能技术大会上也亮相助阵。 这11家汽车品牌分别为广汽集团(601238.SH)、上汽集团(600104.SH)、江汽集团、奥迪中国、东风猛士、岚图汽车、深蓝汽车、北汽新能源、阿维塔、赛力斯(60112…

    2025年4月27日
    2300
  • 金力泰两任董事长被判赔偿股民超70万,专家:警示董监高“吹牛”有代价

    联合网4月25日消息,全国首例因上市公司董监高未履行增持承诺引发的证券侵权纠纷案件,今日在上海金融法院宣判。 据上海金融法院消息,经委托第三方机构损失核定,该院一审判令被告袁某、罗某共同赔偿原告刘某某投资损失50.61万元,共同赔偿原告郑某某投资损失27.74万元。联合网了解到,袁某、罗某分别为金力泰(300225.SZ)原董事长兼总裁袁翔以及现董事长兼总裁…

    2025年4月26日
    7300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信