小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

AI竞赛激烈,小米也加入战局!

4月30日,小米推出专注推理能力的开源大模型MiMo,仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里32B规模的QwQ。

据小米介绍,Xiaomi MiMo诞生之初探索的核心问题就是激发模型推理潜能,这款模型联动预训练到后训练,全面提升推理能力。

国内外AI竞争日趋白热化,本周阿里前脚发布Qwen 3,马斯克后脚就官宣Grok 3.5。而据此前媒体报道,小米正在建设万卡GPU集群,并引入顶尖AI人才,显示出对大模型领域的全面投入。

性能突破:小参数量实现大能力

Xiaomi MiMo这款模型最引人注目之处在于,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

更值得注意的是,在相同强化学习(RL)训练数据条件下,MiMo-7B在数学和代码领域展现出的强化学习潜力明显领先于业界广泛使用的其他模型,包括DeepSeek-R1-Distill-7B和Qwen2.5-32B等知名强化学习起步模型。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术关键:预训练与后训练双轮驱动

据小米介绍,MiMo模型的成功并非偶然,而是来自于预训练和后训练两个阶段的多层面创新。

在预训练阶段,小米团队着重挖掘富含推理模式的语料,并合成了约200B tokens的推理数据。训练过程采用三阶段策略,逐步提升训练难度,累计训练了25T tokens,这一训练量在同等规模模型中处于领先水平。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

后训练阶段的创新更为关键,小米团队提出了"Test Difficulty Driven Reward"机制,有效解决了困难算法问题中奖励稀疏的问题。同时引入"Easy Data Re-Sampling"策略,显著提升了强化学习训练的稳定性。在框架层面,他们设计了"Seamless Rollout"系统,使得强化学习训练速度提升2.29倍,验证速度提升1.96倍。

小米推出首个推理开源大模型Mimo!以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

技术之外:小米的AI全面投入战略

据界面新闻报道,小米正在搭建自己的GPU万卡级集群,将对AI大模型进行大力投入。一名知情人士透露,该计划已经实施数月之久,小米创始人雷军亲自参与领导。该人士强调:"在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不'all in'是不可能的。"

小米的AI人才布局也在加速。12月20日,第一财经报道称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。罗福莉是MLA(Multi-head Latent Attention)技术的核心开发者之一,该技术在降低大模型使用成本上发挥了关键作用。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:华尔街见闻,转转请注明出处:https://www.anesthesia.org.cn/7469.html

(0)
华尔街见闻的头像华尔街见闻
上一篇 2025年4月30日 下午3:00
下一篇 2025年4月30日 下午3:00

相关推荐

  • 高盛最新预测:今年美国逼近0增长,通胀大幅走高,对美元非常悲观

    高盛最新报告对美国经济前景发出严峻警告:美国经济今年逼近0增长,将通胀预期大幅上调至3.5%左右。高盛还认为美元目前依然被高估约20%。 据上证报消息,美东时间4月9日美股盘中,美国总统特朗普在社交平台发帖表示,已授权对部分国家实施90天的关税暂停措施,在此期间大幅降低关税至10%。 在特朗普宣布暂停部分关税90天之后,高盛虽然撤销了发布不到两小时的经济衰退…

    2025年4月15日
    9800
  • 今年的五一消费,我确实没想到

    (图片由豆包AI生成 提示词 景区自拍) 来啦,又是五一时间到。 不知道此时各位是奔赴在高铁,还是早已穿上自家最花哨的衣服挑选最靓丽那条丝巾,疯狂在各大景点门口花坛前拍拍拍了? 第一个小长假有多期待?我敢说,今年五一就是奔着破纪录去的。 “请4休11”这种请假方式越来越狂野,也就是传说中的请假5月6日~5月9日,最终获得5月1日~5月11日共11天假期。我朋…

    2025年5月2日
    12300
  • 爱奇艺也要来抢直播带货的蛋糕了

    作者 | 黄昱 编辑 | 王小娟 前有淘宝、抖音,后有小红书、微信视频号,如今长视频平台出身的爱奇艺,也要跻身直播电商这一赛道了。 4月23日,在“2025爱奇艺世界·大会”上,爱奇艺创始人、CEO龚宇宣布,今日爱奇艺内容电商上线,内容会涉及爱奇艺的IP内容、艺人明星等,主要是做直播带货,爱奇艺会员将是潜在最大的电商用户。 也就是说,在成立15年后,已拥有超…

    2025年4月24日
    6900
  • 野村:日本取消关税希望已破灭,美国或先加税

    野村认为,美日贸易谈判进展停滞,特朗普威胁对日本征收30-35%关税,这将对投资者产生重大影响。 据追风交易台消息,7月2日野村证券最新研报预测,日本股市将继续承压,而债券市场可能获得支撑。野村证券认为当前日本市场的核心矛盾在于宏观层面的日美贸易谈判僵局与微观层面的经济韧性。 报告预测美国将先提升关税,增加日本公众的紧迫感,随后日美双方再各自提出让步方案,并…

    2025年7月3日
    1600
  • 哈佛、耶鲁带头,美国大学捐赠基金争相出逃私募股权基金

    美国高校逃离私募股权,一场因流动性压力和特朗普政策引发的投资者“抢跑”大戏正在上演。 5月7日,据彭博社报道,据知情人士透露,普林斯顿大学捐赠基金最近几周一直在研究私募股权份额潜在出售的可行性。 由于多年来回报缓慢和资金分配不频繁,德克萨斯理工大学规模超20亿美元的捐赠基金遇到了挑战。德克萨斯理工大学负责私募股权投资的Christopher White表示,…

    2025年5月7日
    4700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信