连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪

连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪

图片来源:视觉中国

蓝鲸新闻6月21日讯(记者 朱俊熹)与大模型"六小龙"中趋于沉寂的其他几家同行相比,MiniMax用连续5天的上新,带来了久违的热闹场面。自6月17日起,MiniMax一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。

其中,MiniMax-M1是MiniMax推出的首个推理模型,官方介绍称是基于年初的MiniMax-Text-01模型开发得到的。一位AI算法工程师对蓝鲸科技记者表示,半年时间内从基础模型通过强化学习训练出推理模型,属于正常的节奏。"不论是训练还是强化学习的方式,给业界的感觉就是MiniMax沿着DeepSeek R1的路又走了一遍。"

有媒体转述M1模型发布后,MiniMax创始人、CEO闫俊杰在社交媒体上表示,"第一次感觉到大山不是不能翻越。"

MiniMax-M1模型延续了此前MiniMax-01系列基模的架构创新,即在MoE架构的基础上引入了闪电注意力机制(Lightning Attention)。和传统的注意力机制相比,闪电注意力机制就像在阅读长文时能让模型快速锁定重点,并不时浏览章节标题以把握整体脉络,从而减少计算和内存消耗,更适用于长上下文的处理。

上述技术从业者表示,尽管MiniMax在一月份释出了这一独创的混合架构,但目前各家大模型厂商依然按照各自的方式进行模型的迭代。"基础模型的训练还是以稳定为主,如果更改架构的话,重新训练一旦效果不佳,可能会影响行业生态位。"

连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪

图片来源:MiniMax

得益于模型的混合架构,M1在长文本方面具备显著优势。该模型支持目前业内最高的100万上下文的输入,与闭源模型中谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万token的推理输出。MiniMax还提出了新的强化学习算法CISPO,通过裁剪重要性采样权重,使强化学习训练中的"重要性评分"更合理,能够帮助模型更快、更稳地进步。

最终M1的强化训练过程实现了"超出预期"的高效。据MiniMax介绍,整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美元,较最初预期少了一个数量级。

和同样强调长上下文能力的字节豆包大模型1.6相似,MiniMax-M1也采用了分区间定价的方式。0-32k的输入长度内,输入0.8元/百万token,输出8元/百万token;32k-128k输入长度,输入1.2元/百万token,输出16元/百万token;最长的128k-1M输入长度,输入2.4元/百万token,输出24元/百万token。

MiniMax、字节等厂商此前也都强调过,长上下文的发展有助于促进智能体时代的到来。前述技术从业者解释称,Agent(智能体)的使用场景可以很复杂,例如Deep Research功能涉及大量超长文章的检索,长上下文能力自然越强越好。随着模型能力增强、MCP等外部基础设施逐步成熟,现在是Agent发展长上下文能力的好时机。

此次MiniMax推出的Agent包括通用智能体和一款视频创作Agent。通用的MiniMax Agent能够完成长程复杂任务,官方称在研发过程中是按照"靠谱的人"这一标准来设计和要求的,具体包括编程、多模态及MCP扩展。其中,多模态标准指的是支持长文本、视频、音频、图片等的全面理解,还应内置生图、生音频、生视频等能力。

Hailuo Video Agent这款视频创作智能体瞄准的是零门槛的Vibe Videoing。目前开放的第一阶段提供Agent视频模版,用户根据提示输入文字或图片,就可以一键生成创意短片。按照MiniMax的构想,第二阶段的半自定义视频Agent将支持用户在视频生成的任一环节进行自由编辑,第三阶段则实现完全形态的端到端视频Agent。

多模态向来是MiniMax的一大竞争优势。此次"上新周"发布的视频模型Hailuo 02在Artificial Analysis Video Arena评测榜上排名第二,仅次于字节的Seedance 1.0,但领先谷歌的Veo 3 Preview。收官日发布的语音设计工具则支持定制生成多语言、任意声音与情绪的语音,由5月发布的语音模型MiniMax Speech 02提供支持。

随着新模型与产品的亮相,MiniMax也公布了相应的付费方案。通用Agent采用积分制,优惠期内基础会员每月19美元,获得的5000积分大约可完成15个任务,Pro会员每月69美元,获得的20000积分对应的大约是60个任务。视频Agent则在MiniMax的视频平台海螺AI上提供,同样设有不同等级的付费方案。这些都为MiniMax带来了新的产品营收路径,通过多点变现进一步完善其商业化版图。

连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪

图片来源:海螺AI

从当前来看,大模型"六小龙"已走向各异。零一万物不再继续训练超大模型,百川智能放弃金融聚焦医疗,阶跃星辰开始收敛产品转向Agent方向,月之暗面相比基模推出的更多是编程、视觉语言等垂直模型。如果要踏上IPO之路,智谱、MiniMax等"小龙"们仍然面临着一份复杂的商业化答卷有待完成。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:蓝鲸新闻,转转请注明出处:https://www.anesthesia.org.cn/18518.html

(0)
蓝鲸新闻的头像蓝鲸新闻
上一篇 2025年6月19日 下午1:34
下一篇 2025年6月22日 下午3:00

相关推荐

  • 朝鲜驱逐舰下水事故进展:再抓3人,修复工作仍需数天时间,且面临巨大挑战

      2025年5月21日,朝鲜在清津造船厂举行的5000吨级崔贤级驱逐舰下水仪式中发生严重事故,导致舰体侧翻,引发广泛关注。事故后,朝鲜劳动党中央军事委员会迅速成立调查组,展开全面调查。根据最新调查结果,船体右舷被刮削,但未发现船底破洞。尽管如此,修复工作仍需数天时间,且面临巨大挑战。   事故发生后,金正恩对相关责任人的处理态度严厉,要求司法机关依法追责。…

    2025年5月26日
    3800
  • 今明两天将有超13万辆车经这里入沪!返程注意:今起影响上海,局部中到大雨!气温还要降

    今天是5月4日, 假期余额不足! 你是否已在返程路上了? G40长江隧桥: 瞬时峰值车流量将达每小时4000辆 记者从崇明公安获悉,5月3日上午开始,G40沪陕高速提前迎来返程车流,全天经G40长江隧桥进沪车辆为6.7万辆,警方排堵疏导警力坚守岗位至深夜。据崇明公安预测,5月4日至5日将有超过13万辆车经长江隧桥进沪,瞬时峰值车流量达每小时4000辆。崇明公…

    2025年5月4日
    3500
  • 美国中产,也快背不起爱马仕了

    文|道总有理 最近,爱马仕率先宣布在美国市场涨价,来抵消关税带来的影响。 随后,旗下分销管理着包括Coach、Jimmy Choo、Montblanc等品牌的Interparfums也宣布美国市场的产品售价提高6%至7%;意大利超跑制造商Ferrari亦宣布对Purosangue、F80等车型提价10%;LVMH集团在财报业绩说明会中也表示,将考虑涨价应对关…

    2025年5月7日
    4700
  • 葵花药业发布2024年多维布局构筑核心竞争力 “买、改、联、研、代”塑造周期穿越线

    4月25日,OTC龙头葵花药业(002737.SZ)发布2024年年报,财报显示,2024年,公司实现营业收入33.77亿元;归属于上市公司股东的净利润4.92亿元。 (一)多因素叠加业绩短暂承压,坚持儿童药第一核心战略,拓围新品类 党的十八大以来,"保障人民健康"始终处于优先发展的战略位置,2024年,国家持续深化医药卫生体制改革。受到医保控费、药品集采等…

    2025年4月26日
    5600
  • 海外版「红果」,谁能抢先摘下

    文|壹娱观察 大娱乐家 从纽约到东京,从雅加达到圣保罗,继短视频之后,海外用户如今又开始被一种来自中国特色的创新内容形式所吸引——短剧。 这种竖屏、1分钟一集、节奏极快、爽点密集的娱乐内容,在中国出海资本的加持下,正以惊人的速度跨越文化与语言的壁垒,试图复制短视频的奇迹。 短剧出海的热潮背后,自然还是国内短剧市场的持续火热。 《2024年微短剧行业发展研究报…

    2025年4月15日
    7100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信