智源大会前线速写:多模态模型的“ChatGPT时刻”还未到来

智源大会前线速写:多模态模型的“ChatGPT时刻”还未到来

图片来源:视觉中国

蓝鲸新闻6月8日讯(记者 朱俊熹)回顾生成式AI的演进历程,除大语言模型的爆发外,还有一条并行推进的技术路线:多模态大模型。过去一两年间,多模态路线上先后出现OpenAI的视频生成模型Sora、4o图像生成功能等重要里程碑。但在6月6日至7日的2025北京智源大会上,业界人士的主流观点是:属于多模态的"ChatGPT时刻"尚未到来。

智源研究院院长王仲远表示,当前的多模态模型大多是对静态画面的理解,描述的是存在的事实。但人类对多模态的理解并不是基于单帧图像的描述,而是可以从一个画面预测下一个可能的画面。"当我手接近水时,可以预测我要拿水;如果不小心把它碰倒在地板上时,会预测水洒下去。如果没有盖子,地板会被水洒湿。"

在AI视频创企Sand.ai创始人兼CEO曹越看来,要想精准地预测并生成未来的视频内容,关键在于对过去视频内容的充分理解。为此,Sand.ai将主要探索方向押注在自回归这一技术路径上。当下的多模态生成领域中,DiT架构,即基于Transformer架构的扩散模型是主流选择。如果说DiT是逐步去噪来还原图像或视频,自回归则是按顺序逐帧、逐块地生成图像或视频。

曹越指出,沿着DiT架构方向会发现,随着模型大小提升,将快速达到瓶颈,需要找到可扩展的解决方案。如果将自回归的思路引入视频生成方向,可能会有显著不同的体验。其训练方式本质就是基于之前一段视频,来生成未来的一段视频。因此生成视频时长可从现在的5秒提升至几分钟,存在较大的技术提升空间。

今年4月,OpenAI研究科学家姚顺雨的一篇长帖曾引发热议。他表示,AI已进入下半场,重心将从解决问题转向定义问题。在智源大会分论坛上,AI视觉领域的明星创企Luma AI首席科学家宋佳铭直言,"上下半场"的划分更像是在描述语言模型。如果上半场是预训练,下半场是推理,目前多模态模型还未能很好地解决上半场的问题。

宋佳铭解释称,对于上半场的期望是,多模态模型能够通过一个大一统的模型,像人一样处理不同模态的任务,并且保持足够快的推理速度。这个模型应当具备多模态思维链,否则在下半场无法真正打通推理能力。

如果从多模态模型的应用落地角度来看,腾讯混元多模态生成负责人芦清林认为,上下半场的分界线并不清晰。"因为五分的模型对应五分的用法,八分的模型对应八分的用法。"他表示。一个判定信号是,专业领域的人是否开始使用这项技术。即便技术研发人员认为模型还存在很多可改进的地方,如果专业人员已经开始采用,并且觉得能在实际工作中带来提效或帮助,那么它已经达到了能带来实际改变的阶段。

字节跳动Seed图像&视频生成负责人黄伟林则分享了判断技术商业化程度的三个数据指标。一是效率数据,如用户在使用AI生图时,生成多少张图片会下载一张。二是APP上的用户留存数据。三是收入数据,他指出头部AI视频产品ARR(年度经常性收入)年底有望达到1亿美元或更多,明年将可能实现5到10倍的增长。

在技术和商业的结合层面,Sand.ai联合创始人张拯强调,应当追求有效的Scaling Law。即在扩展模型规模、提升性能时,由此带来的用户价值和经济回报是否足以覆盖所投入的资源成本。如果模型能力提升的代价过高,用户得不到对应的回报,那么从商业角度来看,这样的Scaling就是无效的。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:蓝鲸新闻,转转请注明出处:https://www.anesthesia.org.cn/17096.html

(0)
蓝鲸新闻的头像蓝鲸新闻
上一篇 2025年6月8日 下午3:49
下一篇 2025年6月8日 下午3:49

相关推荐

  • 中环海陆实控人密谋卖公司收罚单,“新主”半年即离场火速入主另一家上市公司

    中环海陆实控人密谋卖公司 图片来源:视觉中国 蓝鲸新闻4月25日讯(记者 徐晓春)4月24日,一纸罚单揭示了一场资本方与"壳资源"运作背后的故事。由于信批违规,江苏证监局对中环海陆实控人吴君三采取责令改正的行政监管措施。 相关信息显示,早在2023年3月,蒋利顺、何凡就开始接触中环海陆实控人吴君三,谋求上市公司控制权,在随后签订的一系列协议中,双方甚至已经就…

    2025年4月26日
    5300
  • 排队时吸烟,将罚款上千元?网友:建议全国推广

    据大湾区之声26日消息,为进一步降低吸烟率、保障公众健康,香港特区政府25日在宪报刊登《2025年控烟法例 (修订) 条例草案》(《条例草案》),并将于4月30日(星期三)提交立法会进行首读及二读。 《条例草案》中提出多项控烟措施,来港旅客一定要注意! 26日下午,相关话题“香港排队等候时吸烟将罚3000港元”冲上热搜。 带超过19支烟过关 罚款将增至500…

    2025年4月27日
    6500
  • “过继”饿了么参团,淘宝闪购一张“A”如何对抗京东美团大小王

    文|新立场 饿了么公众号推文显示,截至 5 月 5 日,平台来自淘宝闪购的单日外卖订单量已经超过 1000 万单,且有 39 座城市的饿了么外卖订单量突破了历史单日峰值。 京东 2 月入局外卖,4 月与美团的战事升级,一开始"置身事外"的阿里最终没能坐得住,饿了么在 4 月最后一天宣布进一步加大平台补贴力度,开启平台"饿补超百亿"大促。进入 5 月,这种"迫…

    2025年5月10日
    2200
  • 美国洛杉矶警方向抗议人群开枪,反映了警察执法与民众权利之间的张力

      2025年6月8日,美国洛杉矶市中心发生一起警方与抗议者之间的激烈冲突事件。据央视新闻客户端报道,洛杉矶警方在联邦执法机构附近与抗议人群对峙,最终在冲突中向人群开枪,导致多人受伤。这一事件迅速引发全国范围内的关注与讨论。   据现场目击者描述,抗议者聚集在爱德华罗伊巴尔联邦大楼附近,要求政府采取行动,以解决种族歧视、警察暴力执法等问题。然而,警方在试图驱…

    2025年6月9日
    2700
  • 暴雨预警升级!今年第一号台风有消息了……

    6月7日是高考首日 南方迎来新一轮降雨 江淮、江汉、江南等地 于今日进入降水最强时段 中央气象台6月7日10时发布暴雨黄色预警。预计,6月7日14时至8日14时,江淮南部、江汉东南部、江南北部、贵州中南部、广西西北部等地部分地区有大到暴雨,其中,安徽南部、江苏南部、湖北东部、浙江西北部等地部分地区有大暴雨(100毫米至180毫米)。上述部分地区伴有短时强降水…

    2025年6月8日
    1900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信