赛道Hyper | PixVerse国内版上线:AI视频市场生变?

作者:周源/华尔街见闻

全球用户量领先的AI视频生成平台——PixVerse,于6月6日推出国内版产品“拍我AI”,同步上线网页端及移动端应用,并开放最新V4.5模型供用户使用。

V4.5模型在生成速度、画面精细度及多主体控制等方面实现了提升。

首先是专业运镜系统,集成20余种电影镜头模板(如希区柯克变焦和一镜到底等),通过深度学习分析经典电影镜头运动轨迹,实现AI自动化的专业运镜。

用户可调节焦距变化速度(0.1-10倍速)、镜头抖动幅度(0-5 级模拟斯坦尼康效果)等参数,生成具有电影质感的动态画面。

其次,多模态融合技术,支持最多8张图片输入,通过SE(3)等变网络,实现多图像空间关系解算,结合Transformer的时序注意力机制保证画面连贯性,自动生成包含起承转合的20秒完整片段。

所谓SE(3)等变网络,是一种在三维空间中,具有旋转和平移等变性质的神经网络,能自动学习对旋转和平移等变的特征表示,从而在各种三维相关的任务中取得更好的性能。

通俗点说,SE(3)等变网络的工具价值就是:给它“看”一个玩具汽车3D模型,正着放、倒着放、挪到左边右边,这个网络都能明白这是同一辆玩具汽车,还能自动抓住这个汽车最关键的特征,像轮子、车身形状这些。

这样一来,不管是用来给3D模型分类、分析蛋白质的结构,还是帮机器人在3D空间里找路,SE(3)等变网络都能比普通网络做得更好,从而更准确地完成任务。

通过多模态融合技术,用户可将人物、背景和道具图像结合,生成风格一致的叙事视频,提升复杂场景的创作自由度。

第三,优化复杂动作,针对高速运动、群体交互等动态场景,模型凭对抗训练,能优化动作流畅度,相比V4.0提升约30%,减少了扭曲与伪影,适合体育、战斗等对动态表现要求较高的场景。

海外有测试用户,成功使用单一图像生成《不可能的任务》(Mission:Impossible)风格的动作场景,验证了模型的多功能性。

第四,本地化或端侧适配,新增中文提示词支持、智能音效匹配及多语言界面(覆盖英语、中文等7种语言),并针对移动端做了计算图优化和模型轻量化,未来有望实现实时电影级视频创作。

PixVerse自2024年1月海外上线以来,已累计吸引全球超6000万用户,月活跃用户(MAU)突破1600万,居于AI视频生成领域前列;其爆款特效如“毒液变身”,在TikTok等社交平台累计播放量达数十亿次,并多次登顶美国、德国、巴西等国家的应用商店榜单。

啥叫“毒液变身”?

这是指爱诗科技旗下AI视频生成工具PixVerse V3推出的一款特效功能,用户上传人、动物的照片,甚至是水果等物体的图片,都能一键将其变身为毒液造型。

使用该特效时,用户可在PixVerse官网选择V3模型,点击“Effect”按钮,选择“毒液变身”特效并上传照片,然后等待生成即可。

生成的毒液变身视频效果丝滑,黑色的黏稠物质仿佛有生命般在物体表面流动,其独特的质感和光影效果,能让视频在海量内容中脱颖而出。

2025年初,V4.5版本上线后,其App在美国iOS总榜排名一度位列第四,成为广受欢迎的应用。

PixVerse是爱诗科技旗下专注于元宇宙场景下AI视觉创造的产品。爱诗科技是一家专注于AI视频生成技术研发与应用的公司。

2023年4月,字节跳动前AI Lab视觉技术负责人王长虎创立爱诗科技,团队核心成员由来自微软、字节跳动等顶尖企业的技术专家组成。

国内版“拍我AI”延续了海外市场的技术优势,同时针对中国用户习惯做了优化。

采用“App+网页端”双端策略,App端主打趣味化、低门槛体验,内置百余种创意模板(如宠物跳舞、喷火特效),用户上传一张照片,即可一键生成高质量短视频;网页端则面向专业创作者,提供精细的参数调节功能,支持多主体运动控制、动态运镜及智能音效匹配,适用于短剧制作、广告创意等高阶需求。

PixVerse母公司北京爱诗科技近期完成近3亿元A2至A4轮融资,由蚂蚁集团、北京市人工智能产业投资基金、国科投资等机构投资,资金将主要用于技术研发、算力扩展及人才团队建设,加速产品功能迭代与市场覆盖。

目前,全球AI视频生成领域呈现多元化竞争态势。

Runway Gen-4以人物一致性见长,Higgsfield AI的DoP I2V-01模型强调专业运镜,Kling和Sora则在长视频生成上占优。

国内市场方面,快手的可灵AI、抖音的即梦AI及PixVerse形成头部竞争格局,其中可灵AI凭借VideoTetris框架,支持最长2分钟视频生成;即梦AI依托字节跳动生态实现“60秒生成5秒视频”的极速体验,而PixVerse在影视级创作领域具有优势。

技术的迭代永无止境,尽管V4.5模型在技术上取得进展,但仍面临复杂多人场景稳定性不足、长视频生成能力有限(当前最长8秒)等问题。

此外,AI视频生成的高算力需求(如Sora模型训练算力需求是GPT-4的4.5倍)也对企业的成本控制提出挑战。

PixVerse国内版“拍我AI”的发布,意味着AI视频生成技术在中国市场的进一步渗透。

V4.5模型的技术优化、双端产品策略及企业级生态构建,为用户提供了高效的创作工具。AI视频生成正成为数字内容产业的重要工具,其影响将重塑内容生产、传播与消费的全链条。

平台声明:该文观点仅代表作者本人,联合网系信息发布平台。发布者:华尔街见闻,转转请注明出处:https://www.anesthesia.org.cn/17174.html

(0)
华尔街见闻的头像华尔街见闻
上一篇 2025年6月8日 下午3:52
下一篇 2025年6月8日 下午3:53

相关推荐

  • 宁德时代联合创始人李平及夫人廖梅向复旦大学一次性捐赠10亿元

    联合网4月23日消息,复旦大学校友李平、廖梅夫妇一次性捐赠10亿元人民币,支持建设复旦大学学敏高等研究院。 联合网注意到,李平是宁德时代(300750.SZ)联合创始人,并任公司副董事长。据《2025胡润全球富豪榜》,李平以520亿元的财富,排名第449位。 李平夫妇捐赠10亿元 支持建设复旦大学学敏高等研究院 据复旦大学官微4月23日发布的消息,复旦大学建…

    2025年4月23日
    4900
  • Citadel CEO Griffin批评特朗普关税:这些失去的工作再也回不来了

    Citadel创始人、亿万富翁肯·格里芬(Ken Griffin)近日尖锐批评特朗普政府的关税政策,断言其无法实现美国制造业就业回流的目标。 他认为,美国应聚焦于知识产权和内容创造等高价值优势领域,而非执着于无法挽回的工厂岗位。 这位共和党的巨额捐款人明确指出,通过关税壁垒让制造业工作重返美国的“梦想”虽值得肯定,但注定无法实现。 关税难阻趋势:制造业岗位难…

    2025年4月27日
    9800
  • 美债抛完日债抛,日债抛完欧债抛

    全球债券市场正上演"多米诺骨牌"式的抛售潮! 6月5日,欧洲央行周四如期降息,但欧央行行长拉加德(Christine Lagarde)的表态彻底改变了市场预期。她明确表示央行正在接近货币政策周期的尾声,并可能上调未来增长预测,这一鹰派转向瞬间引发交易员重新布局。 随着市场迅速消化了欧洲央行可能暂停宽松步伐的预期,大多数欧元区成员国的两年期国债收益率至少收涨5…

    2025年6月6日
    1800
  • 赛道Hyper | iPhone 17系列受困核心材料缺货

    作者:周源/华尔街见闻 iPhone 17系列备货正受耗材缺货影响而显得压力重大。 一种称为低热膨胀系数(Low CTE)玻璃纤维布的材料,当前面临缺货窘境。 华尔街见闻从供应链获悉,由于低热膨胀系数玻璃纤维布材料缺货,导致苹果新一代智能手机iPhone 17系列备货极为紧张。 “库克急得跳脚,天天催迫供应商。”供应链人士告诉华尔街见闻,“这玩意儿影响很大,…

    2025年4月21日
    10900
  • 爱奇艺也要来抢直播带货的蛋糕了

    作者 | 黄昱 编辑 | 王小娟 前有淘宝、抖音,后有小红书、微信视频号,如今长视频平台出身的爱奇艺,也要跻身直播电商这一赛道了。 4月23日,在“2025爱奇艺世界·大会”上,爱奇艺创始人、CEO龚宇宣布,今日爱奇艺内容电商上线,内容会涉及爱奇艺的IP内容、艺人明星等,主要是做直播带货,爱奇艺会员将是潜在最大的电商用户。 也就是说,在成立15年后,已拥有超…

    2025年4月24日
    6000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信