宿华、王慧文注资,视频生成赛道再迎资本加码

6月22日,视频生成初创公司Sand.ai宣布完成新一轮融资,3个月内两轮融资金额合计超1亿美元,投资方包括快手创始人宿华、Lollapalooza Capital(王慧文家族办公室)、九坤创投、经纬创投等机构。另据记者了解,Sand.ai将于今年三季度开源新一代视频生成模型,采用MoE架构。

Sand.ai创始人曹越对第一财经记者表示,新模型将兼顾高效推理与目前开源领域较大参数规模,在人物一致及多镜头能力等方面追齐当前短剧商用等场景需求。

2023年,曹越参与美团联合创始人王慧文创立的光年之外,并担任算法联合创始人;2024年初,光年之外解散后,曹越创立Sand.ai。2025年,视频模型赛道遇冷,今年行业明显回暖,爱诗科技、智象未来、生数科技等公司宣布新融资,可灵AI、字节跳动Seedance系列、阿里通义万相Wan系列视频模型持续更新。

曹越对记者表示,2025年的“低温”主因行业缺少可验证的规模化营收标杆,投资人无法判断赛道真实市场空间;技术路线持续激烈争论,DiT、自回归路线价值无法落地验证。2026年,多家企业披露具体财务数据,二级市场给出清晰估值对标标的,一级机构重新测算视频赛道商业化天花板。

整体观察来看,曹越认为国内核心玩家底盘稳定,无头部企业出局,仅市场占有率会随新品迭代阶段性波动。核心原因是视频生成行业仍处于技术快速迭代周期,一款SOTA模型(最优模型)发布即可短期抢占舆论与商用客户注意力,一旦技术迭代放缓,市场声量会快速回落。相对国内,海外视频生成厂商——包括OpenAI Sora、Runway、Luma、Pika等,则呈现出收缩与战略调整的特征。

具体到企业产品,字节跳动Seedance2.0是今年“当红炸子鸡”。曹越认为,其核心优势在于多镜头叙事技术的提前布局。对比DiT扩散模型无法约束跨镜头空间逻辑的短板,他判断,多镜头一致性将成为区分视频模型商用价值的核心考核指标,也是B端付费客户筛选合作服务商的第一标准。

另外,Sand.ai持续押注的自回归路线也在今年得到验证。2024年,行业主流选择DiT,自回归属于小众争议路线,外界普遍不看好;2025年后,自回归路线认可度持续快速提升,头部厂商均有所布局。

对于今年自回归路线的热度,曹越对记者表示,驱动因素分为四层:首先是商用需求倒逼,短剧、影视B端客户对多镜头、长时序一致性需求爆发,DiT原生短板无法满足商业化刚需;其次,世界模型叙事升温,全球学界、产业统一认定时序预测是世界模型核心能力,自回归路线具备跨赛道长期价值;第三层是MoE稀疏技术成熟,能够解决自回归算力消耗过高的痛点;第四层是落地案例验证,多家自研自回归模型跑出优于DiT的长视频效果,路线可行性被实际数据证实。

接下来,曹越判断模型参数规模将持续放大,MoE稀疏架构成为行业标配;视频生成、视频理解双向能力统一融合;实时交互式视频生成技术规模化落地。该过程中,中国企业具备占据第一梯队的优势,因中美在视频生成领域几乎同时起步,数据与算力层面不存在类似大语言模型的资源差。

中信证券判断AI视频生成行业容量广阔,核心是模型能力突破与场景落地的正向循环,当前模型能力正处L3向L4升级期,预计2030年专业内容创作、广告设计制作、微短剧(含漫剧)、电影场景下的AI视频生成市场规模合计约450亿美元。考虑模型能力提升可以进一步打开AI视频可触及的增量市场规模与用户付费意愿,预估商业化符合阶梯式增长趋势,技术突破是转折点。

目前Sand.ai核心营收产品为音乐视频C端创作产品VidMuse,赛道长期年化ARR约30亿—50亿美元,目前仍处于极早期发展阶段,需求分散但总量庞大。即将发布的基于MoE架构的新模型有望通过MaaS服务成为第二增长区间,目前公司在国内与海外B端API市场同步开拓。

直通车game推荐阅读
OKX下载 交易所排行 比特币平台下载