AI视频竞争白热化:从Veo到Vidu Q2,谁能攻克可控性与成本难题
短短半年间,AI视频的主角历经变化了三次名字,年初之时是Veo,春天的时候轮到了Sora2,而如今在业内,大家将赌注压在了即将上线问世的 Vidu Q2上。有能力同时解决「可控性」以及「成本」这两个极为棘手难题的,才拥有那坐定牌桌的资格。
Sora2 曾花费三天时间登上美区榜首 ,媒体称赞它为“下一个关键时机”。然而冷静审视数据 一周内有62.7万次下载 仅仅等同于当年同期的四分之一 并且付费转化率低于5% 所谓的火 只是一时热度 留存才是困难所在 。
内里的局限被外表的热闹所掩盖不了。Sora2 的 Cameo 让用户@奥特曼去客串,这确实十分酷炫,然而却仅仅只能塞进三个人物,并且物体、场景全部都缺席了;想要让黑暗巨龙在工业风阁楼里进行盘旋吗,可以,不过得不停地去喂词,还要祈祷画面不会崩掉。
Vidu所行之径仿若“乐高积木”,其一次至多准许七张参考图,人物、道具以及场景等均可自由拼接,清华队伍将这般多模视觉指令写入底层,致使模型先“听懂”随后“着手” ,最终呈现出的结果是仅需经由一条提示词就能生成巨龙穿越楼宇的完整镜头,免去了反复进行试错这些步骤。
创作者最怕那种先生成然后再去修改的情况,Vidu 把修片工作提前到上传阶段来进行,通过三视图建立主体库,系统能够自动补充缺少的角度,专业模式会把像“霓虹氛围、F1.4 景深”这样的行话翻译成标准内容,使得新手也能够凭借一句话来调出电影光感。
Sora2存在亮点,它具备自动补充分镜的能力,在进行新闻播报环节之时,会十分贴心地去插入外景,其口型同步程度近乎达到影视级别,令人遗憾的是,这些能加分的项目仅仅在成片呈现方面得以体现,对于拍摄过程的控制仍旧处于“黑盒”状态,运镜指令时而成功时而失败。

首部门槛,被公认的乃是文生视频的一致性。在内测对比当中,Vidu生成的奥特曼持久维持肩甲比例;在同样的内测对比里,Sora2偶尔会将手臂伸展成为“橡皮人”模样。其中缘由十分直白:前者把参考图进行分块处理之后嵌入运动预测内;而后者呢,依旧采用统一潜空间去做妥协 。
动态自然度方面,两家的差距愈发类似“舞蹈老师与PPT制作者相比”这点。Vidu具备使水晶杯破裂之际碎片呈抛物线状飞散开来的能力,并且光线折射契合物理逻辑;Sora2在舞台灯光的情形当中常常会出现演员忽然定位定格的状况,其观感恰似网络延迟 。
Vidu的镜头追踪,可依据“右移15°”给出连贯移动,然而,同一指令放入Sora2后,镜头常常会跑丢人物主体,这是一个问题。另外,针对复杂动作,要求士兵在雨中跪地低语,Sora2虽能渲染雨和废墟,却会忘记让士兵跪地,也是一大难点。语义理解,又是另一座难关。
决定商业化速度的是算力成本,Gary估算,Sora2生成一分钟1080p视频,要消耗将近2000张A100 GPU卡时,而Vidu Q2在国产H20上跑同等时长,仅需600卡时,并且单帧耗电降低到了上一代的40%,价格优势不是口号,是电表读数。
从产品这一侧来看,凭借品牌能够以高价将 API 进行打包;而 Vidu 却推出了“分时代定价”,具体而言,普通创作者每月只需 49 元就可以使用到 720p 测试版,至于团队账号是按照生成时长来付费的,并且还会附带主体库共享。对于短视频工作室来讲,这样的情况相比租算力要便宜一个数量级。

市场博弈呈现出中美双线的格局,在最新的榜单当中,全球排名前十的文生视频模型里面,有七个席位是来自中国的,其中包括Vidu、Wan2.5,它们在国内比拼速度、比拼生态,而谷歌的Veo与Sora2则争先去保住旗舰地位,其版图已经不再是单极叙事了。
投资人看重技术壁垒,创作者留意可用性,而政策方面则更关心普惠。国产团队之所以赶在监管细则落地以前去投放供公众版本的参考生成,目的在于趁早积累真实用户,进行合规链路的验证 。
要是讲 Sora2 的成功属于“明星效应”这种情况,那么 Vidu 更近于“工匠思维”,它不存在爆点级别的 demo,然而却将每次的迭代限定于能够测量的指标,在 2024 年秋季解决“谁都能参考”这个问题,在今年年初速度提升了 3 倍,在 Q2 达成影视级别的一致性,其节奏稳定,并且每一步都切实可行。
发生了的真正的拐点是在月底。一旦Vidu Q2把可控性做成标准配置,行业会将注意力从“生成多酷”转向“制作多稳”。到那个时候,海外产品高成本、高门槛的弱点将会被放大,流量神话也难以避免地回归效率战。
Vidu存在着不足——当下仅支持1080p,长片推理还得排队等候;Sora2却早已迈向4K进程。然而站在消费端层面来看,“先将一分钟拍摄得平稳”可比“分辨率再次翻倍”更具备实际价值,这便是两条路线的底层差异所在。
不会在发布会上有AI视频的下一次洗牌,而是会在无数剪辑工位发生,那个让创作者第一时间想到“用它就行”的,才是真正的赢家。Sora2正享受着掌声,Vidu则准备开灯验货,故事远没到结束的时候。 ?
欢迎 你 发表评论: