Waver:开源视频生成模型

Waver

一、Waver是什么?

Waver是由Foundation Vision团队开源的「All-in-One」通用视频生成大模型,官方口号是 “Make your creativity groundbreaking”。它把文本-视频(T2V)、图像-视频(I2V)、多机位叙事、长时长高分辨率生成等能力整合到同一套权重里,无需额外微调即可直接输出5 s / 10 s、720 p / 1080 p的成品视频。

二、模型性能:

Artificial Analysis(2025-08-05 19:00 GMT+8)公开排行榜:Waver 1.0在运动质量、视觉质量、Prompt Following三项均位列第一,超越Runway Gen-4、Pika 2.0、Stable Video Diffusion等开源/闭源对手。

自建评测集

  • Waver-Bench 1.0:覆盖 1200+ 组复杂动作、光影、风格化prompt。
  • Hermes Motion-Testset:聚焦大规模人体与动物运动,人工盲评显示 Waver 领先第二名 18 %。

三、核心功能

文本-视频

  • 亮点:单句prompt 直接出片
  • 示例效果:“雨中玻璃罐里微型世界”——雨滴、蘑菇咖啡馆、小人撑伞,细节全部对齐

图像-视频

  • 亮点:任意静图「活」起来
  • 示例效果:把一张帆船照片变成半水下视角的10 s航行片段

多机位叙事

  • 亮点:原生支持镜头切换,角色/场景/光场一致
  • 示例效果:老工匠完工:近景手部→特写眼睛→全景工作室→情绪收束,4镜一气呵成

长时长输出

  • 亮点:最长 10 s 连续片段,情感动作更完整
  • 示例效果:企鹅百米冲刺:起跑、加速、撞线、减速,动作物理合理

高分辨率

  • 亮点:1080 p 原生,无需后超分
  • 示例效果:城市夜景+烟花航拍,灯牌文字清晰可辨

多艺术风格

  • 亮点:写实、动漫、黏土、毛绒、赛博朋克、Wes Anderson 等一键切换
  • 示例效果:王家卫复古滤镜+可口可乐机,胶片颗粒与霓虹光斑精准还原

运动皇冠

  • 亮点:人物/动物体育动作
  • 示例效果:大熊猫花样滑冰、老虎高山滑雪、袋鼠拳击,关节轨迹真实

四、需求人群

  1. 创意工作室:广告片头、MV、概念 PV 快速预演。
  2. 自媒体 & MCN:低成本生成高质感短视频,批量起号。
  3. 影视动画:分镜预览、特效预合成、风格探索。
  4. 教育与培训:医学/体育/军事等需要人体动态演示的场景。
  5. 电商 & 零售:商品 360° 动态展示、虚拟试穿。
  6. 独立开发者:开源可商用,二次开发门槛低。

五、应用场景

  • 广告创意:24K 金杏坠落慢动作 + 液体飞溅,一条 5 s 片头直接投放 TikTok Ads。
  • 文旅宣传:输入一张古镇照片,生成“晨雾+花瓣雨+游船穿梭”的 10 s 竖屏短片。
  • 动画分镜:导演一句“赛博曼谷飞狗出租车”,30 秒出 4 镜连贯故事板。
  • 体育教学:生成“托马斯全旋”第一人称视角,配合骨骼标注用于动作拆解。
  • 虚拟偶像:毛绒风格偶像在黏土世界开演唱会,跨次元联动。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流24群