Vidu
免费
Vidu 是北京生数科技联合清华大学发布的视频大模型,官方称其为中国首个长时长、高一致性、高动态性视频大模型。它支持文生视频、图生视频与参考生视频,主打多主体一致性与极速生成,并提供 API 开放平台与创作者计划。
核心参数与统计
Vidu 是北京生数科技联合清华大学发布的视频大模型,官方称其为“中国首个长时长、高一致性、高动态性视频大模型”,主张“让想象发生”。它把文生视频、图生视频与参考生视频三种模式整合,主打多主体一致性与极速生成。
| 项目 | 公开信息 |
|---|---|
| 官方定位 | 长时长、高一致性、高动态性视频大模型 |
| 生成模式 | 文生视频、图生视频、参考生视频 |
| 标志能力 | 全球首个参考生视频、多主体一致性 |
| 多主体上限 | 参考生视频可上传最多 7 张主体图片 |
| 输出画质 | 支持至 1080p 高清输出 |
| 生成速度 | 官方称视频约 10 秒级生成 |
| 配套能力 | AI 音效、AI 生图、主体库、模板库、API 开放平台 |
| 支持平台 | Web、Android、iOS、API |
参考生视频是核心差异:官方称 Vidu 为全球首个参考生视频功能,上传多张参考图即可融合多个视觉元素并保持主体一致,适合需要角色/物体跨镜头一致的创作。
速度与画质并重:官方主打约 10 秒级的快速生成与高品质动漫动画,配合错峰模式无限积分,降低高频试错成本。
从生成到工作流:除核心视频生成外,提供主体库、模板库、AI 音效与 API 开放平台,把单点生成扩展为可复用的创作流程。
用户与市场认可
Vidu 的认可主要来自全球创作者社区的口碑与其技术首发地位,而非公开的营收数字(后者官方未披露)。
技术首发地位:官方定位为中国首个长时长、高一致性、高动态性视频大模型,由生数科技联合清华大学研发,在国产视频大模型阵营中具有标志性意义。
创作者口碑集中:官网展示大量海外创作者评价,反复强调其在动漫风格、生成速度与多主体一致性(Multi-Entity Consistency)上的表现,说明它在动漫与短视频创作群体中有真实使用与传播。
落地前提:视频生成质量高度依赖提示词与参考图质量,使用时应结合主体库与模板库提升一致性,并对商业用途的素材版权与肖像合规做核验。
成本优势:用免费积分与错峰无限降低高频试错成本
Vidu 的成本优势在于提供免费积分入口与错峰无限积分机制,让创作者在高频试错时显著降低单次生成成本。
C 端 / 个人:所有用户可获得一定数量免费积分,无需付费即可生成视频;订阅套餐提供更高积分与更快生成,错峰模式提供无限积分,具体档位以官方订阅页为准。
创作者计划:提供创作者计划与艺术家计划(CPP),面向活跃创作者给予额外权益与扶持。
企业 / API:提供 API 开放平台,面向企业与开发者的规模化调用,相关计费以官方 API 文档与商务确认为准。
真实成本结构:对视频生成而言,订阅费之外的关键变量是“目标画质/时长对应的积分消耗”与“达到满意效果所需的重试次数”。错峰无限积分可缓解试错成本,但高峰期高画质生成仍消耗积分,评估时应结合实际创作量与画质要求测算。
Vidu 的主要功能
Vidu 的能力围绕“高一致性视频创作全流程”设计,公开能力可归纳为五类:
- 参考生视频:上传最多 7 张主体图片,融合多个视觉元素并保持人物、物体、场景的一致性。
- 图生视频与首尾帧:从静态图片生成动态视频,支持自定义首帧与尾帧优化过渡流畅度。
- 文生视频:从文字描述直接生成视频,配合高级镜头运动设计。
- 主体库与模板库:把角色、道具、场景存入主体库一键复用;模板库提供亲吻、拥抱、AI 换装等爆款玩法。
- AI 音效与 AI 生图:补齐配音与配图能力,形成更完整的创作链路。
能力的实际效果,关键看三点:多主体一致性是否稳定、生成速度与画质是否平衡、以及模板与主体库能否提升复用效率。
Vidu 的模型与版本演进
Vidu 的版本脉络以 Q 系列模型迭代为主线,持续强化一致性、画质与速度。
起点:Vidu Q1
Q1 奠定了长时长、高一致性视频生成的基础能力,确立 Vidu 的技术方向。
迭代:Vidu Q2 / Q2 Pro
Q2 强化主体一致性与画质,Q2 Pro 面向更高质量需求,是能力进一步成熟的阶段。
当前:Vidu Q3 与 Vidu Claw
Q3 延续多主体一致性与高速生成;同期推出 Vidu Claw“AI 创意员工”,输入想法即可解锁场景化创作。官方未公开各版本精确发布日期。
Vidu 的技术优势
Vidu 的技术优势可以拆成“多主体一致性 — 语义理解与运镜 — 极速生成”的因果链。
多主体一致性保证可用性:参考生视频通过多张参考图融合,确保人物、物体、场景在视频中保持一致,这是广告、影视等需要角色连贯场景的关键前提。
语义理解与运镜提升表现力:官方强调强语义理解能力与高级镜头运动设计,让创作者无需复杂制作流程即可获得电影级镜头表现。
极速生成支撑高频创作:约 10 秒级的快速生成配合错峰无限积分,让创作者可以快速迭代,显著缩短从想法到成片的周期。
如何使用 Vidu
Vidu 提供 Web、移动端与 API 多种入口,典型路径如下:
- 选择生成模式:在创作页选择文生视频、图生视频或参考生视频。
- 上传参考与提示:参考生视频上传至多 7 张主体图,或输入文字/上传图片并撰写提示词。
- 生成与优化:生成后用首尾帧、主体库与模板进一步优化一致性与效果。
- 企业接入:通过 API 开放平台把视频生成能力集成到自有业务系统。
入门建议先用免费积分验证目标风格(如动漫、广告)的生成质量与一致性,再根据创作量选择订阅套餐或错峰模式。
Vidu 的产品定价
Vidu 采用“免费积分 + 订阅套餐 + 错峰无限 + API”的组合模式,计费围绕积分与生成画质/速度展开:
| 层级 | 面向对象 | 公开信息 |
|---|---|---|
| 免费 | 个人 | 所有用户获赠一定数量免费积分 |
| 订阅套餐 | 高频创作者 | 更高积分与更快生成,价格以订阅页为准 |
| 错峰无限 | 高频创作者 | 错峰模式提供无限积分 |
| 创作者计划 | 活跃创作者 | 额外权益与扶持(CPP) |
| API | 企业 / 开发者 | 规模化调用,计费以 API 文档与商务确认为准 |
具体价格档位、积分额度与免费赠送以 vidu.com 实时页面为准。
Vidu 的应用场景
- 动漫与二次元创作:利用高品质动漫动画能力制作角色动作流畅的动漫视频。
- 社媒爆款短视频:用模板库的亲吻、拥抱、AI 换装等玩法快速产出传播内容。
- 广告与营销:用参考生视频更改广告背景、让产品图动起来,提升广告生动度。
- 影视与动画制作:影视工作室与动画团队制作电影级动画与专业级内容。
- 企业内容自动化:通过 API 把视频生成嵌入营销与内容生产流程。
各场景的核验重点不同:动漫关注风格与动作流畅度,广告关注主体一致性与品牌契合,影视关注画质与镜头表现。
Vidu 的适用人群
- 独立创作者:追求快速产出动漫与短视频、注重一致性与速度的个人创作者。
- 影视与动画团队:需要电影级动画与专业内容、对主体一致性要求高的创作团队。
- 企业与品牌:需要规模化产出营销视频、希望通过 API 集成的商业用户。
不适配边界:对生成内容版权、肖像与商业授权有严格要求的用途,需提前核验素材与肖像合规;预算敏感且生成量大的团队,应先测算高画质生成的积分消耗。
总结与展望
Vidu 的核心竞争力在于由生数科技联合清华大学打造的高一致性、高动态性视频大模型,以全球首个参考生视频与多主体一致性建立差异化,并配合主体库、模板库、AI 音效与 API 形成完整创作链路。当前的不确定项在于:各模型精确发布日期、用户规模与营收官方均未公开,高画质生成的积分消耗随场景浮动,商业使用的版权与肖像合规也需逐项确认。
对计划采用的团队,建议先用免费积分验证目标风格的生成质量与多主体一致性,再按创作量选择订阅或错峰无限套餐;涉及广告投放与商业发布时,应在扩展前确认生成内容的版权、肖像授权与 API 计费等关键条款。
版本信息
- Vidu Q3 :当前主力视频模型版本,延续多主体一致性与高速生成能力,支持文生、图生与参考生视频;同期推出 Vidu Claw“AI 创意员工”,输入想法即可解锁场景化创作。暂无官方精确发布日期。
- Vidu Q2 / Q2 Pro :上一代主力模型,强化主体一致性与画质,Q2 Pro 面向更高质量需求,是 Q3 的前代版本。暂无官方精确发布日期。
- Vidu Q1 :早期版本,奠定 Vidu 在长时长、高一致性视频生成方向的基础能力。暂无官方精确发布日期。
用户评价