The text prompt for video generation. Supports Chinese and English, max 800 characters.
The duration of the generated video in seconds
The aspect ratio of the generated video
Video resolution tier
Negative prompt to describe content to avoid. Max 500 characters.
Whether to enable prompt rewriting using LLM. Improves results for short prompts but increases processing time.
Random seed for reproducibility. If None, a random seed is chosen.
A configurable parameter. Defaults to true in the Playground.
The text prompt describing the desired video motion
Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB
URL of the image to use as the first frame. Must be publicly accessible
The duration of the generated video in seconds
Video resolution. Valid values: 720p, 1080p
Negative prompt to describe content to avoid
Whether to enable prompt rewriting using LLM
Random seed for reproducibility. If None, a random seed is chosen
A configurable parameter. Defaults to true in the Playground.
Wan 2.5 API:多模态视频与原生音频同步接口
强大的文生视频与图生视频 API 底层架构,支持生成 10 秒高清内容,提供无缝的原生唇音同步与音视频联合生成体验。

探索 Wan 2.5 文生视频与图生视频 API 的能力
基于 Wan 2.5 文生视频 API 构建电影级构图
The wan2.5-t2v-preview api processes natural language prompts into dynamic video sequences. This endpoint accurately interprets multi-subject interactions and complex camera instructions, ensuring continuous motion and narrative consistency.
基于 Wan 2.5 图生视频 API 实现高一致性画面扩展
The wan2.5-i2v-preview api animates static reference frames by calculating realistic motion vectors and lighting shifts. This workflow strictly preserves the geometry, product designs, and branding of the initial asset throughout the timeline.
阿里云 Wan 2.5 API 的核心基础设施特性
通过 Wan 2.5 AI API 实现原生音频生成与精准同步
Wan API 可在单次生成中同步合成视频画面与匹配的音频。它能够直接生成人声、环境音和背景配乐,并与画面动作及人物唇形实现数学级的精准对齐。
通过 Wan API 输出帧率稳定的高清视频
Wan 2.5 AI API 能够以稳定的 24fps 渲染高保真 1080P 视频。它大幅减少了运动伪影,并自始至终保持一致的帧率,确保视觉画面的平滑与连贯。
万相 (Wan) 2.5 API 预览版的高级指令理解能力
该模型具备深度语义处理能力,能够精准解读复杂、动态变化的文本指令。即使在较长的多轮生成周期内,也能准确追踪多主体逻辑并保持叙事的连贯性。
通过统一的 Wan 2.5 API 接口实现精细化运镜控制
万相 (Wan) 2.5 API 可直接根据文本提示词,精准处理多轴平移、俯仰和缩放等详细的电影级镜头指令。在流畅执行复杂运镜的同时,完美保持逼真的透视效果与画面元素的几何结构。
为什么选择 EMix.ai 集成 Wan 2.5 API
7x24 小时全天候企业级技术支持
生产级工作流需要极高的可用性。EMix.ai 提供全天候的技术监控与持续的开发者支持,确保高并发请求下 Wan AI Video API 调用的稳定可靠。
7x24 小时全天候企业级技术支持
生产级工作流需要极高的可用性。EMix.ai 提供全天候的技术监控与持续的开发者支持,确保高并发请求下 Wan AI Video API 调用的稳定可靠。
透明且高性价比的预算弹性扩展
EMix.ai 采用经济实惠且可预测的按需计费模式。团队可直接在平台官方费率页面查看最新的 Wan 2.5 API 价格表,以分析当前的运营指标。
接入前提供免费测试额度
为便于在上线部署前验证工作流兼容性,EMix.ai 为开发者提供免费的 Token 额度,以便在测试环境中全面验证 Wan 2.5 API 密钥并测试视觉工作流。
如何接入阿里通义万相 (Wan) 2.5 API
获取授权并配置您的 Token
为安全地与平台交互,工程师必须配置有效的 Wan 2.5 API 密钥。该 Token 必须作为标准的 Bearer Token 包含在 HTTP 请求头中,以对进入受保护端点的所有请求负载进行授权。
初始化音视频生成任务
向您选定的核心模型端点提交请求,传入文本指令或参考图像资源等必要的输入配置。系统接收这些参数后,将在单次生成循环中构建出音画同步的视频。
配置自动回调通知
开发者无需反复轮询系统获取状态更新,可以在创建任务时提供可选的 callback URL 参数。生成过程完成后,基础设施会自动向您指定的服务器发送包含完成状态的 Webhook 通知。
获取最终任务详情与媒体资源
成功提交任务后,接口将返回唯一的任务标识符(ID)。若未配置回调 URL,开发团队可将该标识符传入统一查询接口以监控进度,处理潜在的校验或额度错误,并获取最终的视频资源链接。
Wan 2.5、Veo 3 与 Kling 2.5 对比
万相 Wan 2.5 API 生产环境应用场景
音频响应式环境光照模拟工作流
开发团队可借助 Wan 2.5 图生视频 API,将环境光照、频闪频率及阴影变化与输入的任何音频轨道自动同步,彻底免除终端用户手动调整 3D 关键帧的繁琐操作。
场景感知音效设计与环境拟音融合
研发团队可通过统一的 Wan AI Video API 分析无声视频素材,并自动渲染出完整的混音轨道,将逼真的空间音效与自然环境音直接融入制作时间线中。
高保真数字人播报视频生成服务
企业开发者可使用 Wan 2.5 API 将静态人物肖像与音频脚本转化为数字人播报视频,在完美锁定面部几何特征的同时,驱动与音频精准同步的逼真表情。
剧本驱动的电影级视觉预演功能
开发团队可以利用 Wan 2.5 文生视频 API,将原始剧本与复杂的镜头指令转化为符合真实物理规律的稳定视频草稿,让创作者能够即时预览运镜与构图效果。
Wan 2.5 基础设施接入常见问题
Can developer teams test the Wan 2.5 interface via a free online trial before committing to production infrastructure?
Yes. EMix.ai provides a free online trial with dedicated credit quotas, allowing developer teams to instantly evaluate the Wan 2.5 text to video API and experience its native features without upfront billing.