新一代电影级视频创作
Wan 2.6 是阿里巴巴生态系统中最新的 AI 视频技术突破。这一强大模型能将简单的提示词和视觉输入转化为连贯的多镜头视频叙事。凭借增强的场景过渡、一致的角色渲染和精准的镜头控制,生成的视频呈现出专业制作的质感。支持生成最长 15 秒的高清视频,包含原生音频和精准口型同步。
生成模式
文生视频
将自然语言描述转化为电影级画面。理解多镜头提示和分镜脚本风格的描述,将镜头顺序、运镜方向、节奏和氛围转化为连贯的视频叙事。适用于脚本、创意简报和结构化场景描述。
图生视频
将静态图片动画化,同时保持主体身份和视觉风格。维持面部特征、比例、纹理和构图一致性。完美适用于人像、产品图片、插画和需要视频延展的图形素材。
参考生成
使用参考素材引导新场景生成。从参考视频中提取关键视觉特征,包括外观、风格和声音,并在新生成的内容中保持一致应用。实现跨多镜头的角色连续性和品牌一致性。
核心特性
多镜头电影叙事
先进的叙事引擎生成多镜头 1080p 视频,具备无缝转场、平衡节奏和自然运镜。解读分镜脚本风格的提示词和场景描述,创造连贯的视觉故事。
参考式身份保持
强大的参考系统从现有片段中提取外观、动作风格和声音特征。将这些属性一致地应用到新场景中,在整个视频制作过程中保持角色和风格的连贯性。
扩展时长与时序稳定
生成最长 15 秒的视频,同时保持高清画质和帧间一致性。增强的时序注意力机制确保光照、服装和环境细节在运动序列中保持稳定。
集成原生音频
在一个工作流中结合音频创作和镜头物理。生成同步对话、背景音乐和环境音效,配合精准口型同步,同时执行逼真的推拉摇移镜头,呈现完整的电影级输出。
应用场景

超现实电影动画
构建在环境、视角和光照条件之间流畅转换的表现力序列。完美适用于艺术短片、广告视觉和风格化叙事内容,具备稳定纹理和多镜头连续性。

超真实 ASMR 微距内容
生成具有精确微反射、一致景深和受控节奏的超细节微距场景。适用于 ASMR 创作者、产品细节展示、美食特写和触觉驱动的感官内容。

产品展示与品牌塑造
可靠的光照控制、清晰轮廓和精致的镜头过渡,适用于产品发布和品牌资产制作。以清晰度再现现代产品美学,服务于电商、营销和工业设计。

氛围科幻世界构建
开发具有大规模环境、飘散粒子和戏剧性光照的氛围感序列。在广阔的星球远景和室内场景之间保持结构连贯性,实现沉浸式世界构建和高概念叙事。