摘要:阿里开源多模态视频生成模型通义万相Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。
【阿里开源视频生成模型Wan2.2-S2V】财联社8月26日电,阿里开源多模态视频生成模型通义万相Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。
来源:财联社
摘要:阿里开源多模态视频生成模型通义万相Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。
【阿里开源视频生成模型Wan2.2-S2V】财联社8月26日电,阿里开源多模态视频生成模型通义万相Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。
来源:财联社