阿里云開源多模態視頻生成模型
8月26日,阿里開源全新多模態視頻生成模型通義萬相Wan2.2-S2V,僅需一張靜態圖片和一段音頻,即可生成面部表情自然、口型一致、肢體動作絲滑的電影級數字人視頻,該模型單次生成的視頻時長可達分鐘級,大幅提升數字人直播、影視制作、AI教育等行業的視頻創作效率。
文章評價

發布
發布
8月26日,阿里開源全新多模態視頻生成模型通義萬相Wan2.2-S2V,僅需一張靜態圖片和一段音頻,即可生成面部表情自然、口型一致、肢體動作絲滑的電影級數字人視頻,該模型單次生成的視頻時長可達分鐘級,大幅提升數字人直播、影視制作、AI教育等行業的視頻創作效率。