終於,聲音驅動視頻的開源模型來了! Wan2.2-S2V,一個專為電影級音頻驅動人體動畫設計的 14B 參數模型。 超越普通的對口型,用聲音驅動角色動作! 而且它還是開源的! 這個模型非常適合內容創作者製作沉浸式 AI 故事。 也是 ListenHub 和 FlowSpeech 的最佳搭檔!
4.22K