Finalmente, o modelo de código aberto de vídeo baseado em som está aqui! Wan2.2-S2V, um modelo paramétrico 14B projetado para animação humana cinematográfica baseada em áudio. Vá além da sincronização labial comum e use sua voz para conduzir os movimentos dos personagens! E é de código aberto! Este modelo é muito adequado para criadores de conteúdo produzirem histórias imersivas de IA. Também o melhor parceiro para ListenHub e FlowSpeech!
12,16K