Finalmente, o modelo de vídeo acionado por som de código aberto chegou! Wan2.2-S2V, um modelo de 14B parâmetros projetado especificamente para animação corporal acionada por áudio de nível cinematográfico. Supera a simples sincronização labial, acionando os movimentos dos personagens com som! E ainda é de código aberto! Este modelo é perfeito para criadores de conteúdo que produzem histórias imersivas com IA. É também o melhor parceiro do ListenHub e do FlowSpeech!
12,15K