¡Finalmente, el modelo de código abierto de video basado en sonido está aquí! Wan2.2-S2V, un modelo paramétrico 14B diseñado para la animación humana cinematográfica impulsada por audio. ¡Ve más allá de la sincronización de labios ordinaria y usa tu voz para impulsar los movimientos de los personajes! ¡Y es de código abierto! Este modelo es muy adecuado para que los creadores de contenido produzcan historias inmersivas de IA. ¡También el mejor socio para ListenHub y FlowSpeech!
9.65K