¡Finalmente, ha llegado el modelo de código abierto de video impulsado por sonido! Wan2.2-S2V, un modelo de 14B parámetros diseñado específicamente para animaciones corporales impulsadas por audio de nivel cinematográfico. ¡Supera la simple sincronización de labios, impulsando las acciones de los personajes con sonido! ¡Y además es de código abierto! Este modelo es ideal para que los creadores de contenido produzcan historias inmersivas con IA. ¡También es el mejor compañero de ListenHub y FlowSpeech!
17,57K