Наконец-то пришла открытая модель видео, управляемая звуком! Wan2.2-S2V — это модель с 14 миллиардами параметров, специально разработанная для анимации человеческого тела, управляемой аудио уровня кино. Она превосходит обычную синхронизацию губ, позволяя управлять движениями персонажа с помощью звука! И она также является открытой! Эта модель идеально подходит для создателей контента, создающих погружающие AI истории. Она также является отличным партнером для ListenHub и FlowSpeech!
12,15K