Cuối cùng, mô hình mã nguồn mở điều khiển video bằng âm thanh đã ra mắt! Wan2.2-S2V, một mô hình 14B tham số được thiết kế đặc biệt cho hoạt hình cơ thể điều khiển bằng âm thanh cấp độ điện ảnh. Vượt qua việc chỉ đồng bộ miệng thông thường, sử dụng âm thanh để điều khiển hành động của nhân vật! Và nó còn là mã nguồn mở! Mô hình này rất phù hợp cho các nhà sáng tạo nội dung sản xuất câu chuyện AI nhập vai. Cũng là đối tác tốt nhất của ListenHub và FlowSpeech!
5,34K