🚨 Apple acaba de lanzar FastVLM en Hugging Face: VLM en tiempo real de 0.5, 1.5 y 7B con soporte WebGPU 🤯
> 85 veces más rápido y 3,4 veces más pequeño que los VLM de tamaño comparable
> TTFT 7,9 veces más rápido para modelos más grandes
> diseñado para generar menos tokens de salida y reducir el tiempo de codificación de imágenes de alta resolución
Bono: funciona en tiempo real directamente en su navegador con tecnología transformers.js y WebGPU 🔥
Pruébelo en la demostración a continuación 👇
🚨 Apple acaba de lanzar FastVLM en Hugging Face: VLM en tiempo real de 0.5, 1.5 y 7B con soporte WebGPU 🤯
> 85 veces más rápido y 3,4 veces más pequeño que los VLM de tamaño comparable
> TTFT 7,9 veces más rápido para modelos más grandes
> diseñado para generar menos tokens de salida y reducir el tiempo de codificación de imágenes de alta resolución
Bono: funciona en tiempo real directamente en su navegador con tecnología transformers.js y WebGPU 🔥
Pruébelo en la demostración a continuación 👇
NUEVO: ¡Apple lanza FastVLM y MobileCLIP2 en Hugging Face! 🤗
Los modelos son hasta 85 veces más rápidos y 3,4 veces más pequeños que el trabajo anterior, lo que permite aplicaciones VLM en tiempo real. 🤯
Incluso puede hacer subtítulos de video en vivo 100% localmente en su navegador (instalación cero). ¡Enorme para la accesibilidad!