🚨 Apple тільки що випустила FastVLM на Hugging Face - 0.5, 1.5 і 7B VLM реального часу з підтримкою 🤯 WebGPU
> у 85 разів швидше та в 3,4 рази менше, ніж VLM аналогічного розміру
> в 7,9 рази швидший TTFT для більших моделей
> призначений для виведення меншої кількості вихідних токенів і скорочення часу кодування зображень з високою роздільною здатністю
Бонус: працює в РЕАЛЬНОМУ часі безпосередньо у вашому браузері на базі transformers.js та WebGPU 🔥
Спробуйте це на демонстрації нижче 👇
🚨 Apple тільки що випустила FastVLM на Hugging Face - 0.5, 1.5 і 7B VLM реального часу з підтримкою 🤯 WebGPU
> у 85 разів швидше та в 3,4 рази менше, ніж VLM аналогічного розміру
> в 7,9 рази швидший TTFT для більших моделей
> призначений для виведення меншої кількості вихідних токенів і скорочення часу кодування зображень з високою роздільною здатністю
Бонус: працює в РЕАЛЬНОМУ часі безпосередньо у вашому браузері на базі transformers.js та WebGPU 🔥
Спробуйте це на демонстрації нижче 👇
НОВИНКА: Apple випускає FastVLM і MobileCLIP2 на Hugging Face! 🤗
Моделі до 85 разів швидші та в 3,4 рази менші за попередні роботи, що дозволяє використовувати програми VLM у реальному часі! 🤯
Він навіть може робити субтитри до відео в реальному часі на 100% локально у вашому браузері (без встановлення). Величезне за доступність!