У вас є Mac з M-чіпом? Тепер ви можете тренувати Gemma3 270m локально як багатомовну модель вбудовування або переранкера за допомогою нашого проекту з пошуку mlx. Це дозволяє тренувати Gemma3 на 270 метрів локально зі швидкістю 4000 жетонів/с на M3 Ultra - це фактично корисна швидкість. Ми впровадили кілька стандартних практик для навчання ефективної моделі вбудовування або перезавантаження лише декодера з MLX: повний/частковий LoRA, InfoNCE, градієнтне накопичення та потоковий завантажувач даних. Плюс інтеграція MTEB для циклів оцінювання поїздів.
29,14K