Ai un Mac cu un cip M? Acum puteți antrena Gemma3 270m local ca model multilingv de încorporare sau reranker folosind proiectul nostru mlx-retrieval. Vă permite să antrenați Gemma3 270m local la 4000 jetoane/s pe M3 Ultra - aceasta este de fapt viteza utilizabilă. Am implementat câteva practici standard pentru antrenarea unui model eficient de încorporare sau reranker numai pentru decodor cu MLX: LoRA complet/parțial, InfoNCE, acumulare de gradient și încărcător de date de streaming. Plus integrare MTEB pentru bucle de evaluare a trenurilor.
29,37K