Heb je een Mac met een M-chip? Je kunt nu Gemma3 270m lokaal trainen als een meertalige embedding of reranker model met ons mlx-retrieval project. Het stelt je in staat om Gemma3 270m lokaal te trainen met 4000 tokens/s op M3 Ultra - dat is eigenlijk een bruikbare snelheid. We hebben enkele standaardpraktijken geïmplementeerd voor het trainen van een effectief decoder-only embedding of reranker model met MLX: volledige/deeltijd LoRA, InfoNCE, gradient accumulatie en streaming data loader. Plus MTEB-integratie voor train-evaluatie loops.
29,36K