Tem um Mac com um chip M? Agora você pode treinar o Gemma3 270m localmente como um modelo multilíngue de incorporação ou reclassificação usando nosso projeto mlx-retrieval. Ele permite que você treine Gemma3 270m localmente a 4000 tokens/s no M3 Ultra - essa é realmente a velocidade utilizável. Implementamos algumas práticas padrão para treinar um modelo eficaz de incorporação ou reclassificação somente decodificador com MLX: LoRA total/parcial, InfoNCE, acúmulo de gradiente e carregador de dados de streaming. Além disso, integração MTEB para loops de avaliação de trem.
29,36K