Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A alocação online é o único caminho a seguir, apesar de ser lenta e dispendiosa em termos computacionais?
Inspirados pela teoria das perspetivas, fornecemos uma explicação centrada no ser humano para o motivo pelo qual a alocação online (por exemplo, GRPO) supera a alocação offline (por exemplo, DPO, KTO) e mostramos empiricamente como fechar a lacuna entre online e offline com o Humanline, um design simples, mas consistentemente eficaz, em duas partes.
💡Principal descoberta: Aplicar o humanline em cima de objetivos offline pode ter um desempenho equivalente aos seus homólogos online, tanto em seguimento de instruções quanto em raciocínio matemático. Ganhos consistentes em diferentes objetivos, famílias de modelos e tamanhos de modelos!
Mais em threads 🧵

Top
Classificação
Favoritos