Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
3 migliori pratiche per scrivere valutazioni sull'AI:
1. Bilanciare velocità e rigore
Inizia con una dozzina di casi di test e iterare da lì. Non costruire centinaia quando stai ancora apportando modifiche significative ai prompt. Identifica e risolvi i principali modi di fallimento, poi espandi la copertura.
2. Ossessionati sui criteri di valutazione e sulle etichette manuali
I tuoi criteri di valutazione e il dataset d'oro sono la base di tutto il resto. Non c'è modo di evitare di fare questo lavoro manuale nei fogli di calcolo - ossessionati nel rendere buone le tue etichette umane.
3. Non scalare prematuramente il giudice LLM
Punta a un allineamento di ~80% tra il tuo giudice LLM e i valutatori umani prima di scalare. Controlla regolarmente i risultati - non dare per scontato che sia sempre corretto.
Domani condividerò una guida per principianti sulle valutazioni AI che illustra un esempio passo-passo che chiunque può seguire.
📌 Iscriviti per riceverlo nella tua casella di posta:
(P.S. Questo è come immagino che appaia un giudice LLM)

2,15K
Principali
Ranking
Preferiti