Travailler sur l'évaluation basée sur des traces réelles et soutenir @langfuse @braintrustdata et Langsmith de @LangChainAI a été super excitant. Nous voulons aider les développeurs à évaluer ce qui compte vraiment, pas un benchmark académique isolé.