Pytest pour les applications LLM est enfin là ! DeepEval transforme les évaluations LLM en une suite de tests en deux lignes pour vous aider à identifier les meilleurs modèles, prompts et architectures pour les flux de travail AI (y compris les MCP). Fonctionne avec tous les frameworks comme LlamaIndex, CrewAI, etc. 100 % open-source avec 11k étoiles !