Pytest para aplicativos LLM está finalmente aqui! O DeepEval transforma as avaliações de LLM em um conjunto de testes de duas linhas para ajudá-lo a identificar os melhores modelos, prompts e arquitetura para fluxos de trabalho de IA (incluindo MCPs). Funciona com todos os frameworks como LlamaIndex, CrewAI, etc. 100% de código aberto com 11 mil estrelas!