O Pytest para Aplicações LLM finalmente chegou! O DeepEval transforma as avaliações de LLM em uma suíte de testes de duas linhas para ajudá-lo a identificar os melhores modelos, prompts e arquiteturas para fluxos de trabalho de IA (incluindo MCPs). Funciona com todos os frameworks como LlamaIndex, CrewAI, etc. 100% open-source com 11k estrelas!