¡Pytest para aplicaciones LLM finalmente está aquí! DeepEval convierte las evaluaciones de LLM en una suite de pruebas de dos líneas para ayudarte a identificar los mejores modelos, prompts y arquitecturas para flujos de trabajo de IA (incluidos los MCPs). Funciona con todos los frameworks como LlamaIndex, CrewAI, etc. ¡100% de código abierto con 11k estrellas!