¡Pytest para aplicaciones LLM finalmente está aquí! DeepEval convierte las evaluaciones de LLM en un conjunto de pruebas de dos líneas para ayudarlo a identificar los mejores modelos, indicaciones y arquitectura para flujos de trabajo de IA (incluidos los MCP). Funciona con todos los frameworks como LlamaIndex, CrewAI, etc. ¡100% de código abierto con 11k estrellas!