Pytest для LLM приложений наконец-то здесь! DeepEval превращает оценку LLM в тестовый набор из двух строк, чтобы помочь вам определить лучшие модели, подсказки и архитектуру для AI рабочих процессов (включая MCP). Работает со всеми фреймворками, такими как LlamaIndex, CrewAI и т.д. 100% с открытым исходным кодом с 11k звездами!