LLM 应用的 Pytest 终于来了! DeepEval 将 LLM 评估转化为一个两行的测试套件,帮助您识别最佳模型、提示和 AI 工作流(包括 MCPs)的架构。 与所有框架兼容,如 LlamaIndex、CrewAI 等。 100% 开源,拥有 11k 星!