LLM 應用的 Pytest 終於來了! DeepEval 將 LLM 評估轉化為一個兩行的測試套件,幫助您識別最佳模型、提示和 AI 工作流(包括 MCPs)的架構。 與所有框架兼容,如 LlamaIndex、CrewAI 等。 100% 開源,擁有 11k 星!