Pytest för LLM Apps är äntligen här! DeepEval förvandlar LLM-evals till en tvåradig testsvit för att hjälpa dig att identifiera de bästa modellerna, uppmaningarna och arkitekturen för AI-arbetsflöden (inklusive MCP). Fungerar med alla ramverk som LlamaIndex, CrewAI, etc. 100 % öppen källkod med 11 000 stjärnor!