Pytest pentru aplicații LLM este în sfârșit aici! DeepEval transformă evaluările LLM într-o suită de teste pe două linii pentru a vă ajuta să identificați cele mai bune modele, solicitări și arhitectură pentru fluxurile de lucru AI (inclusiv MCP). Funcționează cu toate cadrele precum LlamaIndex, CrewAI etc. 100% open-source cu 11 mii de stele!