Pytest for LLM-apper er endelig her! DeepEval gjør LLM-evalueringer til en to-linjers testpakke for å hjelpe deg med å identifisere de beste modellene, spørsmålene og arkitekturen for AI-arbeidsflyter (inkludert MCP-er). Fungerer med alle rammeverk som LlamaIndex, CrewAI, etc. 100% åpen kildekode med 11k stjerner!