Pytest pro LLM aplikace je konečně tady! DeepEval promění hodnocení LLM ve dvouřádkovou testovací sadu, která vám pomůže identifikovat nejlepší modely, výzvy a architekturu pro pracovní postupy AI (včetně MCP). Pracuje se všemi frameworky, jako je LlamaIndex, CrewAI atd. 100% open-source s 11 tisíci hvězdičkami!