Pytest dla aplikacji LLM jest w końcu tutaj! DeepEval przekształca oceny LLM w dwu-liniowy zestaw testów, aby pomóc Ci zidentyfikować najlepsze modele, podpowiedzi i architekturę dla przepływów pracy AI (w tym MCP). Działa ze wszystkimi frameworkami, takimi jak LlamaIndex, CrewAI itp. 100% open-source z 11k gwiazdkami!