Pytest für LLM-Apps ist endlich da! DeepEval verwandelt LLM-Evaluierungen in eine zweizeilige Test-Suite, um Ihnen zu helfen, die besten Modelle, Eingabeaufforderungen und Architekturen für AI-Workflows (einschließlich MCPs) zu identifizieren. Funktioniert mit allen Frameworks wie LlamaIndex, CrewAI usw. 100 % Open Source mit 11k Sternen!