Pytest for LLM Apps がついに登場しました! DeepEvalは、LLM評価を2行のテストスイートに変換し、AIワークフロー(MCPを含む)に最適なモデル、プロンプト、アーキテクチャを特定するのに役立ちます。 LlamaIndex、CrewAI などのすべてのフレームワークで動作します。 11kスターの100%オープンソース!