Pytest untuk Aplikasi LLM akhirnya tiba! DeepEval mengubah LLM evals menjadi rangkaian pengujian dua baris untuk membantu Anda mengidentifikasi model, perintah, dan arsitektur terbaik untuk alur kerja AI (termasuk MCP). Bekerja dengan semua kerangka kerja seperti LlamaIndex, CrewAI, dll. 100% open-source dengan 11k bintang!