Pytest per le app LLM è finalmente qui! DeepEval trasforma le valutazioni LLM in una suite di test di due righe per aiutarti a identificare i migliori modelli, prompt e architetture per i flussi di lavoro AI (inclusi gli MCP). Funziona con tutti i framework come LlamaIndex, CrewAI, ecc. 100% open-source con 11k stelle!