Pytest cho Ứng dụng LLM cuối cùng cũng đã có mặt! DeepEval biến việc đánh giá LLM thành một bộ kiểm tra hai dòng để giúp bạn xác định các mô hình, lời nhắc và kiến trúc tốt nhất cho quy trình làm việc AI (bao gồm cả MCPs). Hoạt động với tất cả các framework như LlamaIndex, CrewAI, v.v. Mã nguồn mở 100% với 11k sao!