実際の痕跡に基づいた評価に取り組み、@langfuse @braintrustdataと@LangChainAIのラングスミスをサポートすることは、非常にエキサイティングでした。私たちは、開発者が学術的なスタンドアロンのベンチマークではなく、実際に重要なものに基づいて評価できるようにしたいと考えています。