J'ai découvert que je concevais mes outils d'IA à l'envers. Voici un exemple. Voici ma chaîne de traitement de newsletter : lire les e-mails, appeler un processeur de newsletter, extraire des entreprises, puis les ajouter au CRM. Cela impliquait quatre étapes différentes, coûtant 3,69 $ pour chaque mille newsletters traitées. Avant : Chaîne de traitement de newsletter (première image) Ensuite, j'ai créé un outil de newsletter unifié qui combinait tout en utilisant le Google Agent Development Kit, le cadre de Google pour construire des outils d'agent IA de qualité production : (deuxième image) Pourquoi l'outil de newsletter unifié est-il plus compliqué ? Il inclut plusieurs actions dans une seule interface (traiter, rechercher, extraire, valider), implémente une gestion d'état qui suit les modèles d'utilisation et met en cache les résultats, a une limitation de taux intégrée, et produit des sorties JSON structurées avec des métadonnées au lieu de texte brut. Mais voici la partie contre-intuitive : malgré sa complexité interne, l'outil unifié est plus simple à utiliser pour le LLM car il fournit des sorties cohérentes et structurées qui sont plus faciles à analyser, même si ces sorties sont plus longues. Pour comprendre l'impact, nous avons effectué des tests de 30 itérations par scénario de test. Les résultats montrent l'impact de la nouvelle architecture : (troisième image) Nous avons pu réduire les tokens de 41 % (p=0,01, statistiquement significatif), ce qui s'est traduit linéairement par des économies de coûts. Le taux de réussite a augmenté de 8 % (p=0,03), et nous avons pu atteindre le cache 30 % du temps, ce qui représente une autre économie de coûts. Bien que les outils individuels produisent des réponses plus courtes et "plus propres", ils forçaient le LLM à travailler plus dur pour analyser des formats incohérents. Des sorties structurées et complètes provenant d'outils unifiés ont permis un traitement LLM plus efficace, malgré leur longueur. Mon flux de travail reposait sur des dizaines d'outils Ruby spécialisés pour les e-mails, la recherche et la gestion des tâches. Chaque outil avait sa propre interface, gestion des erreurs et format de sortie. En les regroupant en méta-outils, la performance ultime est meilleure, et il y a d'énormes économies de coûts. Vous pouvez trouver l'architecture complète sur GitHub.