Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Construyendo con agentes de IA @dair_ai • Anterior: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Comparto ideas sobre cómo construir con LLMs y agentes ⬇️ de IA
La realidad es que todos deberíamos intentar construir nuestro propio compañero agente ideal.
Cowork de Anthropic anuncia una nueva ola de herramientas de orquestación de agentes en el horizonte.
No se trata solo de facilitar el uso de Claude Code.
En mi opinión, se trata más de construir interfaces intuitivas para interactuar, gestionar y orquestar agentes para ser más productivos con la IA.
Hay margen para la innovación en cómo se produce la comunicación entre humanos y agentes (y viceversa). Y me refiero a todas partes y en todos los ámbitos que puedas imaginar.
Con el auge de Skills y plugins, cualquiera puede crear experiencias potentes con estos agentes y herramientas. No necesitas ser técnico para romper y desarrollar habilidades creativas y increíblemente útiles (ya sea para el trabajo, un proyecto personal o incluso una startup). Necesitas tener buen gusto en el ámbito en el que operas, prestar mucha atención a la tecnología emergente de IA, experimentar incansablemente, construir contexto y construir con una mentalidad compositiva.
Tiempos emocionantes por delante. ¡Es hora de construir!

58
¿Merece la pena Agentic RAG?
Los sistemas RAG han evolucionado de simples tuberías de recuperador-generador a flujos de trabajo sofisticados. Sigue sin estar claro cuándo usar Enhanced RAG (pipelines fijos con módulos dedicados) versus Agentic RAG (el LLM orquesta todo el proceso dinámicamente).
Esta investigación proporciona la primera comparación empírica.
El RAG mejorado añade componentes predefinidos para abordar debilidades específicas: routers para determinar si es necesario recuperar, reescritores de consultas para mejorar el alineamiento y reclasificadores para refinar la selección de documentos. El flujo de trabajo es fijo y se diseña manualmente.
El RAG agente adopta un enfoque diferente. El LLM decide qué acciones realizar, cuándo realizarlas y si iterar. No hay componentes extra más allá de la base de conocimientos básica, el recuperador y el generador. El modelo lo controla todo.
Los investigadores evaluaron ambos paradigmas en cuatro dimensiones en tareas de QA y recuperación de información.
Manejo de la intención del usuario: Agentic supera ligeramente a Enhanced en la mayoría de las tareas, pero Enhanced gana decisivamente en FEVER (+28,8 puntos F1), donde el agente a menudo recupera innecesariamente.
Reescritura de consultas: Agentic RAG logra un promedio de 55,6 NDCG@10 frente al 52,8 de Enhanced, lo que demuestra que el agente puede reescribir las consultas de forma adaptativa cuando es beneficioso.
Refinamiento de documentos: El RAG mejorado con reclasificación (49,5 NDCG@10) supera a Agentic (43,9). Los módulos dedicados de reclasificación superan los intentos de recuperación iterativa.
El RAG agente es mucho más sensible a la capacidad del modelo. Con modelos más débiles, el RAG mejorado mantiene la estabilidad mientras que el rendimiento de los agentes se degrada significativamente.
El análisis de costes revela que Agentic RAG requiere entre 2 y 10 veces más tiempo de cálculo y tokens debido al razonamiento en varios pasos.
La elección entre RAG Mejorado y Agente depende de tus limitaciones. El RAG mejorado ofrece predictibilidad, menores costes y estabilidad con modelos más débiles. El RAG agente proporciona flexibilidad pero requiere modelos más sólidos y más capacidad de cálculo.
Papel:
Aprende a construir sistemas Agentic RAG efectivos en nuestra academia:

108
Solución sencilla de memoria para tareas a largo plazo.

DAIR.AI15 ene, 22:22
Gestión autónoma de memoria en agentes LLM
Los agentes LLM tienen dificultades con tareas a largo plazo debido a la saturación de contexto.
A medida que crece el historial de interacciones, los costes computacionales se disparan, la latencia aumenta y el razonamiento se degrada por la distracción causada por errores pasados irrelevantes.
El enfoque estándar es solo añadir: cada pensamiento, llamada a una herramienta y respuesta se acumula de forma permanente. Esto funciona para tareas cortas, pero garantiza el fracaso en la exploración compleja.
Esta investigación introduce Focus, una arquitectura centrada en agentes inspirada en el moho mucilaginoso (Physarum polycephalum). La idea biológica: los organismos no conservan registros perfectos de cada movimiento a través de un laberinto. Conservan el mapa erudito.
Focus da a los agentes dos nuevas primitivas: start_focus y complete_focus. El agente decide de forma autónoma cuándo consolidar los aprendizajes en un bloque persistente de Conocimiento y puede activamente la historia de interacción en bruto. No hay temporizadores externos ni heurísticas que obliguen a la compresión.
Declara lo que estás investigando, explora usando herramientas estándar y luego consolida resumiendo lo que se intentó, lo aprendido y el resultado. El sistema añade esto a un bloque de Conocimiento persistente y elimina todo lo que queda entre el punto de control y el paso actual.
Esto convierte el contexto monótonamente creciente en un patrón de dientes de sierra: crecimiento durante la exploración, colapso durante la consolidación.
La evaluación en SWE-bench Lite con Claude Haiku 4.5 muestra que Focus logra una reducción del 22,7% en tokens (14,9 millones a 11,5 millones de tokens) manteniendo la misma precisión (60% tanto para la línea base como para Focus). En casos individuales se registraron ahorros de hasta el 57%.
Un impulso agresivo importa. El incentivo pasivo solo generó un ahorro del 6%. Instrucciones explícitas para comprimir cada 10-15 llamadas a herramientas, con recordatorios del sistema, aumentaron las compresiones de 2.0 a 6.0 por tarea.
Los modelos capaces pueden autorregular su contexto de forma autónoma cuando se les proporcionan las herramientas y prompts adecuados, abriendo vías para sistemas agentivos conscientes de costes sin sacrificar el rendimiento de la tarea.
Papel:
Aprende a crear agentes de IA efectivos en nuestra academia:

18
Populares
Ranking
Favoritas
