Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Construyendo con agentes de IA @dair_ai • Anterior: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • Comparto ideas sobre cómo construir con LLMs y agentes ⬇️ de IA
La realidad es que todos deberíamos intentar construir nuestro propio compañero de trabajo ideal y agente.
El Cowork de Anthropic señala una nueva ola de herramientas de orquestación de agentes en el horizonte.
No se trata solo de facilitar el uso de Claude Code.
En mi opinión, se trata más de construir interfaces intuitivas para interactuar, gestionar y orquestar agentes para ser más productivos con la IA.
Hay espacio para la innovación en cómo se produce la comunicación de humano a agente (y viceversa). Y me refiero a todos los lugares y todos los dominios que puedas imaginar.
Con el auge de las habilidades y los complementos, cualquiera puede construir experiencias poderosas con estos agentes y herramientas. No necesitas ser técnico para interrumpir y construir habilidades creativas e increíblemente útiles (ya sea para el trabajo, un proyecto personal o incluso una startup). Necesitas tener buen gusto en el dominio en el que operas, prestar atención a la tecnología emergente de IA, experimentar sin descanso, construir contexto y construir con una mentalidad de acumulación.
Tiempos emocionantes por delante. ¡Es hora de construir!

104
¿Vale la pena Agentic RAG?
Los sistemas RAG han evolucionado de simples tuberías de recuperador-generador a flujos de trabajo sofisticados. Sigue sin estar claro cuándo usar Enhanced RAG (tuberías fijas con módulos dedicados) frente a Agentic RAG (el LLM orquesta todo el proceso de manera dinámica).
Esta investigación proporciona la primera comparación empírica.
Enhanced RAG añade componentes predefinidos para abordar debilidades específicas: enrutadores para determinar si se necesita recuperación, reescritores de consultas para mejorar la alineación y reordenadores para refinar la selección de documentos. El flujo de trabajo es fijo y diseñado manualmente.
Agentic RAG adopta un enfoque diferente. El LLM decide qué acciones realizar, cuándo realizarlas y si iterar. No hay componentes adicionales más allá de la base de conocimientos básica, el recuperador y el generador. El modelo controla todo.
Los investigadores evaluaron ambos paradigmas en cuatro dimensiones en tareas de QA y recuperación de información.
Manejo de la intención del usuario: Agentic supera ligeramente a Enhanced en la mayoría de las tareas, pero Enhanced gana de manera decisiva en FEVER (+28.8 puntos F1), donde el agente a menudo recupera innecesariamente.
Reescritura de consultas: Agentic RAG logra un promedio de 55.6 NDCG@10 en comparación con 52.8 para Enhanced, mostrando que el agente puede reescribir consultas de manera adaptativa cuando es beneficioso.
Refinamiento de documentos: Enhanced RAG con reordenamiento (49.5 NDCG@10) supera a Agentic (43.9). Los módulos de reordenamiento dedicados superan los intentos de recuperación iterativa.
Agentic RAG es mucho más sensible a la capacidad del modelo. Con modelos más débiles, Enhanced RAG mantiene la estabilidad mientras que el rendimiento de Agentic se degrada significativamente.
El análisis de costos revela que Agentic RAG requiere de 2 a 10 veces más tiempo de computación y tokens debido al razonamiento en múltiples pasos.
La elección entre Enhanced y Agentic RAG depende de tus limitaciones. Enhanced RAG ofrece previsibilidad, costos más bajos y estabilidad con modelos más débiles. Agentic RAG proporciona flexibilidad pero requiere modelos más fuertes y más computación.
Artículo:
Aprende a construir sistemas Agentic RAG efectivos en nuestra academia:

156
Solución de memoria simple para tareas a largo plazo.

DAIR.AI15 ene, 22:22
Gestión Autónoma de la Memoria en Agentes LLM
Los agentes LLM luchan con tareas de largo horizonte debido a la sobrecarga de contexto.
A medida que la historia de interacción crece, los costos computacionales explotan, la latencia aumenta y el razonamiento se degrada por la distracción de errores pasados irrelevantes.
El enfoque estándar es solo de adición: cada pensamiento, llamada a herramientas y respuesta se acumula permanentemente. Esto funciona para tareas cortas pero garantiza el fracaso en exploraciones complejas.
Esta investigación presenta Focus, una arquitectura centrada en el agente inspirada en el moho mucilaginoso (Physarum polycephalum). La idea biológica: los organismos no retienen registros perfectos de cada movimiento a través de un laberinto. Retienen el mapa aprendido.
Focus proporciona a los agentes dos nuevos primitivos: start_focus y complete_focus. El agente decide de manera autónoma cuándo consolidar aprendizajes en un bloque de Conocimiento persistente y poda activamente la historia de interacción cruda. Sin temporizadores externos ni heurísticas que obliguen a la compresión.
Declara lo que estás investigando, explora utilizando herramientas estándar y luego consolida resumiendo lo que se intentó, lo que se aprendió y el resultado. El sistema añade esto a un bloque de Conocimiento persistente y elimina todo entre el punto de control y el paso actual.
Esto convierte un contexto que aumenta monotonamente en un patrón de sierra: crecimiento durante la exploración, colapso durante la consolidación.
La evaluación en SWE-bench Lite con Claude Haiku 4.5 muestra que Focus logra una reducción del 22.7% en tokens (de 14.9M a 11.5M tokens) mientras mantiene una precisión idéntica (60% tanto para la línea base como para Focus). Las instancias individuales mostraron ahorros de hasta el 57%.
El prompting agresivo importa. El prompting pasivo solo generó un 6% de ahorros. Instrucciones explícitas para comprimir cada 10-15 llamadas a herramientas, con recordatorios del sistema, aumentaron las compresiones de 2.0 a 6.0 por tarea.
Los modelos capaces pueden autorregular su contexto de manera autónoma cuando se les proporcionan herramientas y prompting apropiados, abriendo caminos para sistemas agentes conscientes de costos sin sacrificar el rendimiento de la tarea.
Documento:
Aprende a construir agentes de IA efectivos en nuestra academia:

47
Parte superior
Clasificación
Favoritos
