Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research presenta Hermes 4, nuestra última línea de modelos de razonamiento híbrido.
Hermes 4 se basa en nuestro legado de modelos alineados con el usuario con capacidades informáticas ampliadas en tiempo de prueba.
Se prestó especial atención a hacer que los modelos fueran creativos e interesantes para interactuar, sin el estorbo de la censura y alineados de manera neutral mientras se mantenía el rendimiento de matemáticas, codificación y razonamiento de nivel de vanguardia para los modelos de peso abierto.

10.73K
Nous Research reposteó
1/10🧵 @nousresearch publicado recientemente un interesante estudio que muestra que los modelos abiertos usan 2-3 veces más tokens que los modelos cerrados para tareas de razonamiento.
Probamos si la asignación dinámica de tokens podría ayudar a abordar esta brecha de eficiencia. Esto es lo que aprendimos 👇
8.02K
Medición de la eficiencia del pensamiento en modelos de razonamiento: el punto de referencia que falta
Medimos el uso de tokens en todos los modelos de razonamiento: los modelos abiertos producen entre 1,5 y 4 veces más tokens que los modelos cerrados en tareas idénticas, pero con una gran variación según el tipo de tarea (hasta 10 veces en preguntas simples).
Este costo oculto a menudo niega las ventajas de precios por token. La eficiencia del token debe convertirse en un objetivo principal junto con los puntos de referencia de precisión, especialmente considerando casos de uso sin razonamiento.
Lea la revisión exhaustiva de la eficiencia del razonamiento en el panorama de modelos abiertos y cerrados en nuestra última publicación de blog en colaboración con nuestro investigador residente, Tim.
Vea más de su trabajo aquí:

48.69K
Nous Research reposteó
El entorno de evaluación Arena-Hard ahora se ha fusionado con Atropos: disfruta de una evaluación escalable, flexible y moderna con el benchmark arena-hard de @lmsysorg, que es excelente para determinar una amplia gama de capacidades en los modelos.
Listo para ser un entorno de RL si traes tu propio conjunto de entrenamiento también :)
Aprende más en

6.95K
Nuestro Investigador en Residencia @yaboilyrical estará discutiendo su trabajo sobre la dirección de SMC en UC Berkeley el 3 de agosto.
¡Consulta el blog sobre este trabajo aquí:
¡Detalles a continuación!

nightwing25 jul 2025
¡Emocionado de anunciar que seré ponente en la Cumbre DeAI de @BerkeleyRDI, presentando mi investigación con @NousResearch sobre la decodificación de lenguaje restringido!
Si vas a asistir a la cumbre, o quieres venir a ver mi charla, ¡por favor contáctame!

10.96K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas