Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Teknium (e/λ)
.@UnslothAI ha subido 70B GGUFs ahora también :)

Nous ResearchHace 14 horas
Nous Research presenta Hermes 4, nuestra última línea de modelos de razonamiento híbridos.
Hermes 4 se basa en nuestro legado de modelos alineados con el usuario, con capacidades de computación ampliadas en el tiempo de prueba.
Se prestó especial atención a hacer que los modelos sean creativos e interesantes para interactuar, sin estar limitados por la censura, y alineados de manera neutral mientras se mantiene un rendimiento de matemáticas, codificación y razonamiento de nivel de vanguardia para modelos de pesos abiertos.

2,58K
Teknium (e/λ) republicó
Hoy @NousResearch acaba de lanzar Hermes 4 - su último modelo de razonamiento de IA de nivel frontera que es completamente de código abierto 🤖
Estas son mis conclusiones favoritas no técnicas de la lectura del informe técnico
Solo unos pocos tuits, ¡prometo que no es una novela!
8,36K
Un gran hito para Hermes.
Hicimos mucho trabajo para crear un modelo abierto de nivel frontera que no dicta qué expresión puedes obtener del modelo.
Super fuerte en matemáticas, programación, STEM y creatividad.
Pesos del modelo:
Échale un vistazo 👇

Nous ResearchHace 14 horas
Nous Research presenta Hermes 4, nuestra última línea de modelos de razonamiento híbridos.
Hermes 4 se basa en nuestro legado de modelos alineados con el usuario, con capacidades de computación ampliadas en el tiempo de prueba.
Se prestó especial atención a hacer que los modelos sean creativos e interesantes para interactuar, sin estar limitados por la censura, y alineados de manera neutral mientras se mantiene un rendimiento de matemáticas, codificación y razonamiento de nivel de vanguardia para modelos de pesos abiertos.

36,21K
Teknium (e/λ) republicó
Dado que todos están hablando sobre los Entornos RL y GRPO ahora, pero nadie sabe cómo funciona, pensamos que sería genial hacer un video explicativo + código que puedas ejecutar:
Este es un ejemplo de cómo usar GRPO para entrenar a Qwen 2.5 para jugar 2048 (código en el hilo) 🧵:
93,72K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado