O SERA permanece consistente porque o roteamento é determinístico. Em vez de um LLM decidir ferramentas e prompts passo a passo, o SERA incorpora a consulta e a compara com dois índices: um para ferramentas e outro para templates de prompts. Aprenda como esse design torna sistemas de raciocínio open-source previsíveis, testáveis e escaláveis 🧵
Sentient
Sentient12 de dez. de 2025
Anunciando SERA-Crypto (Semantic Embedding & Reasoning Agent): nossa nova arquitetura de raciocínio criada para pesquisa em cripto SOTA. #1 agente open-source no DMind #1 em nosso benchmark de criptomoedas ao vivo Supera GPT-5, Grok 4, Gemini 2.5 Pro e Perplexity Finance... tudo em menos de 45 segundos.
2/ Roteamento repetível em escala A maioria dos stacks de agentes pode se deslocar entre execuções porque a seleção de ferramentas depende do raciocínio intermediário do modelo. Isso é ainda pior em corridas de longo prazo. Com o SERA, perguntas semelhantes ativam de forma confiável o mesmo conjunto de ferramentas e o mesmo modelo, então o comportamento permanece consistente enquanto você escala ferramentas, categorias e tráfego.
3/ No SERIA, chamadas paralelas de ferramentas são o padrão Uma vez escolhida a rota, o SERA executa múltiplas chamadas de ferramenta em paralelo e executa uma única passagem de síntese sobre os dados retornados. Isso oferece uma cobertura ampla com menos loops, menor latência e menos modos de falha — exatamente o que você quer quando tenta impulsionar o desempenho do raciocínio open source.
4/ SERA oferece um caminho mais limpo para a confiabilidade da produção Como o roteamento é tratado separadamente do raciocínio, você pode expandir a superfície da ferramenta, refinar templates e manter a latência sob controle sem alterar o fluxo de trabalho geral. O sistema então se torna mais fácil de depurar, mais barato de rodar e mais fácil de portar. Essa arquitetura permite que o SERA compita com stacks fechados pesados enquanto permanece open-source.
2,02K