SERA 保持一致性,因為路由是確定性的。 SERA 不像 LLM 一步一步決定工具和提示,而是將查詢嵌入並與兩個索引進行匹配:一個是工具索引,一個是提示模板索引。 了解這種設計如何使開源推理系統變得可預測、可測試和可擴展 🧵
Sentient
Sentient2025年12月12日
宣布 SERA-Crypto(語義嵌入與推理代理):我們為 SOTA 加密研究構建的新推理架構。 #1 開源代理於 DMind #1 在我們的實時加密基準測試中 在 45 秒內超越 GPT-5、Grok 4、Gemini 2.5 Pro 和 Perplexity Finance…
2/ 可重複的規模路由 大多數代理堆疊在運行過程中可能會漂移,因為工具選擇取決於模型的中間推理。在長期運行中,這種情況更糟。 使用 SERA,類似的問題可靠地觸發相同的工具集和相同的模板,因此隨著工具、類別和流量的擴展,行為保持一致。
3/ 在 SERA 中,平行工具調用是預設選項 一旦選擇了路由,SERA 會平行啟動多個工具調用,然後對返回的數據進行單次綜合處理。 這樣可以在更少的循環中實現更廣泛的覆蓋、更低的延遲和更少的故障模式——這正是你在推動開源推理性能時所需要的。
4/ SERA 提供了一條更清潔的生產可靠性之路 因為路由與推理是分開處理的,你可以擴展工具範圍、精煉模板,並在不改變整體工作流程的情況下控制延遲。 這樣系統就變得更容易除錯、運行成本更低,並且更容易移植。這種架構使得 SERA 能夠在保持開源的同時與重量級的封閉堆疊競爭。
2.05K