Představujeme Liquid Nanos ⚛️ — novou rodinu extrémně malých modelů specifických pro konkrétní úlohy, které poskytují výkon třídy GPT-4o a zároveň běží přímo na telefonech, noteboocích, automobilech, vestavěných zařízeních a GPU s nejnižší latencí a nejvyšší rychlostí generace. > velikost modelu: 350M až 2,6B > postaven na LFM2, naší efektivní modelové architektuře v2 > výkonnosti konkurenceschopně s modely až stokrát většími > umožňují základní agentické úlohy: přesnou extrakci dat, vícejazyčný překlad, volání nástrojů, matematiku a RAG. 1/n
Používáme kombinaci metod pro automatizované vyhodnocování, destilaci znalostí, RL a slučování modelů, abychom iterativně zlepšili výkon modelu na daném úkolu. Výsledné modely, i když jsou malé, dosahují konkurenceschopných výsledků s podstatně většími modely. 2/N
Například LFM2-350M-Extract a LFM2-1.2B-Extract jsou navrženy tak, aby extrahovaly důležité informace z široké škály nestrukturovaných dokumentů (jako jsou články, přepisy nebo zprávy) do strukturovaných výstupů, jako jsou JSON, XML nebo YAML. Jsou kompatibilní se vstupy v angličtině, arabštině, čínštině, francouzštině, němčině, japonštině, korejštině, portugalštině a španělštině. Naše modely extrakce dat poskytují významné zvýšení platnosti, přesnosti a věrnosti. Například LFM2-1.2B-Extract dokáže vypisovat složité objekty v různých jazycích na úrovni vyšší než Gemma 3 27B, model 22,5krát větší než on a svým výkonem se blíží GPT-4o. 3/n
V naší počáteční verzi oznamujeme šest nano kódů pro konkrétní úlohy: > LFM2-Extract – 350M a 1,2B vícejazyčné modely pro extrakci dat z nestrukturovaného textu, jako je přeměna e-mailů s fakturami na objekty JSON. > LFM2-350M-ENJP-MT – 350M model pro obousměrný překlad z angličtiny ↔ do japonštiny. > LFM2-1.2B-RAG – 1.2B model optimalizovaný pro odpovídání na otázky v RAG pipelines. > LFM2-1.2B-Tool – 1.2B model vytvořený pro volání funkcí a agentní použití nástrojů. > LFM2-350M-Math – 350M model uvažování pro řešení matematických problémů. 4/N
"Považuji za velmi působivé, že nová předtréninková a posttréninková technika společnosti Liquid umožňuje jejich rychlým a malým LLM fungovat na stejné úrovni jako hraniční modely, jako je GPT-4o, který je řádově větší, na specializovaných úkolech," řekl Michail Parakhin (@MParakhin), technický ředitel, Shopify. "Liquid současně zvyšuje laťku výkonu i rychlosti základních modelů a posouvá hranice nejmodernějších technologií. Proto jsme nadšeni, že můžeme využívat jejich modely na platformách a službách Shopify." 5/n
"Společnost Deloitte je nadšená z možnosti spolupráce se společností Liquid AI a jejím novým modelem Nanos, který má potenciál zvýšit výkon srovnatelný s většími modely při nižších nákladech," řekl Ranjit Bawa (@ronbawa), Chief Strategy and Technology Officer, Deloitte U.S. 6/n
"Nanos společnosti Liquid představuje silný inflexní bod pro počítače s umělou inteligencí a poskytuje výkon na špičkové úrovni v kompaktní a energeticky úsporné formě. Ve společnosti AMD sdílíme toto zaměření na vedoucí postavení v oblasti výkonu na watt a inteligenci na zařízení považujeme za klíč k širokému a udržitelnému škálování umělé inteligence," řekl Mark Papermaster (@mpaper2000), technický ředitel a výkonný viceprezident společnosti AMD. 7/n
284,64K