Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Představujeme Liquid Nanos ⚛️ — novou rodinu extrémně malých modelů specifických pro konkrétní úlohy, které poskytují výkon třídy GPT-4o a zároveň běží přímo na telefonech, noteboocích, automobilech, vestavěných zařízeních a GPU s nejnižší latencí a nejvyšší rychlostí generace.
> velikost modelu: 350M až 2,6B
> postaven na LFM2, naší efektivní modelové architektuře v2
> výkonnosti konkurenceschopně s modely až stokrát většími
> umožňují základní agentické úlohy: přesnou extrakci dat, vícejazyčný překlad, volání nástrojů, matematiku a RAG. 1/n

Používáme kombinaci metod pro automatizované vyhodnocování, destilaci znalostí, RL a slučování modelů, abychom iterativně zlepšili výkon modelu na daném úkolu. Výsledné modely, i když jsou malé, dosahují konkurenceschopných výsledků s podstatně většími modely. 2/N

Například LFM2-350M-Extract a LFM2-1.2B-Extract jsou navrženy tak, aby extrahovaly důležité informace z široké škály nestrukturovaných dokumentů (jako jsou články, přepisy nebo zprávy) do strukturovaných výstupů, jako jsou JSON, XML nebo YAML. Jsou kompatibilní se vstupy v angličtině, arabštině, čínštině, francouzštině, němčině, japonštině, korejštině, portugalštině a španělštině.
Naše modely extrakce dat poskytují významné zvýšení platnosti, přesnosti a věrnosti. Například LFM2-1.2B-Extract dokáže vypisovat složité objekty v různých jazycích na úrovni vyšší než Gemma 3 27B, model 22,5krát větší než on a svým výkonem se blíží GPT-4o. 3/n

V naší počáteční verzi oznamujeme šest nano kódů pro konkrétní úlohy:
> LFM2-Extract – 350M a 1,2B vícejazyčné modely pro extrakci dat z nestrukturovaného textu, jako je přeměna e-mailů s fakturami na objekty JSON.
> LFM2-350M-ENJP-MT – 350M model pro obousměrný překlad z angličtiny ↔ do japonštiny.
> LFM2-1.2B-RAG – 1.2B model optimalizovaný pro odpovídání na otázky v RAG pipelines.
> LFM2-1.2B-Tool – 1.2B model vytvořený pro volání funkcí a agentní použití nástrojů.
> LFM2-350M-Math – 350M model uvažování pro řešení matematických problémů.
4/N
"Považuji za velmi působivé, že nová předtréninková a posttréninková technika společnosti Liquid umožňuje jejich rychlým a malým LLM fungovat na stejné úrovni jako hraniční modely, jako je GPT-4o, který je řádově větší, na specializovaných úkolech," řekl Michail Parakhin (@MParakhin), technický ředitel, Shopify. "Liquid současně zvyšuje laťku výkonu i rychlosti základních modelů a posouvá hranice nejmodernějších technologií. Proto jsme nadšeni, že můžeme využívat jejich modely na platformách a službách Shopify." 5/n
"Společnost Deloitte je nadšená z možnosti spolupráce se společností Liquid AI a jejím novým modelem Nanos, který má potenciál zvýšit výkon srovnatelný s většími modely při nižších nákladech," řekl Ranjit Bawa (@ronbawa), Chief Strategy and Technology Officer, Deloitte U.S. 6/n
"Nanos společnosti Liquid představuje silný inflexní bod pro počítače s umělou inteligencí a poskytuje výkon na špičkové úrovni v kompaktní a energeticky úsporné formě. Ve společnosti AMD sdílíme toto zaměření na vedoucí postavení v oblasti výkonu na watt a inteligenci na zařízení považujeme za klíč k širokému a udržitelnému škálování umělé inteligence," řekl Mark Papermaster (@mpaper2000), technický ředitel a výkonný viceprezident společnosti AMD. 7/n
284,64K
Top
Hodnocení
Oblíbené