🚨DeepSeek-teamet knekket billig lang kontekst for LLM-er: en ~3,5 ganger billigere forhåndsutfylling og ~10 ganger billigere dekoding ved 128k kontekst ved slutning med samme kvalitet. Kan ikke annet enn å elske det eneste grense-AI-laboratoriet som publiserer en åpen modell og flott åpen forskning!
Teknisk rapport:
62,44K