większość ludzi nie zdaje sobie sprawy, że temperatura to tylko regulacja prędkości wentylatora w klastrze GPU, który cię obsługuje
gojo
gojo15 sie, 23:20
Dosłownie rozmawiałem z tym "badaczem LLM" o ustawianiu temperatury w LLM i zapytałem, wiesz, dlaczego obniżenie lub podniesienie temperatury skutkuje bardziej deterministycznymi lub losowymi wynikami, prawda? A on powiedział, że tak, zmienia to sposób reprezentacji tokenów. Chłopie, co do cholery, ludzie W tej pierdolonej dziedzinie nie mają pojęcia o statystyce Boltzmanna ani o softmaxie. Zaraz się popłaczę.
326