Většina lidí si neuvědomuje, že temp pouze upravuje rychlost ventilátoru na clusteru GPU, který vám slouží
gojo
gojo15. 8. 23:20
Doslova jsem mluvil s tímto "výzkumníkem LLM" o nastavení teploty v LLM a zeptal jsem se vás, víte, proč snížení nebo zvýšení teploty vede k více deterministickým nebo náhodným výstupům, že? A on řekl, že ano, mění to způsob, jakým jsou tokeny reprezentovány. Chlapče, co to sakra, lidé v oboru nemají ponětí o statistikách Botzmanna nebo dokonce o Softmaxu. Budu brečet.
323