Davvero interessante! L'articolo mostra che ChatGPT fornisce risposte diverse alla stessa domanda non a causa della casualità della GPU, ma perché il carico del server cambia effettivamente il modo in cui viene eseguita la matematica. Quindi, abbiamo implementato l'AI su miliardi senza renderci conto che il traffico del server stava modificando i nostri output. Esiste una soluzione, ma abbiamo la pazienza?