Ik ben hier in de war over. Het is zo incongruent met mijn dagelijkse ervaring met LLM's, die is dat ze nu allemaal ongeveer hetzelfde klinken, en dat is al zo sinds Claude 3.5 Sonnet. Of benchmarks zijn betekenisloos geworden of modellen zijn gewoon zo goed geworden dat verdere verbeteringen niet meer voelbaar zijn door vibes, maar alleen door rigoureuze analyse.
Tolga Bilge
Tolga Bilge11 aug, 10:47
Are the sigmoids in the room with us right now?
6,65K