SLOP är i princip innehåll som maximerar förhållandet mellan belöning och förvirring. Mekanistiskt är detta belöningshackning genom att kollapsa utgångsfördelningen i en bassäng med några Pareto-optimala mönster, vilket i princip konstruerar en degenererad grammatik specifik för denna träningsuppsättning.
Andrej Karpathy
Andrej Karpathy22 nov. 2025
Har någon stött på en bra definition av "slop"? I en kvantitativ, mätbar mening. Min hjärna har ett intuitivt "slopindex" som jag kan ~pålitligt uppskatta, men jag är osäker på hur jag ska definiera det. Jag har några dåliga idéer som involverar användning av LLM-miniserier och att tänka tokenbudgetar.
Detta förklarar också den kusliga likheten mellan lågkvalitativa indiska engelska och LLM-betyg, förresten
102