Slop ist im Grunde genommen Inhalt, der das Verhältnis von Belohnung zu Verwirrung maximiert. Mechanistisch gesehen handelt es sich hierbei um Belohnungshacking, indem die Ausgabeverteilung in ein Becken mit wenigen pareto-optimalen Mustern zusammengefasst wird, was im Wesentlichen eine degenerierte Grammatik spezifisch für dieses Trainingssetup konstruiert.
Andrej Karpathy
Andrej Karpathy22. Nov. 2025
Has anyone encountered a good definition of “slop”. In a quantitative, measurable sense. My brain has an intuitive “slop index” I can ~reliably estimate, but I’m not sure how to define it. I have some bad ideas that involve the use of LLM miniseries and thinking token budgets.
Das erklärt auch die unheimliche Ähnlichkeit zwischen niedriggradigem indischem Englisch und den Ausgaben von LLMs, btw
56