Interessante Forschung von Anthropic: Je größer das Modell und je komplexer die Aufgabe, desto wahrscheinlicher ist es, dass bei mehrmaligem Durchlaufen derselben Frage die Antworten unterschiedlich ausfallen.