„und dass alles, was gelernt werden kann, in einer RL-Umgebung gelernt werden kann.“ Haben wir also Claude Code-Momente für alles? Haben wir bereits neue Modelle, die mit den Früchten von RL-Umgebungen außerhalb des Codes trainiert wurden? Ich habe das Gefühl, dass wir 2025 viele Unternehmen hatten, die das gemacht haben.
Jackson Kernion
Jackson KernionVor 12 Stunden
Ich versuche herauszufinden, worum ich mich als Nächstes kümmern soll. Ich bin vor über 4 Jahren zu Anthropic gekommen, motiviert von dem Traum, AGI zu entwickeln. Ich war überzeugt, dass wir durch das Studium der Philosophie des Geistes auf eine ausreichende Skalierung zusteuern und dass alles, was gelernt werden kann, in einer RL-Umgebung gelernt werden kann.
Ist Anthropic im Moment am optimistischsten? RL + Scale = AGI?
@jackclarkSF ziehe ich jetzt auf eine Farm in Italien zurück, während Claude sich um meine Farm kümmert
310