DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

In einer gemeinsamen Arbeit mit @OwainEvans_UK im Rahmen des Anthropic Fellows Program untersuchen wir ein überraschendes Phänomen: das unterschwellige Lernen. Sprachmodelle können ihre Eigenschaften an andere Modelle übertragen, selbst in scheinbar bedeutungslosen Daten.

Subliminales Lernen kann für harmlose Eigenschaften (wie die Vorliebe für Adler) oder besorgniserregendere Eigenschaften (wie Fehlanpassungen) auftreten. Dies hat Konsequenzen für das Training mit modellgenerierten Daten. Erfahren Sie mehr auf unserem Alignment Science Blog:

240,68K

Top

Ranking

Favoriten