Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
De transcriptie delen voor het geval je, net als ik, hier recent naar zocht en het niet kon vinden.
Roon (@tszzl): “Elke keer dat je een model traint, verander je misschien niets aan de dataset, en dan voer je een nieuwe RL-zaad uit, en je zou een iets andere persoonlijkheid hebben. Het komt omdat er enige variatie is in het trainingsproces. Het is willekeurig - je maakt een willekeurige wandeling door de modelruimte. We kunnen zelfs een persoonlijkheid in dezelfde trainingsronde niet zo gemakkelijk reproduceren, laat staan over de tijd ... Het is een zeer moeilijke vraag intern [bij OpenAI]. We proberen de persoonlijkheidsafwijking te minimaliseren, omdat mensen van de modellen komen houden, maar het is een zeer moeilijk probleem.”
Boven
Positie
Favorieten
