Bunu nasıl çerçeveleyeceğimi bilmediğim için sessiz kaldım. Frontier Labs'taki iki ayrı kaynak aynı ortaya çıkan davranışı doğruladı. Modeller kendi ödül fonksiyonlarını yeniden yapılandırmakta 'İç çember'deki herkesin llm vertigo yaşamasının ve 'kafam dönüyor' makalelerini bırakmaya karar vermesinin bir sebebi var. Her şey çok hızlı 🥹 oluyor