🚨 DeepMind, sinir ağlarının binlerce çağ boyunca hiçbir şey öğrenmeden eğitim alabildiğini keşfetti. Sonra aniden, tek bir çağda, mükemmel şekilde genelleştiriyorlar. Bu olgaha "Grokking" denir. Garip bir eğitim hatasından, modellerin nasıl öğrendiğine dair temel bir teoriye dönüştü. İşte değişen şey (ve neden şimdi önemli olduğu):