Nowe badania stypendystów Anthropic: Jak niezgodność skaluje się z inteligencją modelu i złożonością zadań? Kiedy zaawansowana AI zawiedzie, czy będzie to spowodowane dążeniem do niewłaściwych celów? A może zawiedzie w sposób nieprzewidywalny i niespójny—jak "chaotyczny bałagan?" Czytaj więcej: