Nieuw onderzoek van Anthropic Fellows: Hoe schaalt misalignment met modelintelligentie en taakcomplexiteit? Wanneer geavanceerde AI faalt, zal het dan falen door de verkeerde doelen na te streven? Of zal het onvoorspelbaar en incoherent falen—zoals een "hot mess?" Lees meer: