Un alt reper AI nerezolvat (și, recunoscător, dificil): "scrie un mister de crimă satisfăcător de 10 paragrafe. Piesele de care ai nevoie pentru a rezolva misterul ar trebui să fie suficient de clare în primele cinci paragrafe încât să le poți rezolva, dar destul de obscure încât majoritatea covârșitoare a oamenilor să nu o facă" Erorile sunt revelatoare: -Claude uită să adauge indiciul propriu-zis în puzzle (iar detaliile sunt prea obscure), o problemă clasică de planificare pentru LLM-uri, și nu, folosirea Cowork sau Code nu ajută. -ChatGPT 5.4 Pro creează un indiciu complet evident și apoi continuă să scrie cu metaforele și complicațiile exagerate care au bântuit ficțiunea ChatGPT. Pro s-a descurcat mai bine decât Thinking, totuși. -Gemini 3.1 Pro este cel mai apropiat, dar gheața este puțin evidentă și greșește complet explicația despre importanța cu gheața.