Testování robustnosti @Havelock_AI výsledků pořádáním turnaje, při kterém je Claudovi pouze předloženy gramatické a lexikální značky (bez obsahu) dvou textů a má uhodnout, který je ústnější. Uvidíme, jestli mají lépe hodnotené texty skutečně vyšší ELO.
První testovací várka před velkým během
52