Esolang-Bench stał się wirusowy z dnia na dzień! Rozpoczęła się duża dyskusja; poruszając niektóre z powszechnych punktów, które się pojawiły. a) Po co to robić? Czy to mierzy coś użytecznego? b) Ale ludzie też nie potrafią dobrze pisać języków ezoterycznych. To niesprawiedliwe porównanie. c) Ale Claude Code radzi sobie świetnie. Ograniczyłeś modele sztucznie. d) Więc, czy LLM-y są przereklamowane? Czy nasze badanie to clickbait?