Jedną z rzeczy, z którymi obecne modele AI wciąż mają problemy, jest to, jak obiekty mogą być rozmieszczone w przestrzeni, tzn. modele przestrzenne świata. Tikz, natywny pakiet latex do tworzenia diagramów od podstaw, jest dobrym polem do testowania tego. Wymaga od modelu stworzenia kodu do reprezentacji wizualnych obiektów w sposób szczególny. Poprosiłem Claude Code o odtworzenie zestawu slajdów PPT w beamerze, używając tikz do diagramów. Pisanie było perfekcyjne, ale oto pierwszy diagram (po lewej). Tekst był źle wyrównany, strzałki w złym miejscu, w środku wstawiono losowe x. Iterowałem w kółko i nie miałem szczęścia. Dałem to samo zadanie GPT 5.2 Thinking, prosząc, aby zmienił diagram, jeśli było zbyt trudno go odtworzyć, ale aby upewnił się, że wszystko jest wyrównane i nie nachodzi na siebie. Środkowy obrazek był wynikiem -- jeszcze gorszym. Iterowanie nie pomogło (dając mu obrazy, próbując różnych podpowiedzi) -- nie miał modelu, jak te obiekty powinny być orientowane w przestrzeni. Spróbowałem Gemini 3 Pro na innym slajdzie. Oto wynik (po prawej). Całkiem źle. Tikz wydaje się być miłym punktem odniesienia do badania, jak te modele ewoluują w czasie.