当前的AI模型仍然面临的一个问题是如何在空间中排列物体,即空间世界模型。 Tikz,一个用于从头创建图表的LaTeX原生包,是测试这一点的好沙盒。它要求模型专门创建表示视觉对象的代码。 我让Claude Code重建一组使用beamer的PPT幻灯片,使用tikz制作图表。写作非常完美,但这是第一个图表(左)。文本未对齐,箭头位置错误,中间插入了一个随机的x。我反复尝试,但没有成功。 我把同样的任务交给了GPT 5.2 Thinking,要求它在重现图表时如果太难就进行更改,但要确保一切对齐且不重叠。中间的图片是输出——甚至更糟。迭代没有帮助(给它图像,尝试不同的提示)——它没有一个关于这些物体在空间中应该如何定向的模型。 我在另一张幻灯片上尝试了Gemini 3 Pro。这里是输出(右)。相当糟糕。 Tikz似乎是一个很好的基准,用于研究这些模型如何随着时间的推移而演变。