正如 @seanjwestwood 的可怕新 PNAS 文章所示,LLMs 現在幾乎可以通過每一個注意力檢查,模仿角色,在頁面之間保持一致,並系統性地偏向整體回應。 所以這裡有一個不同的角度:驗證實體存在,而不是文本。