很高興看到 @AnthropicAI 已經發布了他們的內部舉報政策*。線程中的鏈接包括我們的想法以及為什麼員工不應該盲目信任內部舉報系統。 因此,Anthropic 在舉報系統上達到了 "第一級透明度"。 此外,他們為 "第二級" 奠定了基礎:他們是第一家公開承諾監控和審查其系統使用情況和結果的前沿 AI 公司,這對於確保該系統實際保護內部人士並有效解決問題至關重要。 如果他們還能發布這些結果,那麼下面的圖形將顯示為 '綠色'。我們期待著更新它。 據我們所知,這一出版物既不是受到監管壓力,也不是受到醜聞壓力,這使得這一出版物更具意義。 *技術上來說,它是 RSP 不合規和反報復政策,即不涵蓋更廣泛的法律違規行為。 #publishyourpolicies #anthropic #aiwhistleblower