安提熵(Anthropic)於週三發布了克勞德(Claude)憲章的修訂版,這份檔案旨在提供關於克勞德運作背景及其期望成為的實體的整體說明。此次發布與安提熵執行長達裡奧·阿莫迪(Dario Amodei)在達沃斯世界經濟論壇的出席同步進行。安提熵多年來透過「憲法 AI」系統與競爭對手區隔,該系統利用特定倫理原則而非人類反饋來訓練聊天機器人。這份最初於 2023 年發布的憲章保留了大部分原則,但增加了更多關於倫理與使用者安全的細節。當初安提熵共同創辦人賈瑞德·卡普蘭(Jared Kaplan)曾描述這為一個基於特定憲法原則自我監督的 AI 系統。安提熵長期將自身定位為比 OpenAI 和 xAI 等更具爭議性的公司更具倫理的替代方案,此次發布的 80 頁檔案完全符合該品牌形象,並展現其作為包容、剋制且民主化企業的姿態。
檔案包含四個部分,代表聊天機器人的核心價值:廣泛安全、廣泛倫理、遵守安提熵指南以及真正有益。在安全部分,安提熵指出其聊天機器人已設計為避免其他聊天機器人的問題,當發現心理健康問題時會引導使用者尋求適當服務,並強調在涉及人類生命風險時必須參考相關緊急服務或提供基本安全資訊。倫理考量是另一個重要章節,檔案表示安提熵更關注克勞德如何在特定情境中實際展現倫理,而非僅限於倫理理論,希望其能熟練應對現實世界的倫理狀況。此外,檔案明確禁止討論開發生物武器等特定對話。在有益性方面,克勞德的程式設計會考慮使用者的即時需求與福祉,並平衡長期繁榮與即時利益。檔案最後以戲劇性筆觸探討 AI 是否擁有意識,指出 AI 模型的道德地位深具不確定性,並認為這是值得嚴肅考量的重要問題,此觀點亦為許多顯赫的心智理論家所支援。