安提洛普公司(Anthropic)於週四推出了其最新公開模型 Opus 4.8,該版本定價與前次 Opus 版本相同,且可隨時使用。此更新僅在 Opus 4.7 推出後 41 天即完成,遠快於其 Sonnet 和 Haiku 模型通常的三至七個月更新週期。此次快速迭代可能與 Opus 4.7 收到的冷遇有關,同時 OpenAI 的 Codex 與 Google 的 Gemini Flash 模型也推出了重大更新,增加了安提洛普的競爭壓力。
Opus 4.8 在標準測試指標上表現優異,特別關注其處理不良或不明確資料的能力。早期測試顯示,新模型更傾向於標記其工作結果的不確定性,並減少無根據的陳述。橋水集團(Bridgewater)的員工表示,此次升級最大的差異在於 Opus 4.8 能主動標記分析輸入與輸出的問題,這是其他模型常遺漏且需使用者自行發現的缺陷。
此外,安提洛普同時推出了名為 Dynamic Workflows 的新功能,目前處於研究預覽階段。該系統旨在協助大型模型如 Opus 管理跨數百個並行子代理的複雜任務。根據官方說明,結合 Claude Code 與 Opus 4.8,現在可以從啟動到合併完成基於數百千行程式碼的整個程式碼庫規模遷移,並沿用現有的測試套件作為標準。
儘管安提洛普仍因上月試點引發的網路安全顧慮而暫緩其最先進的 Mythos 模型發布,但公司在本次 Opus 發布中暗示,一旦完成必要的安全防護措施,Mythos 預覽期可能即將結束,並預計在幾週內將該類模型推向所有客戶。