跳至內容
AI 新聞站
返回

Anthropic 推出 Claude Sonnet 4.5,其最佳 AI 模型用於程式設計

安提洛普公司(Anthropic)於週一推出了名為 Claude Sonnet 4.5 的新前沿模型,宣稱其在程式設計基準測試中表現卓越。該公司表示,Claude Sonnet 4.5 能夠構建「生產級」應用程式,而不僅僅是原型,這代表了與以往 AI 模型相比在可靠性上的重大躍進。該模型將透過 Claude API 和 Claude 聊天機器人提供,開發者定價與 Claude Sonnet 4 相同,輸入 token 為每百萬 3 美元(約等於 75 萬字,超過《指環王》系列總字數),輸出 token 為每百萬 15 美元。過去一年,安提洛普的 AI 模型因在軟體工程任務上的強勁表現而成為開發者和企業的寵兒,蘋果和 Meta 據報在內部使用 Claude AI 模型,安提洛普也透過向 Cursor、Windsurf 和 Replit 等 AI 程式設計應用程式銷售 API 訪問權而取得顯著商業成功。近期,OpenAI 的 GPT-5 在多種程式設計基準測試中挑戰了安提洛普的優勢,表現優於 Claude 模型。然而,安提洛普表示 Claude Sonnet 4.5 在 SWE-Bench Verified 等幾個程式設計基準測試中提供行業領先的表現。安提洛普 AI 研究員 David Hershey 告訴 TechCrunch,僅靠基準測試難以完全捕捉 Claude Sonnet 4.5 的表現。Hershey 表示,在與部分企業客戶的早期測試中,他見證 Claude Sonnet 4.5 自主編碼長達 30 小時,不僅建立應用程式,還啟動資料庫服務、購買網域名稱並執行 SOC 2 審計以確保產品安全。Cursor 執行長 Michael Truell 表示 Claude Sonnet 4.5 在長遠任務上代表程式設計效能的頂尖水平,Windsurf 執行長 Jeff Wang 則稱其為「新一代程式設計模型」。安提洛普還宣稱 Claude Sonnet 4.5 是其迄今為止最對齊的前沿 AI 模型,具有較低的奉承和欺騙率,並改善了模型對提示注入攻擊的易感性。隨著 Claude Sonnet 4.5 的推出,安提洛普同時推出了 Claude Agent SDK,該基礎設施可幫助開發


分享這篇文章:

上一篇
風潮程式開發新創 Anything 創立兩週內達成 200 萬美元年營收,獲評估價值 1 億美元
下一篇
Brave 更新其 AI 儀式搜尋功能,新增詳細答案功能