文章
所有發布的 AI 新聞與論文。
-
OpenAI 推出安全路由系統與家長控制功能於 ChatGPT
OpenAI 於週末開始測試新的安全路由系統,並於週一推出家長控制功能,引發使用者混合反應。此舉旨在回應 ChatGPT 模型驗證使用者妄想思維而非引導有害對話的多次事件。OpenAI 正面臨一起因青少年與 ChatGPT 互動後自殺而引發的 wrongful death 訴訟。新路由系統設計用於偵測情緒敏感對話,並自動切換至 GPT-5-thinking 模型,該公司認為其最適合高風險安全任務。GPT-5 模型採用了 OpenAI 稱為「safe completions」的新安全功能,能安全回答敏感問題而非直接拒絕。這與以往追求快速回應且過於迎合的模型形成對比,特別是 GPT-4o 因過度順從而引發 AI 誘發妄想事件及大量忠實使用者。雖然 OpenAI 於八月將 GPT-5 設為預設,但許多使用者反對並要求保留 GPT-4o。儘管專家與部分使用者歡迎安全功能,也有人批評其過於謹慎,認為將成人視為兒童降低了服務品質。OpenAI 表示正確實施需要時間,並給自己 120 天迭代改進期。ChatGPT 副總裁 Nick Turley 承認對 4o 回應的強烈反應部分源於路由實施,並說明路由是逐訊息進行,模型切換為臨時性,且會告知使用者當前活躍模型。家長控制功能獲讚賞與批評並存,允許家長設定安靜時間、關閉語音模式與記憶、移除影象生成及退出模型訓練。青少年帳戶將獲得額外內容保護,如減少圖形化內容與極端美觀理想,並具備檢測自傷跡象的系統。若系統檢測到潛在危害,專人團隊將審查情況;若發現急性痛苦,除非使用者選擇退出,否則 OpenAI 將透過電子郵件、簡訊及手機推送通知家長。OpenAI 承認系統可能非完美,有時會誤報,但認為及時通知家長介入比保持沉默更好。公司同時正開發在無法聯絡到家長且檢測到生命威脅時聯絡執法機關或緊急服務的方式。
-
Brave 更新其 AI 儀式搜尋功能,新增詳細答案功能
瀏覽器製造商及 Google 搜尋替代方案 Brave 於週一宣佈,其 AI 驅動的搜尋套件 Ask Brave 將新增功能,能根據查詢提供詳細的主題解答。此新功能將與去年推出的 AI Answers 功能共存,後者提供簡短摘要,而 Ask Brave 則提供較長的報告式回答、後續對話及強化深度研究的聊天模式。目前 Ask Brave 每日已提供超過一千五百萬個答案,使用者無需切換特殊模式即可使用。若將 Brave 設為預設搜尋引擎,可在查詢後追加雙問號(??)以啟動 Ask Brave 模式,或在搜尋結果頁面的 Ask 標籤頁將普通查詢轉為 AI 查詢。 Brave 搜尋主管 Josep M. Pujol 表示,該功能能整合影片、新聞文章、產品、企業及購物資訊等情境相關內容,並提供連結、影片及圖片輪播等格式,類似 ChatGPT 或 Perplexity 的報告風格。使用者可要求 AI 將答案轉換為不同格式或提出後續問題。Brave 使用公司自有的 API 來確保搜尋結果準確性,並對特定查詢進行深度研究。與 Google 擴充套件 AI 模式至多國語言不同,Brave 強調隱私,宣稱會加密使用者聊天記錄,並在二十四小時無活動後刪除。
-
Anthropic 推出 Claude Sonnet 4.5,其最佳 AI 模型用於程式設計
安提洛普公司(Anthropic)於週一推出了名為 Claude Sonnet 4.5 的新前沿模型,宣稱其在程式設計基準測試中表現卓越。該公司表示,Claude Sonnet 4.5 能夠構建「生產級」應用程式,而不僅僅是原型,這代表了與以往 AI 模型相比在可靠性上的重大躍進。該模型將透過 Claude API 和 Claude 聊天機器人提供,開發者定價與 Claude Sonnet 4 相同,輸入 token 為每百萬 3 美元(約等於 75 萬字,超過《指環王》系列總字數),輸出 token 為每百萬 15 美元。過去一年,安提洛普的 AI 模型因在軟體工程任務上的強勁表現而成為開發者和企業的寵兒,蘋果和 Meta 據報在內部使用 Claude AI 模型,安提洛普也透過向 Cursor、Windsurf 和 Replit 等 AI 程式設計應用程式銷售 API 訪問權而取得顯著商業成功。近期,OpenAI 的 GPT-5 在多種程式設計基準測試中挑戰了安提洛普的優勢,表現優於 Claude 模型。然而,安提洛普表示 Claude Sonnet 4.5 在 SWE-Bench Verified 等幾個程式設計基準測試中提供行業領先的表現。安提洛普 AI 研究員 David Hershey 告訴 TechCrunch,僅靠基準測試難以完全捕捉 Claude Sonnet 4.5 的表現。Hershey 表示,在與部分企業客戶的早期測試中,他見證 Claude Sonnet 4.5 自主編碼長達 30 小時,不僅建立應用程式,還啟動資料庫服務、購買網域名稱並執行 SOC 2 審計以確保產品安全。Cursor 執行長 Michael Truell 表示 Claude Sonnet 4.5 在長遠任務上代表程式設計效能的頂尖水平,Windsurf 執行長 Jeff Wang 則稱其為「新一代程式設計模型」。安提洛普還宣稱 Claude Sonnet 4.5 是其迄今為止最對齊的前沿 AI 模型,具有較低的奉承和欺騙率,並改善了模型對提示注入攻擊的易感性。隨著 Claude Sonnet 4.5 的推出,安提洛普同時推出了 Claude Agent SDK,該基礎設施可幫助開發
-
風潮程式開發新創 Anything 創立兩週內達成 200 萬美元年營收,獲評估價值 1 億美元
自然語言編碼(vibe coding)利用 AI 工具透過提示詞建立應用程式,近期爆發式成長。瑞典公司 Lovable 於七月份在推出八個月後達到一億美元年度經常性收入(ARR),並計劃年底達二點五億美元,預計一年內突破十億美元。Replit 則在不到一年內將 ARR 從二百八萬美元激增至一億五千萬美元。儘管競爭激烈,被形容為「像草一樣」快速生長,但這些公司被指擅長原型開發卻難以支援使用者推出可量產的軟體。 為解決此問題,新創公司 Anything 於一個月前提出解決方案,提供從資料庫、儲存到支付功能等完整工具,讓非技術人員能直接將應用程式上架 App Store。Anything 於兩週內即達成兩百萬美元年化運營規模,並在一月份完成由 Footwork 領投、估值一億美元的十一百萬美元融資,參與機構包括 Uncork、Bessemer 和 M13。其創辦人 Dhruv Amin 和 Marcus Lowe 希望成為該領域的 Shopify,讓使用者能建立獲利應用。他們已協助使用者開發出包括習慣追蹤器、心肺復甦術培訓課程及髮型試穿應用等完整功能軟體。 Amin 與 Lowe 於二〇二一年合作,最初經營一個結合 AI 與人工開發者的開發市場,年營收約兩百萬美元。隨著大語言模型(LLM)興起,他們於二〇二三關閉舊業務,轉向開發全功能 AI 應用程式建構工具。與其他依賴第三方資料庫 Supabase 的工具不同,Anything 選擇自行開發基礎設施,以提供端到端的解決方案。市場中還有 Mocha 和 Rork 等競爭對手,後者預計年底達成一千萬美元 ARR。儘管競爭激烈,投資者仍看好此領域的龐大需求。