來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
OpenAI 發佈 o3-pro,一款升級版的 o3 AI 推理模型
OpenAI 於 2025 年 6 月 10 日推出 o3-pro,宣稱這是其目前最強大的 AI 模型。作為 o3 推理模型的升級版,o3-pro 透過逐步解決問題的方式運作,在物理、數學、程式碼等領域表現更可靠。該模型自即日起取代 o1-pro,開放給 ChatGPT Pro 及 Team 使用者使用,企業與教育使用者則於下一週獲得存取權。o3-pro 亦已於開發者 API 上線,定價為每百萬輸入 token 20 美元,每百萬輸出 token 80 美元。一百萬輸入 token 約等於 75 萬字。 根據 OpenAI 的變更日誌,專家評估顯示 o3-pro 在所有測試類別中均優於 o3,尤其在科學、教育、程式、商業與寫作輔助等關鍵領域表現更佳,且在清晰度、完整性、指令遵循與準確性上獲評更高。該模型具備搜尋網頁、分析檔案、處理視覺輸入、使用 Python 及利用記憶個人化回應等工具能力。不過,回應時間通常比 o1-pro 長,且目前暫時禁用 ChatGPT 中的臨時對話功能以解決技術問題,無法生成圖片,也不支援 Canvas 工作區功能。 在內部測試中,o3-pro 在 AIME 2024 數學評估中表現優於 Google 的 Gemini 2.5 Pro,並在 GPQA Diamond 博士級科學知識測試中擊敗 Anthropic 最新推出的 Claude 4 Opus。完整安全細節可參考 o3 系統卡片。
-
谷歌推出Android 16至Pixel手機,揭曉Google Photos AI修訂建議功能
蘋果於 2025 年 WWDC 宣佈作業系統大改版後,Google 隨即推出 Android 16 及 Pixel 手機的定期功能更新。Android 16 自週二開始滾動更新,新增 iOS 風格的即時通知、Material 3 Expressive 設計語言、藍芽低能量音訊支援以及 HDR 截圖功能。該版本還強化了防盜與防詐騙能力,並為公眾人物提供更先進的保護模式。平板電腦版 Android 16 預計今年晚些時候將支援桌面式視窗功能,並可自訂鍵盤捷徑。Google Messages 更新後支援 RCS 群組聊天,使用者可自訂圖示並設定特定聊天靜音。Google Photos 將引入 AI 驅動的編輯建議,如擦除、移動或重構圖片部分。 Pixel 手機的 June 更新包含「Pixel VIPs」小工具,可顯示與聯絡人的最近通話、訊息及生日等互動資訊。影片內容將獲得更詳細的字幕,描述低語、打哈欠等動作。Gboard 鍵盤支援用文字提示自訂貼圖,Recorder 應用程式在法語和德語地區新增 AI 摘要功能,澳洲使用者則可啟用衛星緊急 SOS 連線。Pixel 8a 及更新型號新增電池健康指示器,Pixel 5 及更新型號透過放大鏡應用程式獲得新的無障礙功能,可描述所看物品並提供震動反饋。企業使用者可在 Google Wallet 儲存公司徽章,並透過 Gemini 聊天機器人於 Google Docs 中總結內容、獲取洞察及翻譯文字。Chrome 瀏覽器對 PDF 的處理也得到增強,支援連結檔案檢視。這些更新自週二開始推出,部分功能如 RCS 群組聊天與 Google Photos 功能將擴充套件至更廣泛的 Android 生態系統。
-
蘋果升級的AI模型表現未達預期
蘋果公司宣佈更新了驅動其跨 iOS、macOS 等平臺的 Apple Intelligence 功能套件的 AI 模型。根據蘋果自身的基準測試,其模型表現優於舊版,但不及競爭對手如 OpenAI 的舊版模型。蘋果在週一的部落格文章中表示,人類測試人員評估其最新「Apple On-Device」模型(在 iPhone 等產品上離線執行)生成的文字質量,與同等規模的 Google 和阿里巴巴模型相當,但並未更好。同時,測試人員對蘋果更強大的「Apple Server」模型(執行於資料中心)的評分,則落後於 OpenAI 一年前的 GPT-4o 模型。在另一項評估影象分析能力的測試中,人類評分者偏好 Meta 的 Llama 4 Scout 模型,這令人驚訝,因為 Llama 4 Scout 在許多測試中表現不如 Google、Anthropic 和 OpenAI 等領先 AI 實驗室的主流模型。這些基準測試結果支援了關於蘋果 AI 研究部門難以在激烈的 AI 競賽中趕上競爭對手的報導。蘋果近年來的 AI 能力令人失望,承諾的 Siri 升級也已被無限期延遲。部分客戶已對蘋果提起了訴訟,指控其營銷了尚未交付的產品 AI 功能。除了生成文字外,約 30 億引數的 Apple On-Device 模型還驅動著摘要和文字分析等功能。截至週一,第三方開發者可透過蘋果的 Foundation Models 框架使用它。蘋果表示,Apple On-Device 和 Apple Server 相比前代在工具使用和效率方面有所改進,並能理解約 15 種語言。這得益於擴充的訓練資料集,其中包括影象資料、PDF 文件、手稿、資訊圖表、表格和圖表。
-
企業AI新創公司Glean取得72億美元評估值
企業人工智慧公司 Glean 於週二宣佈,成功以 72 億美元的估值完成由韋廉頓管理(Wellington Management)領銜的 1.5 億美元 F 輪融資。此次融資發生在其 9 月宣佈的 E 輪融資(2.6 億美元,估值 46 億美元)不到一年後,當時 E 輪估值已是 2024 年 2 月融資估值的兩倍。自 2024 年初以來,Glean 共籌資 6.1 億美元,估值從 22 億美元攀升至 72 億美元。該公司表示,其年度經常性收入(ARR)在過去財政年度已超過 1 億美元,這是在其成立三年後實現的里程碑。Glean 提供的工具允許企業員工透過基於大型語言模型(LLM)的自然語言搜尋公司檔案,並能整合 Salesforce、Microsoft Teams 和 Zendesk 等應用程式,同時還提供 AI 代理產品。參與此次 F 輪融資的其他機構包括 Khosla Ventures、Bicycle Capital、Geodesic Capital 和 Archerman Capital,以及現有投資者 Altimeter、Capital One Ventures、花旗銀行(Citi)、Coatue、DST Global、General Catalyst、ICONIQ、IVP、Kleiner Perkins、Latitude Capital、Lightspeed Venture Partners、Sapphire Ventures 和 Sequoia Capital。