來源類型: 新聞

「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。

OpenAI 發佈 o3-pro，一款升級版的 o3 AI 推理模型

2025年6月10日

OpenAI 於 2025 年 6 月 10 日推出 o3-pro，宣稱這是其目前最強大的 AI 模型。作為 o3 推理模型的升級版，o3-pro 透過逐步解決問題的方式運作，在物理、數學、程式碼等領域表現更可靠。該模型自即日起取代 o1-pro，開放給 ChatGPT Pro 及 Team 使用者使用，企業與教育使用者則於下一週獲得存取權。o3-pro 亦已於開發者 API 上線，定價為每百萬輸入 token 20 美元，每百萬輸出 token 80 美元。一百萬輸入 token 約等於 75 萬字。根據 OpenAI 的變更日誌，專家評估顯示 o3-pro 在所有測試類別中均優於 o3，尤其在科學、教育、程式、商業與寫作輔助等關鍵領域表現更佳，且在清晰度、完整性、指令遵循與準確性上獲評更高。該模型具備搜尋網頁、分析檔案、處理視覺輸入、使用 Python 及利用記憶個人化回應等工具能力。不過，回應時間通常比 o1-pro 長，且目前暫時禁用 ChatGPT 中的臨時對話功能以解決技術問題，無法生成圖片，也不支援 Canvas 工作區功能。在內部測試中，o3-pro 在 AIME 2024 數學評估中表現優於 Google 的 Gemini 2.5 Pro，並在 GPQA Diamond 博士級科學知識測試中擊敗 Anthropic 最新推出的 Claude 4 Opus。完整安全細節可參考 o3 系統卡片。
谷歌推出Android 16至Pixel手機，揭曉Google Photos AI修訂建議功能

2025年6月10日

蘋果於 2025 年 WWDC 宣佈作業系統大改版後，Google 隨即推出 Android 16 及 Pixel 手機的定期功能更新。Android 16 自週二開始滾動更新，新增 iOS 風格的即時通知、Material 3 Expressive 設計語言、藍芽低能量音訊支援以及 HDR 截圖功能。該版本還強化了防盜與防詐騙能力，並為公眾人物提供更先進的保護模式。平板電腦版 Android 16 預計今年晚些時候將支援桌面式視窗功能，並可自訂鍵盤捷徑。Google Messages 更新後支援 RCS 群組聊天，使用者可自訂圖示並設定特定聊天靜音。Google Photos 將引入 AI 驅動的編輯建議，如擦除、移動或重構圖片部分。 Pixel 手機的 June 更新包含「Pixel VIPs」小工具，可顯示與聯絡人的最近通話、訊息及生日等互動資訊。影片內容將獲得更詳細的字幕，描述低語、打哈欠等動作。Gboard 鍵盤支援用文字提示自訂貼圖，Recorder 應用程式在法語和德語地區新增 AI 摘要功能，澳洲使用者則可啟用衛星緊急 SOS 連線。Pixel 8a 及更新型號新增電池健康指示器，Pixel 5 及更新型號透過放大鏡應用程式獲得新的無障礙功能，可描述所看物品並提供震動反饋。企業使用者可在 Google Wallet 儲存公司徽章，並透過 Gemini 聊天機器人於 Google Docs 中總結內容、獲取洞察及翻譯文字。Chrome 瀏覽器對 PDF 的處理也得到增強，支援連結檔案檢視。這些更新自週二開始推出，部分功能如 RCS 群組聊天與 Google Photos 功能將擴充套件至更廣泛的 Android 生態系統。
蘋果升級的AI模型表現未達預期

2025年6月10日

蘋果公司宣佈更新了驅動其跨 iOS、macOS 等平臺的 Apple Intelligence 功能套件的 AI 模型。根據蘋果自身的基準測試，其模型表現優於舊版，但不及競爭對手如 OpenAI 的舊版模型。蘋果在週一的部落格文章中表示，人類測試人員評估其最新「Apple On-Device」模型（在 iPhone 等產品上離線執行）生成的文字質量，與同等規模的 Google 和阿里巴巴模型相當，但並未更好。同時，測試人員對蘋果更強大的「Apple Server」模型（執行於資料中心）的評分，則落後於 OpenAI 一年前的 GPT-4o 模型。在另一項評估影象分析能力的測試中，人類評分者偏好 Meta 的 Llama 4 Scout 模型，這令人驚訝，因為 Llama 4 Scout 在許多測試中表現不如 Google、Anthropic 和 OpenAI 等領先 AI 實驗室的主流模型。這些基準測試結果支援了關於蘋果 AI 研究部門難以在激烈的 AI 競賽中趕上競爭對手的報導。蘋果近年來的 AI 能力令人失望，承諾的 Siri 升級也已被無限期延遲。部分客戶已對蘋果提起了訴訟，指控其營銷了尚未交付的產品 AI 功能。除了生成文字外，約 30 億引數的 Apple On-Device 模型還驅動著摘要和文字分析等功能。截至週一，第三方開發者可透過蘋果的 Foundation Models 框架使用它。蘋果表示，Apple On-Device 和 Apple Server 相比前代在工具使用和效率方面有所改進，並能理解約 15 種語言。這得益於擴充的訓練資料集，其中包括影象資料、PDF 文件、手稿、資訊圖表、表格和圖表。
企業AI新創公司Glean取得72億美元評估值

2025年6月10日

企業人工智慧公司 Glean 於週二宣佈，成功以 72 億美元的估值完成由韋廉頓管理（Wellington Management）領銜的 1.5 億美元 F 輪融資。此次融資發生在其 9 月宣佈的 E 輪融資（2.6 億美元，估值 46 億美元）不到一年後，當時 E 輪估值已是 2024 年 2 月融資估值的兩倍。自 2024 年初以來，Glean 共籌資 6.1 億美元，估值從 22 億美元攀升至 72 億美元。該公司表示，其年度經常性收入（ARR）在過去財政年度已超過 1 億美元，這是在其成立三年後實現的里程碑。Glean 提供的工具允許企業員工透過基於大型語言模型（LLM）的自然語言搜尋公司檔案，並能整合 Salesforce、Microsoft Teams 和 Zendesk 等應用程式，同時還提供 AI 代理產品。參與此次 F 輪融資的其他機構包括 Khosla Ventures、Bicycle Capital、Geodesic Capital 和 Archerman Capital，以及現有投資者 Altimeter、Capital One Ventures、花旗銀行（Citi）、Coatue、DST Global、General Catalyst、ICONIQ、IVP、Kleiner Perkins、Latitude Capital、Lightspeed Venture Partners、Sapphire Ventures 和 Sequoia Capital。

來源類型: 新聞

OpenAI 發佈 o3-pro，一款升級版的 o3 AI 推理模型

谷歌推出Android 16至Pixel手機，揭曉Google Photos AI修訂建議功能

蘋果升級的AI模型表現未達預期

企業AI新創公司Glean取得72億美元評估值