分類: AI 應用

「AI 應用」分類的 AI 新聞與論文。

谷歌推出Android 16至Pixel手機，揭曉Google Photos AI修訂建議功能

2025年6月10日

蘋果於 2025 年 WWDC 宣佈作業系統大改版後，Google 隨即推出 Android 16 及 Pixel 手機的定期功能更新。Android 16 自週二開始滾動更新，新增 iOS 風格的即時通知、Material 3 Expressive 設計語言、藍芽低能量音訊支援以及 HDR 截圖功能。該版本還強化了防盜與防詐騙能力，並為公眾人物提供更先進的保護模式。平板電腦版 Android 16 預計今年晚些時候將支援桌面式視窗功能，並可自訂鍵盤捷徑。Google Messages 更新後支援 RCS 群組聊天，使用者可自訂圖示並設定特定聊天靜音。Google Photos 將引入 AI 驅動的編輯建議，如擦除、移動或重構圖片部分。 Pixel 手機的 June 更新包含「Pixel VIPs」小工具，可顯示與聯絡人的最近通話、訊息及生日等互動資訊。影片內容將獲得更詳細的字幕，描述低語、打哈欠等動作。Gboard 鍵盤支援用文字提示自訂貼圖，Recorder 應用程式在法語和德語地區新增 AI 摘要功能，澳洲使用者則可啟用衛星緊急 SOS 連線。Pixel 8a 及更新型號新增電池健康指示器，Pixel 5 及更新型號透過放大鏡應用程式獲得新的無障礙功能，可描述所看物品並提供震動反饋。企業使用者可在 Google Wallet 儲存公司徽章，並透過 Gemini 聊天機器人於 Google Docs 中總結內容、獲取洞察及翻譯文字。Chrome 瀏覽器對 PDF 的處理也得到增強，支援連結檔案檢視。這些更新自週二開始推出，部分功能如 RCS 群組聊天與 Google Photos 功能將擴充套件至更廣泛的 Android 生態系統。
蘋果升級的AI模型表現未達預期

2025年6月10日

蘋果公司宣佈更新了驅動其跨 iOS、macOS 等平臺的 Apple Intelligence 功能套件的 AI 模型。根據蘋果自身的基準測試，其模型表現優於舊版，但不及競爭對手如 OpenAI 的舊版模型。蘋果在週一的部落格文章中表示，人類測試人員評估其最新「Apple On-Device」模型（在 iPhone 等產品上離線執行）生成的文字質量，與同等規模的 Google 和阿里巴巴模型相當，但並未更好。同時，測試人員對蘋果更強大的「Apple Server」模型（執行於資料中心）的評分，則落後於 OpenAI 一年前的 GPT-4o 模型。在另一項評估影象分析能力的測試中，人類評分者偏好 Meta 的 Llama 4 Scout 模型，這令人驚訝，因為 Llama 4 Scout 在許多測試中表現不如 Google、Anthropic 和 OpenAI 等領先 AI 實驗室的主流模型。這些基準測試結果支援了關於蘋果 AI 研究部門難以在激烈的 AI 競賽中趕上競爭對手的報導。蘋果近年來的 AI 能力令人失望，承諾的 Siri 升級也已被無限期延遲。部分客戶已對蘋果提起了訴訟，指控其營銷了尚未交付的產品 AI 功能。除了生成文字外，約 30 億引數的 Apple On-Device 模型還驅動著摘要和文字分析等功能。截至週一，第三方開發者可透過蘋果的 Foundation Models 框架使用它。蘋果表示，Apple On-Device 和 Apple Server 相比前代在工具使用和效率方面有所改進，並能理解約 15 種語言。這得益於擴充的訓練資料集，其中包括影象資料、PDF 文件、手稿、資訊圖表、表格和圖表。
從空間元件到真實Personas：蘋果在WWDC發表的所有visionOS更新

2025年6月9日

Apple 於 WWDC 宣佈更新 visionOS 26，旨在強化其混合實境頭戴裝置的功能，並為消費級與企業使用者帶來新體驗。此次更新包含可自訂的空間小工具，如日曆、時鐘、天氣與音樂，使用者可調整其大小、顏色與深度，甚至將照片轉化為全景或視窗效果。Photos 應用程式引入新的人工智慧演演算法，利用計算深度為二維照片創造多視角，讓影像更具立體感。Safari 瀏覽器支援空間瀏覽，可隱藏幹擾並讓內嵌照片隨滾動而活化，開發者亦可將此功能整合至自有應用程式。 Persona 作為 AI 虛擬形象，在 visionOS 26 中透過體積渲染與機器學習技術，提供更真實的髮型、睫毛與膚色表現，並可在數秒內於裝置上生成。新特性允許使用者與佩戴頭戴裝置的朋友共同觀看電影或遊玩空間遊戲，此功能亦被企業客戶用於協作，例如 3D 設計軟體公司 Dassault Systèmes 利用其 3DLive 應用程式讓遠端同事共同檢視 3D 設計。企業端新增 API 與工具，Logitech Muse 作為空間配件，可支援精確輸入與與 Spatial Analogue 等協作應用程式互動。組織可安全共享裝置池，並儲存視力處方與無障礙設定至 iPhone，讓使用者快速使用團隊裝置或作為賓客使用他人 Vision Pro。此外，Apple Intelligence 功能將進一步擴充套件，支援法語、德語、義大利語、日語、韓語、西班牙語，以及澳洲、加拿大、印度、新加坡和英國的英語變體。使用者還可透過眼神滾動探索應用程式與網站，並在佩戴頭戴裝置時解鎖 iPhone，甚至透過 Vision Pro 接聽來電。
蘋果在WWDC 2025發表AI驅動的Shortcuts應用程式

2025年6月9日

在 2025 年世界開發者大會上，蘋果展示了全新的 AI 驅動快捷指令應用程式。公司表示，快捷指令現在可直接呼叫蘋果智慧，開發者也能存取蘋果的端側大型語言模型。使用者可透過端側或私人運算存取 AI 模型，生成回應並整合至快捷指令中。例如，學生可建立快捷指令，利用 AI 比對課堂講義的音訊轉錄與筆記，補充遺漏的重點，或連結 ChatGPT 獲取額外回應。此外，還引入了由蘋果智慧啟發的新型別快捷指令，包含使用 AI 摘要文字（蘋果智慧寫作工具）或透過影象遊樂場建立圖片等專屬動作。新功能預計於下週一開始測試。此更新緊接去年蘋果宣佈 Siri 升級後因延遲而推遲發售的情況，旨在透過 AI 輔助自動化彌補 Siri 升級延誤，讓 iPhone 使用感更流暢。此變化有望降低技術門檻，讓非技術使用者也能輕鬆使用，並支援更多如製作自定義迷因、會議記錄、時間追蹤、播放清單管理、PDF 儲存、照片地點查詢、位置提醒、快速撥號、截圖合併、縮短網址、下載檔案及儲存待讀專案等功能。

分類: AI 應用

谷歌推出Android 16至Pixel手機，揭曉Google Photos AI修訂建議功能

蘋果升級的AI模型表現未達預期

從空間元件到真實Personas：蘋果在WWDC發表的所有visionOS更新

蘋果在WWDC 2025發表AI驅動的Shortcuts應用程式