分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
蘋果與谷歌討論使用Gemini重組Siri
蘋果在將 Siri 轉型為具備強大能力的 AI 助手競賽中逐漸落後,面對消費者日益增長的耐心耗盡,公司正考慮採用其他公司的技術而非自行開發。據彭博社編輯兼蘋果內部人士馬克·古爾曼報導,蘋果目前正在探索與谷歌的潛在合作關係,這是其在手機業務中最直接的競爭對手。此前,蘋果曾接觸過 OpenAI 和 Anthropic,討論使用其技術驅動 Siri 的可能性,而據報谷歌已開始訓練一個可能執行於蘋果伺服器上的模型。預計蘋果不會在未來數週內就 Siri 翻新專案是否引入合作伙伴做出決定。此外,TechCrunch 邀請讀者提供關於其觀點、反饋及活動的意見,以協助其持續進化,並鼓勵填寫調查表以瞭解其表現,同時有機會贏得獎項。
-
Google 增加 Vids 快捷按鈕讓Drive影片編輯更簡單
Google 於週五宣佈增強 Drive 中影片編輯體驗,推出針對 Vids 的新捷徑按鈕。Vids 是 Google 的 AI 驅動影片創作工具,此新功能允許 Workspace 使用者直接在 Google Drive 介面啟動影片編輯。當使用者在 Drive 中預覽影片時,右上角會出現「開啟」按鈕,點選後影片將自動在 Vids 應用程式中開啟,使用者可進行剪輯、加入音樂與文字等進一步編輯。此捷徑預設啟用,顯示 Google 正將該應用程式更緊密整合至 Workspace 套件中。Vids 於去年推出,旨在簡化影片製作流程,具備從基本文字提示生成影片、自動撰寫指令碼、重排影片片段、加入過渡效果等功能。此舉緊接於五月份 Google 為 Workspace 使用者引入另一項 Gemini AI 功能之後,該功能允許使用者利用 AI 總結儲存於 Drive 中的影片檔案。
-
Anthropic 將 Claude Code 整合進企業方案
安提克(Anthropic)於週三宣佈推出新的訂閱方案,將原本僅限於個人帳戶的 Claude Code 命令列程式設計工具整合進 Claude for Enterprise 套件中。該工具此前僅供個人使用,現可作為更廣泛企業套件的一部分購買,支援更複雜的整合與強大的管理功能。安提克產品負責人斯科特·懷特(Scott White)表示,這是來自業務團隊和企業客戶最被請求的功能。此次整合有助於安提克在企業級命令列工具領域與 Google 和 GitHub 競爭,後者均在推出時就包含了企業整合功能。 Claude Code 自今年六月推出後,迅速成為最受歡迎的命令列程式設計工具之一,其代理式方法比傳統基於 IDE 的工具更具優勢。然而,隨著個人使用者數量增加,服務也面臨了一些挑戰,例如使用者曾遭遇突發的使用限制。新的企業方案部分旨在回應這些問題,允許企業設定精細的支出控制,並可根據高強度使用情況進行擴充套件。安提克特別看好 Claude Code 與 Claude.ai 聊天機器人之間的整合,企業訂閱者可利用此功能在聊天機器人中開發提示詞,或將命令列工具更深地整合到內部資料來源中。 懷特在談及工作時指出,涉及客戶反饋工具的企業整合具有變革性,能夠利用 Claude 總結大量來自不同來源的反饋,並將其轉化為具體的產品改進。他認為將客戶反饋與解決方案原型結合是過去一年前作為產品經理無法實現的。
-
谷歌持續押注於「AI手機」推出Pixel 10系列
Google 在週三的「Made by Google」活動中正式推出 Pixel 10 系列,旨在比 Apple 更早向消費者提供搭載人工智慧的智慧型手機。該系列裝置僅比預期於本週三揭曉的 iPhone 17 提前數週登場,後者預計將帶來更佳的相機、更薄的機身及新配色。Pixel 10 系列整合了更多人工智慧功能,包括相機的視覺覆蓋層(Visual Overlays)、主動式「魔法提示」(Magic Cue)、相機教練(Camera Coach)、通話即時翻譯(Voice Translate)、訊息助手(Take a Message)、Pixel Journal 等。這些更新結合了 Tensor G5 晶片與最新的 Gemini Nano 模型,展現了 Google 人工智慧技術的潛力。 Gemini Live 新增了能偵測語氣並調整回應的新音訊模型,視覺覆蓋層可透過鏡頭提供實時指引,例如在國外旅遊時辨識路邊停車資訊。Magic Cue 功能讓 AI 能跨 Gmail、日曆等應用提供情境化建議,類似早期 Google Now 的進化版,並可自動提醒待辦事項或推薦音樂。相機教練利用 Gemini 模型提供構圖建議,新增群組照片識別與自動最佳拍攝(Auto Best Take)功能,可分析最多 150 張照片並透過 AI 合成最佳畫面。此外,Pixel 10 還支援 C2PA 標準以識別數位內容是否經 AI 修改,並提供 30 至 60 倍 AI 縮放功能。Voice Translate 支援英、西、德、日、法、印地、意、葡、瑞典、俄及印尼等多國語言的即時通話翻譯,並能模擬說話者語音。Take a Message 功能則提供通話遺漏或拒接的即時轉錄,並由 AI 分析下一步行動。Pixel Journal 則是用於記錄想法與追蹤目標進度的 AI 工具。