文章
所有發布的 AI 新聞與論文。
-
現在你可以對話 Google 圖片來編輯照片
Google 於週三在「Made by Google」活動中宣佈,Google Photos 將推出新功能,允許使用者透過自然語言指令讓應用程式自動編輯照片。此功能將率先在美國上市的 Pixel 10 裝置上推出,使用者可透過語音或文字描述所需修改,例如移除背景中的車輛、修復舊照片、調整光線、去除幹擾物,甚至進行創意編輯如為照片中的人物新增太陽眼鏡或派對帽。若使用者不知如何具體描述,只需輸入「讓它更好」,Google Photos 將自動進行調整並提供建議,同時支援後續的微調請求。該功能依賴 Gemini 技術,旨在幫助技術能力較弱或對編輯工具不熟悉的使用者輕鬆改善照片。此外,Google 還將在 Google Photos 中支援 C2PA 內容憑證,Pixel 10 將成為首款採用此標準的 Google 產品,以提升影像製作過程的透明度並釐清是否涉及人工智慧。C2PA 支援將先於 Pixel 10 推出,隨後逐步擴充套件至 iOS 和 Android 版的 Google Photos。
-
哈佛退學生將發佈一款持續運作的AI智能眼鏡 能聆聽並錄製所有對話
前哈佛學生 AnhPhu Nguyen 與 Caine Ardayfio 推出了名為 Halo X 的 AI 智慧眼鏡,該產品由 Halo 公司開發,旨在提供即時資訊與無限記憶功能。該團隊已籌得 100 萬美元資金,由 Pillar VC 主導,並獲得 Soma Capital、Village Global 及 Morningside Venture 支援。Halo X 售價為 249 美元,預計於週三開放預購。該產品使用 Google Gemini 與 Perplexity 作為聊天機器人引擎,能聆聽對話並即時顯示相關資訊,例如計算複雜數學題或回答問題。 然而,該產品引發隱私爭議。Ardayfio 與 Nguyen 此前曾開發一款用於 Meta Ray-Ban 眼鏡的臉部識別應用程式,被指可能用於洩漏個人資料(doxing),且測試時未經同意對路人進行掃描。Halo X 雖無外部指示燈,但聲稱錄音檔會自動刪除,並透過 Soniox 進行轉錄。團隊表示將尋求 SOC 2 合規認證,但尚未提供具體日期。此外,產品目前依賴手機供電與運算,僅具備顯示器與麥克風,無攝影機。 隱私倡導者指出,無聲無息錄音裝置的普及可能侵蝕公眾對隱私的預期,且美國多州禁止未經同意的錄音。儘管團隊表示會提醒使用者在雙方同意州取得許可,但資料儲存位置與加密機制仍受質疑。目前該產品僅有顯示與錄音功能,未來可能加入攝影機。
-
谷歌持續押注於「AI手機」推出Pixel 10系列
Google 在週三的「Made by Google」活動中正式推出 Pixel 10 系列,旨在比 Apple 更早向消費者提供搭載人工智慧的智慧型手機。該系列裝置僅比預期於本週三揭曉的 iPhone 17 提前數週登場,後者預計將帶來更佳的相機、更薄的機身及新配色。Pixel 10 系列整合了更多人工智慧功能,包括相機的視覺覆蓋層(Visual Overlays)、主動式「魔法提示」(Magic Cue)、相機教練(Camera Coach)、通話即時翻譯(Voice Translate)、訊息助手(Take a Message)、Pixel Journal 等。這些更新結合了 Tensor G5 晶片與最新的 Gemini Nano 模型,展現了 Google 人工智慧技術的潛力。 Gemini Live 新增了能偵測語氣並調整回應的新音訊模型,視覺覆蓋層可透過鏡頭提供實時指引,例如在國外旅遊時辨識路邊停車資訊。Magic Cue 功能讓 AI 能跨 Gmail、日曆等應用提供情境化建議,類似早期 Google Now 的進化版,並可自動提醒待辦事項或推薦音樂。相機教練利用 Gemini 模型提供構圖建議,新增群組照片識別與自動最佳拍攝(Auto Best Take)功能,可分析最多 150 張照片並透過 AI 合成最佳畫面。此外,Pixel 10 還支援 C2PA 標準以識別數位內容是否經 AI 修改,並提供 30 至 60 倍 AI 縮放功能。Voice Translate 支援英、西、德、日、法、印地、意、葡、瑞典、俄及印尼等多國語言的即時通話翻譯,並能模擬說話者語音。Take a Message 功能則提供通話遺漏或拒接的即時轉錄,並由 AI 分析下一步行動。Pixel Journal 則是用於記錄想法與追蹤目標進度的 AI 工具。
-
Anthropic 將 Claude Code 整合進企業方案
安提克(Anthropic)於週三宣佈推出新的訂閱方案,將原本僅限於個人帳戶的 Claude Code 命令列程式設計工具整合進 Claude for Enterprise 套件中。該工具此前僅供個人使用,現可作為更廣泛企業套件的一部分購買,支援更複雜的整合與強大的管理功能。安提克產品負責人斯科特·懷特(Scott White)表示,這是來自業務團隊和企業客戶最被請求的功能。此次整合有助於安提克在企業級命令列工具領域與 Google 和 GitHub 競爭,後者均在推出時就包含了企業整合功能。 Claude Code 自今年六月推出後,迅速成為最受歡迎的命令列程式設計工具之一,其代理式方法比傳統基於 IDE 的工具更具優勢。然而,隨著個人使用者數量增加,服務也面臨了一些挑戰,例如使用者曾遭遇突發的使用限制。新的企業方案部分旨在回應這些問題,允許企業設定精細的支出控制,並可根據高強度使用情況進行擴充套件。安提克特別看好 Claude Code 與 Claude.ai 聊天機器人之間的整合,企業訂閱者可利用此功能在聊天機器人中開發提示詞,或將命令列工具更深地整合到內部資料來源中。 懷特在談及工作時指出,涉及客戶反饋工具的企業整合具有變革性,能夠利用 Claude 總結大量來自不同來源的反饋,並將其轉化為具體的產品改進。他認為將客戶反饋與解決方案原型結合是過去一年前作為產品經理無法實現的。