文章
所有發布的 AI 新聞與論文。
-
OpenAI 正在簡化檢測圖片是否由其模型生成的過程
針對 AI 生成影象日益難以辨認的挑戰,OpenAI 於週二宣佈兩項新措施以協助對抗此問題。公司承諾採用名為 C2PA 的公開標準,該標準會在影像的後設資料中加入明確訊號,標示該影像是由 AI 生成。此外,OpenAI 與 Google 合作,將引入一種名為 SynthID 的隱形水印。這種水印雖然較難被檢測,但也更難以被惡意行為者擦除。這些新保護措施僅適用於由 OpenAI 產品生成的影像,旨在確保 OpenAI 不參與問題,同時不影響來自其他工具的大量影像。OpenAI 還預覽了一款公共驗證工具,可檢查上述兩種訊號,讓使用者輕鬆測試影像是否由 AI 生成。該工具初期僅涵蓋 OpenAI 產品生成的影像,公司希望未來能擴充套件至其他工具。 成立於 2021 年的內容 provenance 與真實性聯盟(Coalition for Content Provenance and Authenticity,簡稱 C2PA)是一個非營利組織,致力於減輕 AI 影像對公共討論的有害影響。C2PA 標準已被多款 Google 產品採用,但業界整體採用率仍不一致。由於 C2PA 訊號可透過後設資料清晰存取,但也可能被操弄,因此對受信任的使用者最為有效。SynthID 則是 Google 開發的新嘗試,旨在提供更堅實的防護,即使惡意行為者嘗試透過截圖、縮放或數位操作移除水印,該水印仍能持續存在。OpenAI 指出,水印在經過如截圖等轉換時可能更持久,而後設資料則能提供比水印更多的資訊。兩者互為補充,共同使影像來源的證明比單獨使用任一層面更具韌性。
-
Google推出全新Universal Cart追蹤用戶全網購物旅程
Google 於週二在 Google I/O 開發者大會上正式推出 Universal Cart,這被定位為整合購物體驗的代理中心。該功能允許使用者從搜尋、Gemini 聊天、YouTube 或 Gmail 等多個入口點新增商品,並由系統自動追蹤促銷活動、監控價格波動、提供歷史價格分析以及庫存補貨提醒。Universal Cart 利用 AI 技術協助消費者做出更明智的購買決策,例如在組裝自訂電腦時,若發現選用的處理器與主機板不相容,系統會自動標記並建議替代方案。對於頻繁旅行或重視積分回饋的使用者,該功能可透過 Google Wallet 整合隱藏優惠,幫助最大化積分使用。 Google 同時宣佈將通用商業協議(UCP)擴充套件至更多類別,包括飯店預訂與當地外送服務,並計劃將此協議應用範圍從美國擴大至加拿大、澳洲及英國。此外,Universal Cart 將於今日在美國推出,預計今年夏季將整合至 Gemini 應用程式,隨後擴充套件至 YouTube 和 Gmail。 另一項重要公告是 Agent Payments Protocol(AP2)的更新。該協議旨在讓 AI 代理在使用者授權下,在設定好的品牌、產品範圍及消費額度內,自動完成支付。Google 表示將於未來幾個月將此技術整合至其自有產品中,以增強對消費者購物行為的掌控力。AP2 透過加密技術保護使用者資料,並建立不可篡改的數位記錄與審計追蹤,確保交易透明且可追溯,同時為消費者提供針對特定商品或品牌的退款與爭議處理依據。
-
Google 的 Gemini Omni 可將圖片、音訊和文字轉換為影片 —— 這僅是開始
Google 於 Google I/O 開發者大會上推出 Gemini Omni 系列多模態模型,旨在實現從任何輸入建立任何內容的目標。該系列首發的 Gemini Omni Flash 模型今日開放使用,整合了影象、音訊、影片和文字,並能透過推理產生符合物理、文化、歷史及科學邏輯的高質量影片。與現有 Veo 模型不同,Omni 允許使用者使用普通文字指令編輯照片,類似於 Nano Banana 功能,並支援生成帶有自定義數字頭像的影片。為防止深度偽造,使用者需透過記錄聲音和數字進行認證,且所有生成的影片將包含 Google SynthID 數字水印。Omni Flash 初始可渲染十秒影片,主要面向消費者市場,未來將推出更長時長版本及效能更強的 Omni Pro 模型。該技術將透過 API 向企業和創意工作者開放,並可應用於廣告製作和電影行業。此外,Google 還推出了 Gemini Spark 全天候代理助手,並更新了 Gemini 應用以應對競爭。
-
Google 的 AI 工作室現在讓任何人都能在幾分鐘內建立 Android 應用程式
Google 於 2026 年 2 月 2 日在 Google IO 2026 開發者大會上宣佈,其網頁版 Google AI Studio 新增了原生 Android 應用程式開發功能,將原本需要數週的設定與編碼過程縮短至數分鐘。此功能允許使用者透過 Gemini AI 在 Play Store 及網頁端搜尋所需應用程式,擴大開發者被發現的機會。新工具支援 Kotlin 程式語言與 Jetpack Compose 套件,並整合 GPS、藍芽及 NFC 等硬體感測器。目前生成的應用程式僅限個人使用,尚未支援公開發布給親友,但可透過內建 Android Emulator 在瀏覽器中預覽,並透過 USB 連線電腦使用 Android Debug Bridge (adb) 安裝至手機。開發者亦可將專案轉存至 GitHub 或上傳至 Google Play Console 內部測試軌道進行迭代。未來 Google 計劃開放向親友發布,並加入 Firebase 整合(包含 Firestore、Firebase Auth 等工具)。此外,Google 推出「Ask Play」AI 覆蓋層,讓使用者透過自然對話在 Play Store 發現新應用程式。Gemini 虛擬助手將開始將應用程式展示給使用者,此功能將於數週內於網頁版及 Android 端推出。同年晚些時候,Gemini 還將展示超過 450,000 部電影與電視劇,並連結至相關開發者的 Android 應用程式。此舉旨在建立一個基於使用者社交網路的 Android 應用程式生態系統,並與 Cursor、Replit、Lovable 等 AI 開發工具競爭。