分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
Studio 更新、YouTube Live 亮點、全新 GenAI 工具以及 Made on YouTube 網站上發表的其他所有公告
YouTube 於本週舉辦年度「Made on YouTube」活動,推出了大量針對創作者的新更新、功能與工具。YouTube Studio 新增了靈感標籤、標題 A/B 測試、自動配音等功能,其中「相似性」檢測功能已進入公開測試階段,允許使用者識別並標記未經授權使用其面部特徵的影片。AI 驅動的 Ask Studio 可協助解答帳戶問題,且創作者最多可與五人協作製作同一部影片。YouTube Live 平臺更新包括讓創作者進行迷你遊戲、同時橫向與縱向直播、AI 自動精選精彩片段、即時反應功能以及新的側邊欄廣告格式,該廣告不會中斷直播流。Shorts 平臺將引入 Google 自研的 Veo 3 文字生成影片模型,創作者可將影片動作應用於圖片、新增不同風格或透過文字提示插入物件,並利用 Lyria 2 AI 音樂模型將對話轉化為音軌。YouTube Music 新增發行倒數計時器與感謝影片功能,並測試美國聽眾購買藝術家獨家商品的計劃。針對播客創作者,美國使用者可透過 AI 建議更輕鬆地製作短片,且明年將推出將音訊播客轉為影片播客的功能。在商業化方面,YouTube 提供品牌合作與購物計劃,允許創作者在長影片中更換贊助商,並利用 AI 系統自動識別產品提及的最佳時機顯示標籤。Shorts 創作者可為品牌連結新增特定連結,且平臺將在創作者合作中心主動推薦適合的品牌。
-
Google 現在讓你分享自訂的 Gemini AI 助手,名為 Gems
Google 於週四宣佈,現在讓使用者可以分享自訂的 Gemini Gems,這些是針對特定任務設計的客製化 AI 助手與專家。該功能去年初隨 Gemini Advanced 付費訂閱推出,允許使用者撰寫指令來建立不同情境的 AI 聊天機器人,並包含學習教練、腦力激盪助手、職業指南、寫作編輯及程式碼夥伴等預製 Gems。如今,Google 表示使用者可像從 Google Drive 分享檔案般,輕鬆將 Gems 分享給朋友、家人或同事,這將提升 Gems 的可及性,讓未使用高階自訂功能的使用者也能受益,並避免多人建立相似 Gems 時產生的不一致問題。例如,同事間可共用資源而非各自建立版本。Google 建議此功能適用於家庭度假規劃、旅遊指南、餐點規劃或協作寫作專案。要分享 Gems,使用者需在網頁版 Gems 管理員中點選 Gems 旁的「分享」圖示,並可參考 Google Drive 的方式控制誰可檢視與使用 Gems,以及誰可編輯。該功能先於 Gemini Advanced、Gemini Business 及 Gemini Enterprise 訂閱者推出,涵蓋全球超過 150 個國家,並於三月宣佈對所有人開放,同時支援檔案上傳。
-
馬克·祖克柏開始尋求淘汰智慧型手機
Meta 於 Meta Connect 2025 發表會中推出最新產品 Meta Ray-Ban Display,旨在解決使用者過度依賴手機的問題。執行長 Mark Zuckerberg 表示,智慧眼鏡能幫助人們恢復與他人相處的「臨場感」,並希望藉此搶奪 Apple 和 Google 在智慧手機市場上的份額。該產品由 Reality Labs 部門開發,自 2020 年以來該部門已累積 700 億美元的虧損,但此次展示顯示了資金投入的成果。 Meta Ray-Ban Display 配備相機、揚聲器、麥克風及內建 AI 助手,鏡片設計不阻擋視線,可顯示 Instagram、WhatsApp 等應用、導航及即時翻譯。其核心創新在於 Meta Neural Band 腕帶,利用表面肌電圖(sEMG)技術捕捉大腦與手部動作訊號,讓使用者無需發聲即可打字。Zuckerberg 現場示範以每秒約 30 字的速度傳送訊息,高於研究參與者平均 21 字/分鐘的表現,也優於 iPhone 使用者約 36 字/分鐘的打字速度。 儘管過去元宇宙計劃曾受挫,Meta 仍將此視為比元宇宙更重大的賭注,試圖推動從手機到智慧眼鏡的文化轉變。Zuckerberg 強調技術應「退居後臺」,讓使用者更專注於現實互動。然而,市場仍需觀察此技術在日常使用中的自然度,以及是否能真正取代智慧手機成為主流裝置。
-
Google 在 Chrome 引入 Gemini 並推出代理瀏覽功能等新功能
Google 於週四宣佈,將 Gemini 功能全面推出至 Chrome 瀏覽器,適用於美國所有 Mac 和 Windows 桌面使用者,此前該功能僅限 Google AI Pro 和 Google AI Ultra 訂閱者使用。此次更新包含多種新特性,例如將 AI Mode 搜尋功能整合至地址列,未來將引入代理能力以自動化任務,並利用 AI 對抗由生成式 AI 製造的詐騙。美國使用者若語言設定為英文,可透過 Chrome 右上角的 Gemini 圖示,對任何網頁上的複雜資訊提出澄清,例如將香蕉麵包食譜改為無麩質版本。Gemini 現在支援跨多個標籤頁運作,允許使用者快速比對和總結不同網站資訊,例如在規劃行程時整理航班、飯店與度假資訊,或在購物時比較不同床墊型號。此外,Gemini 即將能檢索使用者先前瀏覽過的網頁,方便回溯過往搜尋記錄,無需翻閱瀏覽器歷史。Google 還加強了 Gemini 與 Calendar、YouTube 及 Maps 等 Google 應用程式的整合,讓使用者無需離開當前頁面即可安排會議、檢視位置詳情或定位影片特定片段。未來,Gemini 將能完成繁瑣任務,如預約剪髮或訂購週期性雜貨,自動導航至網站、加入購物車並引導使用者完成結帳。OpenAI 此前推出的 Operator 自主 AI 代理也值得注意。AI Mode 將直接整合至地址列,使用者可提出複雜問題並進行後續提問,例如針對側睡且有下背痛者製作床墊比較表格,並進一步詢問記憶棉床墊的耐用性。此更新將於本月後期以英文在美國推出,未來將擴充套件至更多國家和語言。Chrome 還將使用 Gemini Nano 模型檢測並保護使用者免受假冒病毒警報和詐騙贈品等詐騙侵害,這些詐騙常偽裝成可信品牌。同時,Google 利用 AI 協助使用者在受支援網站(如 Coursera、Spotify、Duolingo、H&M 等)修復洩漏的密碼,只需單擊即可生成並儲存新密碼。