分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
Google預告新款Gemini功能於CES 2026電視應用
Google 於十一月將 Gemini AI 引入 Google TV 裝置,旨在提升電視觀看體驗。在拉斯維加斯舉行的 CES 2026 展會上,Google 展示了即將上線的一系列新 Gemini 功能,讓觀眾能深入探討主題、利用 AI 搜尋並重構個人照片與影片,甚至透過語音指令直接控制電視操作,無需複雜的設定導航。這些功能將先於選定的 TCL 電視推出,隨後逐步擴充套件至其他 Google TV 裝置。專為大螢幕設計的 Gemini for Google TV 允許使用者透過自然語言對話尋找節目、獲取劇情摘要或獲得推薦,例如詢問適合兩人口味的影片、回憶不起片名但能描述劇情或提及演員,或是查詢熱門醫院劇集。Gemini 透過新的視覺豐富框架回應問題,結合文字、影像、影片背景及即時體育更新。此外,電視螢幕不僅限於娛樂,還可用作教育工具,提供敘述式互動概覽以簡化概念,並允許使用者提出後續問題深入學習。使用者還能查詢 Google 照片庫中特定人物或時刻,運用 Gemini AI 為照片和影片套用藝術風格,將回憶轉化為電影風格的動態影集。最實用的功能之一是透過語音最佳化電視設定,使用者可指示「畫面太暗」或「聽不清對白」,Gemini 將自動調整相關設定,無需離開當前節目。Google 表示,新 Gemini 功能需要裝置執行 Android TV OS 14 或更高版本,並需連線網路。並非所有語言、國家或裝置在發售時皆支援,且使用者必須擁有 Google 帳號才能存取 Gemini for TV 體驗。
-
Plaud 發布全新 AI 拇指釦與桌面會議備忘錄工具
硬體製造商 Plaud 在拉斯維加斯舉辦的 2026 年消費者電子展(CES 2026)前夕,推出了名為 Plaud NotePin S 的新型 AI 筆記本,並同步發行了專為數位會議設計的桌面應用程式。Plaud 於 2024 年首次發行了其別針式筆記本,該產品曾受到前同事 Brian Heater 的喜愛。新款 NotePin S 配備了實體按鈕,可用於啟動和停止錄音,且在錄音期間點選按鈕可標記特定重點,此功能與新推出的 Plaud Note Pro 相似。售價 179 美元的 NotePin S 包裝內包含夾子、掛繩、磁性別針和手環,讓使用者可根據需求佩戴裝置。公司還新增了 Apple Find My 支援功能,方便使用者在遺失時尋找裝置。 該裝置的核心規格與前代相同,擁有 64GB 內建儲存空間,電池續航時間為連續錄音 20 小時。裝置配備兩顆 MEMS 麥克風,可在 9.8 英尺範圍內捕捉清晰音訊。使用者每月可免費獲得 300 分鐘的轉錄服務。與 Note Pro 相比,NotePin S 的錄音範圍較短且電池續航力較低,但體積更小,更適合隨身攜帶。Plaud 表示該產品適合經常行動的人士。 這是 Plaud 推出的第四款產品,截至目前公司已銷售超過 150 萬臺裝置。雖然公司此前專注於實體會議筆記,但現在也試圖挑戰 Granola、Fathom 和 Fireflies 等會議筆記本產品,透過跨應用程式的桌面客戶端擴充套件市場。該應用程式能偵測會議是否進行中並提示使用者捕捉轉錄,Mac 版應用程式利用系統音訊記錄會議,再利用 AI 將轉錄內容結構化為筆記。去年 Plaud 已在應用程式中引入多模態輸入功能,允許使用者加入圖片和文字筆記與音訊轉錄,此功能也將帶入桌面應用程式。
-
OpenAI 賭注聲音未來 硅谷對螢幕宣戰
OpenAI 正大力押注音訊人工智慧,不僅是為了讓 ChatGPT 聽起來更好,而是為了為一年後預計推出的音訊優先個人裝置做準備。根據 The Information 的新報導,OpenAI 在過去兩個月內整合了多個工程、產品和研發團隊,全面重構其音訊模型。這一舉動反映了整個科技產業的趨勢,即螢幕將成為背景噪音,而音訊將成為核心。目前,智慧音箱已讓語音助手成為美國三分之一家庭的常設設施。Meta 最近推出了其雷拜恩智慧眼鏡的功能,利用五個麥克風陣列幫助使用者在嘈雜環境中聽清對話,本質上將臉部轉化為定向聆聽裝置。Google 自六月起開始實驗「音訊摘要」功能,將搜尋結果轉化為對話式總結,而 Tesla 則將 xAI 的聊天機器人 Grok 整合進車輛,打造能處理導航和空調控制等各項任務的對話式語音助手。 除了科技巨頭,一群創業公司也持同樣信念,儘管成功程度不一。Humane AI Pin 的製造商在無螢幕可穿戴裝置成為警示案例前耗費了數億美元。Friend AI 項鍊聲稱能記錄使用者生活並提供陪伴,卻同時引發了隱私擔憂和存在主義恐懼。現在至少兩家公司,包括 Sandbar 和由 Pebble 創辦人 Eric Migicovsky 領導的公司,正在開發預計於 2026 年推出的 AI 戒指,讓佩戴者能與手對話。雖然外形可能不同,但核心論點一致:音訊是未來的介面。每個空間——家、車甚至臉部——都正在成為控制表面。OpenAI 的新音訊模型預計於 2026 年初推出,據稱將聽起來更自然,能像真正的對話夥伴一樣處理中斷,甚至能在使用者說話時回應,這是今日模型無法做到的。公司還 envision 一組裝置,可能包括眼鏡或無螢幕智慧音箱,它們將更像伴侶而非工具。這並不令人驚訝,正如 The Information 所指出的,前 Apple 設計總監 Jony Ive 透過 OpenAI 五月以 65 億美元收購其公司 io 加入硬體團隊,將減少裝置依賴視為優先事項,認為音訊優先設計是糾正過去消費電子產品錯誤的機會。
-
手機已死,長壽的是……究竟什麼?
True Ventures 共同創辦人 Jon Callaghan 預測,五年內我們使用手機的方式將大不相同,十年後可能完全不再使用。作為管理資產達 40 億美元的投資機構,True Ventures 正積極押注此觀點,認為手機作為人類與智慧介面效率低下且易出錯。該公司雖在社交媒體上保持低調,卻在過去二十年累積了 63 次成功退出和 7 次上市,並專注於培養重複合作的創業者。Callaghan 指出,手機市場已飽和,年增長率僅約 2%,而穿戴裝置如智慧手錶和手環則以雙位數速度擴張。 True Ventures 的投資策略聚焦於新行為而非新硬體,這解釋了他們早期投資 Fitbit、Peloton 和 Ring 的成功。最近,他們投資了名為 Sandbar 的硬體裝置,這是一款由 Mina Fahmi 和 Kirak Hong 開發的指環,旨在透過語音記錄和組織使用者的想法。Callaghan 認為,真正的價值創造將發生在應用層,而非基礎設施層,新的介面將啟用全新的行為模式。儘管 OpenAI 等公司估值高昂,Callaghan 對資本密集型的資料中心建設持謹慎態度,但他對應用層帶來的機會充滿樂觀。True Ventures 堅持以 300 萬至 600 萬美元進行種子輪投資,不追求百億美元規模的融資,相信早期投資應具有挑戰性且模糊不清,但需與深信的團隊合作。Callaghan 強調,真正的投資機會往往讓人感到恐懼和孤獨,但五年後將證明其正確性。