分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
哈佛退學生將發佈一款持續運作的AI智能眼鏡 能聆聽並錄製所有對話
前哈佛學生 AnhPhu Nguyen 與 Caine Ardayfio 推出了名為 Halo X 的 AI 智慧眼鏡,該產品由 Halo 公司開發,旨在提供即時資訊與無限記憶功能。該團隊已籌得 100 萬美元資金,由 Pillar VC 主導,並獲得 Soma Capital、Village Global 及 Morningside Venture 支援。Halo X 售價為 249 美元,預計於週三開放預購。該產品使用 Google Gemini 與 Perplexity 作為聊天機器人引擎,能聆聽對話並即時顯示相關資訊,例如計算複雜數學題或回答問題。 然而,該產品引發隱私爭議。Ardayfio 與 Nguyen 此前曾開發一款用於 Meta Ray-Ban 眼鏡的臉部識別應用程式,被指可能用於洩漏個人資料(doxing),且測試時未經同意對路人進行掃描。Halo X 雖無外部指示燈,但聲稱錄音檔會自動刪除,並透過 Soniox 進行轉錄。團隊表示將尋求 SOC 2 合規認證,但尚未提供具體日期。此外,產品目前依賴手機供電與運算,僅具備顯示器與麥克風,無攝影機。 隱私倡導者指出,無聲無息錄音裝置的普及可能侵蝕公眾對隱私的預期,且美國多州禁止未經同意的錄音。儘管團隊表示會提醒使用者在雙方同意州取得許可,但資料儲存位置與加密機制仍受質疑。目前該產品僅有顯示與錄音功能,未來可能加入攝影機。
-
現在你可以對話 Google 圖片來編輯照片
Google 於週三在「Made by Google」活動中宣佈,Google Photos 將推出新功能,允許使用者透過自然語言指令讓應用程式自動編輯照片。此功能將率先在美國上市的 Pixel 10 裝置上推出,使用者可透過語音或文字描述所需修改,例如移除背景中的車輛、修復舊照片、調整光線、去除幹擾物,甚至進行創意編輯如為照片中的人物新增太陽眼鏡或派對帽。若使用者不知如何具體描述,只需輸入「讓它更好」,Google Photos 將自動進行調整並提供建議,同時支援後續的微調請求。該功能依賴 Gemini 技術,旨在幫助技術能力較弱或對編輯工具不熟悉的使用者輕鬆改善照片。此外,Google 還將在 Google Photos 中支援 C2PA 內容憑證,Pixel 10 將成為首款採用此標準的 Google 產品,以提升影像製作過程的透明度並釐清是否涉及人工智慧。C2PA 支援將先於 Pixel 10 推出,隨後逐步擴充套件至 iOS 和 Android 版的 Google Photos。
-
Dex 是一款 AI 儀器,幫助兒童學習新語言
三位父母——Reni Cao、Xiao Zhang 和 Susan Rosenthal——因擔心孩子螢幕時間過長,決定離開科技業,開發一款名為 Dex 的產品,旨在鼓勵孩子接觸真實世界並學習新語言。該公司近期成功籌得 480 萬美元資金。Dex 外觀類似高科技放大鏡,一面為鏡頭,另一面為觸控螢幕。當孩子用其拍攝物體時,AI 透過影像識別技術識別物件並將其翻譯成選定語言,同時提供互動故事課程與遊戲。與 Duolingo Kids 等現有應用程式不同,Dex 強調動手體驗,讓孩子沉浸於語言學習中。Cao 表示,他們試圖以互動方式在真實世界中教授真實語言,讓孩子們不僅是聽從指令,而是思考、創造、互動並對事物產生好奇,從而習得相關語言。 Dex 設計物件為 3 至 8 歲兒童,目前支援中文、法語、德語、印地語、義大利語、日語、韓語及西班牙語,並提供 34 種方言支援,包括埃及阿拉伯語、臺灣 Mandarin 及墨西哥西班牙語。除了物件識別,Dex 還擁有互動故事庫,鼓勵孩子主動參與敘事,例如在故事中用目標語言向角色問候。產品附帶專為家長設計的應用程式,可顯示孩子學習進度、習得詞彙、參與故事及連續使用天數。 此外,Dex 正開發讓兒童向 AI 聊天機器人提問並進行自由對話的功能,目前僅部分測試使用者可用。針對家長對 AI 聊天機器人的疑慮,Cao 表示已加入嚴格的安安全提示,並部署全天候安全代理,即時評估對話並過濾不安全詞彙,如性、宗教、政治等。AI 訓練採用類似 Britannica Kids 的詞彙標準,測試中成功忽略裸露相關話題,但也準確翻譯了「槍」一詞,因此家長購買時應留意。公司正考慮在設定中增加過濾特定詞彙(如槍、菸草、電子菸、煙火、大麻、啤酒瓶)的選項。Dex 採用零資料保留政策,雖避免敏感影像儲存,但家長可能無法完全掌握孩子拍攝內容。公司正積極爭取 COPPA Safe Harbor 狀態以符合兒童線上隱私保護法。 Dex 由 Parable 主導
-
為何 paradigm 建立一個每個儲存格都有 AI 代理的電子表格
Anna Monaco 自「AI 代理」一詞出現前便開始構建相關技術,她發現許多人在雜湊表中儲存重要客戶關係管理資料,因認為其最靈活,但維護過程充滿手動工作且效率低下。為此,她開發了名為 Paradigm 的產品,這是一個搭載超過 5,000 個 AI 代理的 AI 驅動雜湊表。使用者可為不同欄位或單元格指派提示,AI 代理將爬蟲網路以填補所需資訊。Paradigm 支援 Anthropic、OpenAI 及 Google Gemini 等模型,並具備模型切換功能,以平衡推理能力與成本。公司於 2024 年底推出小規模封閉測試,目前正開放給公眾使用。Paradigm 已獲得由 General Catalyst 領銜的 500 萬美元種子輪融資,總籌資額達 700 萬美元,資金將用於執行激進的產品路線圖。早期客戶包括諮詢公司 EY、AI 晶片起點公司 Etched 及 AI 編碼公司 Cognition。Paradigm 採用基於使用量的訂閱模式,吸引從顧問到銷售人員及財務人員等多類使用者。Monaco 表示,Paradigm 不將自身視為傳統 AI 雜湊表,而是一種發生在雜湊表形式中的新 AI 驅動工作流,旨在平衡當前價值與未來發展。儘管 Quadratic 等公司也在進行類似轉型,Monaco 仍認為其產品定位獨特,專注於提供即時高價值並為未來鋪路。