分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
矽谷是否準備好將機器人帶進人們家中?Hello Robot 已經準備好了。
位於加州馬丁尼斯的 Hello Robot 公司推出了其第四代家庭服務機器人 Stretch,這款機器人旨在解決當前機器人領域缺乏真實場景訓練資料的問題。與位於南邊 45 英里處矽谷的競爭對手不同,Hello Robot 由前 Google 機器人總監 Aaron Edsinger 和佐治亞理工大學教授 Charlie Kemp 於 2017 年創立,其 Stretch 機器人擁有類人軀幹和感測器頭部,但配備了夾爪式手臂和全向輪式底座。公司強調 Stretch 並非追求取代人類工作,而是專注於在真實家庭環境中與真實人互動,以積累競爭對手無法複製的特定場景資料和作業容錯率。 該機器人特別針對行動不便人士設計,例如投資人和董事會成員 Keith Platt 在 2021 年成為四肢癱瘓後,利用 Stretch 透過 iPhone 語音應用程式自主完成倒蛋白搖杯等日常任務。Stretch 4 售價為 30,000 美元,公司計劃在馬丁尼斯總部生產 200 至 300 臺,首批已售罄。與某些競爭對手如 1X 的 Neo 機器人不同,Hello Robot 採取謹慎策略,強調人類在迴圈中的控制權,並確保機器人在發生錯誤時不會造成損壞。Stretch 的設計標準包括可透過紙箱透過 UPS 或 DHL 運輸,以降低成本並提高可及性。目前,該機器人正被用於資料中心測試、AI 演算法驗證以及協助殘障人士,其綜合感測套件和物理能力被視為物理 AI 發展的重要一步。
-
Google 的 Dreambeans 將把你的生活變成動畫
Google Labs 推出了一款名為 Dreambeans 的新 AI 應用程式,適用於 iOS 和 Android 裝置。該產品由產品負責人 Gozde Oznur 主導開發,旨在利用使用者在 Gmail、日曆、照片、YouTube 及搜尋歷史等 Google 服務中的資料,透過個人智慧(Personal Intelligence)生成每日精選的 AI 繪製故事。這些故事主要提供生活建議,包括推薦景點、探索主題、嘗試事項、即將出發的旅程以及應注意的活動。例如,若使用者在日曆中標記了養新狗的事件,Dreambeans 就會提供關於與新寵物生活的相關洞察;若使用者有特定興趣,系統也會推送相關的網路新聞文章。 為了對抗過度滑動手機螢幕的習慣,Dreambeans 每天僅提供 10 到 14 則故事,鼓勵使用者在獲得靈感後投入生活。該應用目前僅開放給符合資格的美國 Google AI Ultra 訂閱使用者,個人 Google 帳戶使用者則可加入候選名單。Oznur 解釋了命名由來:「夢」的部分象徵著應用程式在使用者睡眠時處理大量資料,而「豆子」則代表清晨一杯新鮮咖啡帶來的靈感,系統在夜間處理完所有資訊後,於早晨提供濃縮的啟發。關於隱私保護,Oznur 表示措施相當嚴謹,僅使用者可存取故事內容,使用者可隨時刪除資料並選擇連線的 Google 服務。
-
亞馬遜將在你因某些原因搜尋時顯示AI生成的產品圖片
亞馬遜於週三宣佈,將在其購物應用程式中展示根據使用者搜尋查詢生成的 AI 製圖產品圖片。亞馬遜表示,此功能旨在幫助消費者在不知如何描述特定詞彙時(例如「cowl neck」或「rattan」)找到所需商品。當使用者輸入搜尋查詢時,系統會在自動補全建議下方顯示多種 AI 生成的產品圖片,點選其中一張將引導至更匹配該風格的搜尋結果,利用亞馬遜的視覺搜尋能力。然而,此舉被批評為具有欺騙性,因為使用者可能誤以為能直接找到該款商品,結果卻發現庫存不足。此外,亞馬遜網站已有大量真實產品照片,製作虛假圖片似乎缺乏必要。此功能是亞馬遜整合 AI 技術的一系列嘗試之一,包括使用 AI 總結客戶評論、去年推出的類似播客的產品摘要功能、AI 生成的可購買拼貼圖、亞馬遜鏡頭直播(Amazon Lens Live)、為視覺搜尋新增文字功能以及 iOS 的鎖定螢幕視覺搜尋小工具。本月早些時候,亞馬遜還將其 Rufus AI 聊天機器人替換為 Alexa for Shopping,以支援透過語音和文字進行自然語言購物查詢。
-
微軟新工具讓開發者能透過文字描述快速建立AI行為測試
微軟於週二推出名為 ASSERT 的開源框架,全稱為 Adaptive Spec-driven Scoring for Evaluation and Regression Testing,旨在簡化針對特定產品或服務進行 AI 系統行為測試的過程。該框架利用 AI 技術,將高層次的自然語言描述轉化為詳細的評分測試,這些測試可針對目標系統執行並記錄結果。ASSERT 能將對 AI 模型預期行為和政策的平語言描述,轉化為結構化的可接受與不可接受行為集,並生成問題情境與測試案例。它還能記錄 AI 系統的路徑,包括中間動作與工具呼叫,協助開發者檢查失敗發生地點。開發者可提供系統背景、工具及限制條件以進一步自訂評估範圍。例如,開發者可指定檔案研究 AI 代理不應向公司外人員傳送郵件,並限制機密資訊僅供 C 級高管檢視,同時根據先前背景提供簡潔摘要。ASSERT 將使用這些規則生成持續檢查系統是否遵循規則的測試案例。微軟負責 AI 的首席產品官莎拉·柏德指出,評估對於做出正確決策至關重要,若不瞭解 AI 系統行為,則難以判斷其是否符合組織標準。她強調,若要建立可信賴的系統,應評估更多與應用相關的維度。ASSERT 可用於系統開發、部署後及持續監控階段。此發布正值 AI 產業逐漸轉向更廣泛的測試與回歸檢查,隨著模型能力增強,研究人員專注於可重複測試,斯坦福的 HELM、MLCommons 的 AILuminate 及 METR 等評估團體正推出基準測試,以測量模型在不同條件下的行為。