分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
Google 推出新 Gemini 模型可於機器人端執行
Google DeepMind 於週二發布了名為 Gemini Robotics On-Device 的新語言模型,該模型可在機器人本地執行任務,無需連線網際網路。此模型建立在三月發布的 Gemini Robotics 基礎之上,能夠控制機器人的動作。開發者可使用自然語言提示來控制和微調模型以滿足不同需求。在基準測試中,Google 聲稱該模型表現水平接近雲端版的 Gemini Robotics 模型,且在一般基準測試中優於其他本地模型,儘管未具體命名對手。在演示中,公司展示了機器人使用此本地模型執行解開袋子摺疊衣物等任務。Google 表示,該模型雖為 ALOHA 機器人訓練,但後來已適配至雙臂 Franka FR3 機器人及 Apptronik 的 Apollo 人形機器人。Google 聲稱雙臂 Franka FR3 成功應對了從未見過的場景和物件,例如在工業傳送帶上進行組裝。此外,Google 還發布了 Gemini Robotics SDK,開發者可透過 MuJoCo 物理模擬器向機器人展示 50 至 100 次任務演示以訓練新任務。其他 AI 模型開發者也在涉足機器人領域,Nvidia 正在構建用於人形機器人的基礎模型平臺,Hugging Face 不僅開發機器人開源模型和資料集,還正在開發機器人,而由 Mirae Asset 支援的韓國起點公司 RLWRLD 也在致力於建立機器人基礎模型。
-
Google 在印度推出 AI 模式給用戶使用
Google 今日向印度使用者推出了其 AI 模式,這是一款問答式的搜尋工具。公司表示該工具目前仍處於實驗階段,使用者需透過 Search Labs 自願啟用。啟用後,使用者可用英語提出複雜的多部分查詢,例如關於如何讓精力充沛的兒童在炎熱且空間有限的環境下進行室內活動的建議。使用者亦可提出後續問題以精確結果。Google 此前於今年初在美國向高階訂閱使用者測試此功能,隨後在 Google IO 活動後向全美使用者廣泛推廣。隨著時間推移,公司已加入購物功能,並引入語音與圖片搜尋支援,同時推出廣告。由於語音搜尋在印度很流行,公司確認語音與圖片搜尋功能已支援印度使用者。此 AI 模式由自訂版本的 Gemini 2.5 驅動。早期測試顯示,測試者提出的查詢長度是以往的兩到三倍。印度擁有超過 8.7 億網民,是 Google 最大的市場之一,也是觀察多語言使用者使用情況的測試場。儘管 Google 仍佔據搜尋市場主導地位,但人們開始在日常使用中更多採用 ChatGPT 和 Perplexity 等基於對話的 AI 工具。Google 希望透過 AI 模式讓偏好該介面的人使用其產品。此外,Google 還推廣 AI 摘要功能,該功能於四月時已在全球擁有超過 15 億使用者。近期《華爾街日報》報導指出,Google 的 AI 功能對出版商造成影響,導致來自自然搜尋的流量下降。
-
洩漏消息顯示 GROK 或將 soon 編輯您的電子表格
洩露的程式碼顯示 xAI 正在開發一款進階的檔案編輯器,專為 Grok 設計並支援試算表功能,這標誌著該公司試圖透過將 AI 助手嵌入生產力工具來與 OpenAI、Google 和 Microsoft 競爭。逆向工程師 Nima Owji 指出,使用者可以在編輯檔案的同時與 Grok 對話並請求協助。TechCrunch 已聯絡 xAI 確認此發現,儘管 xAI 尚未詳細說明其策略,但過往的行動顯示其對互動式多模態 AI 工作空間的重視。2025 年 4 月,xAI 推出了 Grok Studio,這是一個分屏工作區,允許使用者與 Grok 協作生成檔案、程式碼、報告和網頁遊戲,同時還推出了可將檔案和對話整合在同一處的「工作區」功能。雖然 OpenAI 和 Microsoft 有類似工具,但 Google 的 Gemini Workspace 針對試算表、檔案和 Gmail 的整合似乎與 xAI 正在構建的產品最接近,因為 Google 的工具允許在檢視或編輯檔案時與 Gemini 聊天。主要差異在於 Gemini Workspace 僅限於 Google 生態系統內運作。目前尚不清楚 xAI 的編輯器將支援哪些型別的檔案,或是否計劃建立一套完整的生產力套件以與 Google Workspace 或 Microsoft 365 抗衡。若 Owji 的發現屬實,這款進階編輯器將是埃隆·馬斯克將 X 轉化為包含檔案、聊天、支付和社交媒體等功能的「萬能應用程式」願景的一步。
-
目前已有超過一百萬人可以使用搭載 Gen-AI 技術的 Alexa+
Amazon 已持續向更多使用者傳送升級版數位助理 Alexa+ 的邀請,該服務由生成式 AI 驅動。Amazon 確認,此服務於二月首次宣佈後,目前已有超過一百萬使用者獲得邀請,但尚未對公眾開放。Amazon 正透過等待名單逐步傳送邀請,主要針對最初報名測試的客戶。過去幾週,許多人在社交媒體上分享收到邀請的訊息。Alexa+ 在早期存取階段免費,未來將對 Prime 會員免費開放,非 Prime 使用者在正式公開後將需每月支付 19.99 美元。Amazon 表示,邀請將分波次在未來幾個月推出。截至 2025 年 5 月,Amazon 執行長 Andy Jassy 指出,Alexa+ 目前服務超過 10 萬使用者,僅佔已銷售的 6 億臺 Alexa 裝置的一小部分,但此數字近期已顯著增長。 Alexa+ 代表 Amazon 試圖為消費者打造可最終商業化的生成式 AI 體驗。儘管 Amazon 透過 Echo 裝置建立了語音助手市場,卻未能將其轉化為營收業務,且 Alexa 近年因 ChatGPT 等生成式 AI 服務興起而顯得落後。Alexa+ 旨在帶來新能力,允許使用者使用更自然的語言與助手互動,例如說「這裡太冷了」即可調整溫控器。使用者還可更容易地建立常規、搜尋 Ring 攝影機畫面、中斷對話等。體驗更具個人化,會儲存使用者偏好,從最愛歌曲到食譜等。 透過生成式 AI 元件,Alexa 能總結長郵件、創作睡前故事、從學習指南生成測驗、規劃旅行行程、總結智慧家居活動並回答問題。助手還能協助執行行動,如購買演唱會門票、預訂晚餐、通知商品促銷等。初期合作夥伴包括 OpenTable、Ticketmaster、Uber Eats、Tripadvisor、Grubhub、Yelp、Priceline、Viator、Thumbtack、Atom、Fodor's 等。在早期存取階段,Alexa+ 僅於美國市場的 Echo Show 8、10、15 或 21 裝置上可用,未來將擴充套件至更多 Echo 客戶、Fire TV 使用者及 Fire 平板使用者。已有使用者回報混合結果,部分人讚揚其比 Siri 更先進,也有人認為邊緣功能仍顯