分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
OpenAI 推出新代理購物系統與 Google、Amazon 競爭
美國 ChatGPT 使用者現在可在對話中直接購買 Etsy 商品,並即將支援 Shopify 購物,這標誌著線上購物未來的重大進展。OpenAI 推出的「即時結帳」功能目前開放給使用 Pro、Plus 及免費版登入的使用者,針對美國 Etsy 賣家,預計超過一百萬 Shopify 商家(包括 Glossier、Skims、Spanx 和 Vuori)將陸續加入。此功能讓使用者無需離開對話即可點選「購買」確認訂單、運費及支付細節,支援 Apple Pay、Google Pay、Stripe 或信用卡。去年 Perplexity 已推出類似功能,Microsoft 則透過 Copilot 商家計劃提供類似服務。這種無摩擦體驗可能推動購物模式從 Google 搜尋引擎和 Amazon 轉向具備策展推薦與簡易結帳的對話式代理。若更多交易在 AI 聊天機器人內完成,其背後的企業將掌握更多產品曝光與佣金定價權。Google 與 Amazon 長期作為零售發現的守門人,若 OpenAI 成為新門戶,可能面臨競爭壓力。OpenAI 表示其展示結果為「有機且未贊助」,僅依相關性排序,並向商家收取「小額費用」。此外,OpenAI 將開放原始碼其驅動即時結帳的代理商務協議(ACP),該技術由 Stripe 支援,旨在讓其他商家與開發者整合代理結帳。Stripe 執行長 Will Gaybrick 指出,Stripe 正構建 AI 的經濟基礎設施,重新架構現有商業系統。儘管使用者可能擔憂隱私,OpenAI 強調訂單、支付與配送由商家透過現有系統處理,ChatGPT 僅作為安全傳遞資訊的中介。開放 ACP 將擴大 AI 聊天機器人作為虛擬商店的採用率,並可能使 OpenAI 成為 AI 商業生態系統事實上的架構師,這將與 Google 近期推出的由 AI 代理啟動的購買協議(AP2)產生張力。
-
Google如何透過開發工具管理員推動AI程式設計
Google 資深產品管理主管 Ryan J. Salva 分享了他對 AI 工具如何改變程式開發的觀察。他前身為 GitHub 與 Microsoft 員工,現負責 Gemini CLI 與 Gemini Code Assist 等工具,推動開發者進入代理程式開發的新世界。Google 於週二發布新研究,探討開發者實際使用 AI 工具的情況及剩餘進步空間。研究發現開發者開始使用 AI 工具的介數時間為 2024 年 4 月,這與 Claude 3 和 Gemini 2.5 的推出時間吻合,標誌著推理模型與工具呼叫能力的成熟。工具呼叫讓模型能自行修正,例如搜尋、編譯、執行單元測試或整合測試。 Salva 個人使用 Gemini CLI、Claude Code 及 Codex 等命令列工具,並混合使用 Zed、VS Code、Cursor 與 Windsurf 等 IDE。在專業工作中,他利用 AI 撰寫需求檔案,通常將 GitHub 問題轉化為約 100 行的技術規格檔案,再讓 AI 根據團隊規範撰寫程式碼。過程中,AI 會更新需求檔案並產生各自的提交與拉取請求,讓他能隨時回退。他估計 70% 至 80% 的工作是在終端機使用自然語言與 Gemini CLI 互動,由 AI 撰寫大部分程式碼,他則負責審查。 關於未來,Salva 認為 IDE 仍將存在,但開發者將花費更多時間處理需求,而在 IDE 中的時間會逐漸減少。十年後若不再直接檢視程式碼,開發者的角色將更像架構師,專注於將複雜問題拆解為可解決的小任務,並從整體視角思考產出成果,而非關注表達機器碼的中介語言。
-
矽谷押注「環境」訓練AI代理
多年來,科技巨頭執行長宣揚 AI 代理能自主使用軟體完成任務,但消費者現有的 AI 代理如 OpenAI 的 ChatGPT Agent 或 Perplexity 的 Comet 顯示技術仍有限。業界認為,要提升 AI 代理的堅固性,需採用新的技術,其中之一是模擬工作空間以訓練多步驟任務,稱為強化學習(RL)環境。類似標註資料集推動了上一波 AI 發展,RL 環境正成為開發關鍵元素。Andreessen Horowitz 合夥人 Jennifer Li 表示,各大 AI 實驗室都在自建 RL 環境,但也尋求第三方供應商。此趨勢催生了 Mechanize 和 Prime Intellect 等新創公司,以及 Mercor 和 Surge 等資料標註公司的投資增加。據 The Information 報導,Anthropic 領導層討論過未來一年花費超過 10 億美元於 RL 環境。投資者希望有公司能成為類似 Scale AI 的「環境標註巨頭」。 RL 環境是模擬 AI 代理在真實軟體應用中行為的訓練場。例如,模擬 Chrome 瀏覽器並讓代理在 Amazon 購買襪子,成功則給予獎勵。由於代理可能迷失或購買過多,環境必須足夠堅固以捕捉意外行為。OpenAI 早在 2016 年便建立「RL 健身房」,與 AlphaGo 使用類似技術。今日不同之處在於訓練具備大型變換器模型的通用電腦使用 AI 代理。資料標註公司如 Scale AI、Surge 和 Mercor 正積極應對需求,其中 Surge 去年營收達 12 億美元,Mercor 估值 100 億美元。Scale AI 曾因 Meta 投資 140 億美元並挖角執行長而失去部分市場,但仍努力適應。新創公司如 Mechanize 提供 50 萬美元年薪招募工程師建立環境,並與 Anthropic 合作;Prime Intellect 則針對小型開發者提供資源。 關於 RL 環境是否能像過去 AI 訓練方法般擴充套件,仍存在疑問。強化學習已推動 OpenAI 的 o1 和 Anthropic 的 Claude Opus 4 等模型突破,但方法現顯示遞減回報。OpenAI 研究人員曾投資推理模型,認為其能良好擴充套件。雖然擴充套件方式尚不明確,環境似乎具潛力,因其讓代理在具備工具和電腦的模擬
-
Notion 發布資料分析與任務自動化的代理模型
Notion 於週四在「Make with Notion」活動中正式推出其首款 AI 代理(Agent)。該代理能利用使用者所有 Notion 頁面和資料庫作為上下文,自動生成會議筆記、競爭對手評估報告及反饋落地頁。此平臺表示,代理可建立或更新頁面與資料庫,新增資料、屬性或檢視。使用者亦可從外部連結平臺觸發 Notion 代理,例如要求代理從 Slack、電子郵件及 Google Drive 等多個來源建立追蹤錯誤的儀錶板。 新推出的代理建立在現有 Notion AI 功能之上,後者僅能搜尋或總結內容,而新代理則能處理更複雜的多步驟任務,運用代理式 AI 的能力。公司指出,目前版本的代理可在數百頁面上執行長達 20 分鐘的任務。使用者可為代理設定「個人資料」頁面,指導其引用來源、輸出風格及任務更新位置。此外,使用者可要求代理「記住」關鍵要點,這些記憶將儲存於個人資料頁面供編輯。 在演示影片中,公司展示了代理提供落地頁反饋、更新內容、建立餐廳追蹤器、從會議筆記生成分析以及準備競爭分析報告等範例。目前這些動作仍需手動觸發,但 Notion 表示,未來將支援建立可設定時間表或觸發器的自訂代理,並推出代理模板庫,讓使用者可選擇預設提示以適應特定任務。過去兩年間,Notion 已推出日曆應用程式、Gmail 客戶端、會議筆記助手及企業搜尋功能,這些功能為建立自動化提供了必要的上下文基礎。其他企業知識與生產力平臺,包括 Salesforce、Fireflies、Fathom 及 Read AI,也各自推出了代理以提取和更新資訊。