分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
高盛測試病毒式AI代理Devin作為新員工
美國金融科技銀行高盛(Goldman Sachs)已成為人工智慧編碼代理 Devin 的重要客戶。高盛資訊長馬可·阿爾根蒂(Marco Argenti)在接受 CNBC 採訪時表示,銀行將開始用 Devin 來增強其人力資源,將其視為新員工,並計劃推出數百個例項,未來可能擴充套件至數千個。高盛目前擁有約 12,000 名人類開發人員。儘管金融業常被認為反應遲緩,但高盛一直處於行業前沿,自 2024 年起內部已使用開發者助手。Devin 由 Cognition 公司推出,去年在社交媒體上引發關注,但部分研究人員發現其在處理複雜編碼任務時存在困難。截至五月,Devin 已更新至 2.1 版本,Cognition 表示該版本在提供充足上下文的大型程式碼庫中表現最佳。阿爾根蒂強調,Devin 不會取代人類員工,而是採用混合工作模式,由人類監督並希望提升生產力。
-
OpenAI 據報將在近期推出 AI 瀏覽器
根據路透社的報導,OpenAI 正計劃推出自有的人工智慧網頁瀏覽器,以挑戰 Google Chrome 的市場地位。這項訊息緊隨 Perplexity 推出 Comet 瀏覽器之後出現。OpenAI 據稱將在幾週內發布該瀏覽器,其設計理念與 Perplexity 的 Comet 及 The Browser Company 的 Dia 類似,旨在利用人工智慧重新定義網頁瀏覽方式。據傳,該瀏覽器將部分使用者互動保留在 ChatGPT 內部,而非連結至外部網站。報導指出,OpenAI 的瀏覽器可能會整合其網頁瀏覽 AI 代理 Operator 作為關鍵功能。The Information 透露,OpenAI 早在 2024 年就曾考慮開發瀏覽器以與 Google Chrome 競爭。與 Perplexity 一樣,OpenAI 可能希望透過此舉獲得對使用者資料的直接存取權,並能創造不受 Google 中介限制的創新使用者體驗。
-
SaaS 已成為過往,Narada AI 董事長表示未來屬於代理人。
Narada AI 共同創辦人兼執行長 Dave Park 在 TechCrunch 的旗艦播客節目 Equity 中表示,SaaS 模式即將消失,企業軟體的未來將由代理式 AI(agentic AI)主導。Park 指出,目前知識工作者每天需處理十七到二十五個不同的 SaaS 工具與門戶,僅手動查詢或更新系統就浪費兩個半小時。Narada AI 基於加州大學柏克萊分校的研究,開發了大型行動模型,這是一種基於大語言模型的變體,能夠在缺乏 API 的情況下,透過推理完成跨不同工作工具的多步驟任務。該公司於 2024 年 TechCrunch Disrupt 首次亮相,Park 與 Rebecca Bellan 討論了代理式 AI 的興起、其與傳統自動化的差異,以及企業大規模部署所需的改變。目前情況恰逢其時,因為 Y Combinator 最新一輪投資中已有超過七十家代理式起點公司,Grammarly 等主流玩家也透過合作與併購構建完整的 AI 工作堆疊。此播客節目探討了大眾對自動化的誤解、Narada 等工具如何協助自由職業者與小型團隊,以及軟體未來可能不再依賴使用應用程式的趨勢。Equity 由 Theresa Loconsolo 製作,每週三與週五更新,訂閱者可透過 Apple Podcasts、Overcast、Spotify 等平臺收聽,並關注其 X 與 Threads 帳號。
-
Cursor 發佈網頁應用程式管理 AI 程式碼代理
Cursor 公司後臺 Anysphere 於本週一推出了一款網頁應用程式,允許使用者直接在瀏覽器中管理一組編碼代理(coding agents)。這標誌著 Cursor 在整合開發環境(IDE)之外的重要進展。雖然 Anysphere 最初僅提供 AI 驅動的 IDE,但公司正致力於將產品應用於更多場景,開發更多代理驅動的使用者體驗。今年五月,Cursor 推出了背景代理,這些 AI 系統能自主解決編碼任務而無需使用者監督。六月,公司推出了 Slack 整合功能,使用者可透過標記@Cursor 將任務指派給背景代理,類似於 Cognitions 的 AI 編碼代理 Devin 的運作方式。現在,透過網頁應用程式,使用者可以在桌面或移動裝置上傳送自然語言請求,將任務指派給背景代理,例如撰寫功能或修復程式碼中的錯誤。該應用還允許使用者監控代理的工作進度、檢視進展並將完成的變更合併到程式碼庫中。 Cursor 產品工程主管 Andrew Milich 表示,Slack 整合與網頁應用程式旨在減少依賴 Cursor 的使用者所面臨的摩擦。Anysphere 上月宣佈 Cursor 的年複合營收已超過 5 億美元,主要來自月費訂閱。目前 Cursor 被超過一半的《財富》500 強公司採用,包括 Nvidia、Uber 和 Adobe 等企業。為了利用這一增長,Anysphere 最近推出了每月 200 美元的 Pro 等級。Cursor 的背景代理設計允許使用者透過 Slack 或網頁應用程式啟動任務,讓代理進行初步處理。若代理無法完成任務,使用者可無縫切換至 IDE 繼續工作。每個代理都有獨立的可分享連結,方便團隊成員檢視進度與程式碼變更。 所有擁有背景代理訪問許可權的客戶均可使用 Cursor 網頁應用程式,這包括訂閱每月 20 美元 Pro 計劃的使用者以及更高階別的計劃,但不包括免費版使用者。Cursor 並非首家推出 AI 編碼代理的公司,但公司表示已謹慎行事,避免推出僅在理論上看起來良好卻無法實際運作的產品。團隊認為 AI 推理模型的進步已使編碼代理變得可行。在近期接受 Stratechery 的 Ben Thompson 採訪時,Anysphere 執行長 Michael Truell 表示,他預計到 2026 年,AI 編碼代理將處理軟體工程師至少 20%