分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
Luma 發布全新「統一智能」模型驅動的創意 AI 代理
美國 AI 影片生成新創公司 Luma 於週四推出了 Luma Agents,旨在處理跨文字、影象、影片與音訊的端到端創意工作。該平臺由 Luma 的統一智慧(Unified Intelligence)模型家族驅動,其核心架構基於 Uni-1 模型,該模型是此係列中首款整合了音訊、影片、影象、語言及空間推理能力的 AI 模型。Luma 執行長兼共同創辦人 Amit Jain 表示,Uni-1 模型能夠「以語言思考、想像並渲染畫素或影象」,他將此稱為「畫素中的智慧」。 Luma Agents 被定位為廣告公司、行銷團隊、設計工作室及企業的新工作模式。該系統具備規劃與生成多媒體內容的能力,並能與包括 Luma 的 Ray 3.14、Google 的 Veo 3、Nano Banana Pro、ByteDance 的 Seedream 以及 ElevenLabs 的語音模型在內的其他 AI 模型協同運作。與傳統需要反覆提示(prompt)不同,Luma Agents 能自動生成大量變體,使用者僅需透過對話引導方向。Jain 指出,這種能力讓系統能維持跨資產、合作者及創意迭代的持續情境,並透過自我批評的迭代迴圈來評估與最佳化輸出結果。 目前,Luma 已將新平臺滾動式推出給現有客戶,包括全球廣告公司 Publicis Groupe 和 Serviceplan,以及品牌 Adidas、Mazda 和沙特 AI 公司 Humain。Jain 舉例說明,系統曾將一個 200 字的簡報與一支口紅產品的圖片,轉化為廣告活動的各種地點、模特兒與配色方案概念。另一項示範中,Luma Agents 在 40 小時內將某品牌的 1500 萬美元年度廣告活動轉化為多個國家的本地化廣告,且費用低於 20,000 美元,並透過了品牌內部品質與準確性檢查。雖然 Luma Agents 目前透過 API 公開可用,但 Luma 計劃逐步開放訪問許可權,以確保使用者獲得可靠的服務並避免工作流程中斷。
-
Cursor 即將推出一種新型的代理編程工具
隨著代理程式碼化(agentic coding)的普及,軟體工程師的工作生活變得極度複雜,單一工程師可能同時監督數十個編碼代理,人類工程師的注意力迅速成為限制資源。Cursor 於三月五日推出名為 Automations 的新工具,旨在應對這種混亂。該系統允許使用者根據程式碼庫新增、Slack 訊息或簡單計時器自動啟動代理,讓工程師無需同時追蹤大量代理,即可審查和維護由代理工具產生的新程式碼。這打破了大多數代理工程依賴「提示與監控」的動態,讓工程師從主動啟動改為在適當時機被呼叫介入。Cursor 工程主管 Jonas Nelle 表示,人類並非完全缺席,而是不再總是發起者,而是在必要時被調動。 早期範例 Bugbot 是 Cursor 的長期功能,每次工程師修改程式碼時都會觸發以檢查錯誤。透過 Automations,Cursor 已將此係統擴充套件至更複雜的安全審查和更嚴謹的審查流程。工程負責人 Josh Ma 指出,投入更多計算資源尋找難解問題非常有價值。Cursor 估計每小時執行數百個自動化流程,範圍遠超簡單程式碼審查,還用於事故回應,例如透過 PagerDuty 事故觸發代理查詢伺服器日誌,並提供每週程式碼變更摘要。Cursor 認為自動化改變了模型在程式碼庫中有用的任務型別。 Cursor 面臨激烈競爭,OpenAI 和 Anthropic 近期也更新了代理編碼工具。資料顯示 Cursor 市場份額自五月以來穩固,約有 25% 的生成式 AI 客戶使用 Cursor。儘管如此,代理編碼領域的整體增長使 Cursor 營收保持驚人速度。彭博社報導,Cursor 年營收已超過 20 億美元,過去三個季度翻倍。
-
Perplexity 新推出的電腦再次押注用戶需要多種 AI 模型
Perplexity 自本週起為其訂閱使用者推出全新代理工具 Perplexity Computer,該工具將公司現有的所有 AI 能力整合為單一系統。這是一款電腦使用者代理,能夠獨立執行複雜工作流,並利用 19 種不同的 AI 模型運作,甚至能建立子代理來處理特定問題。目前該工具僅開放於公司最高訂閱等級,即每月 200 美元的 Perplexity Max 層級。由於該工具完全在雲端執行,可能避免了一些其他代理工具(如 OpenClaw)面臨的安全擔憂。儘管 TechCrunch 尚未進行實機演示,但根據 Perplexity 網站上的示例工作流,該工具可處理涉及統計資料、財務或法律資料的任務,進行分析,並將結果以完成網站或視覺化形式分享。 Perplexity 邀請媒體參加背景簡報會討論產品及年度規劃,但由於產品在活動前幾小時發現缺陷,公司取消了原定演示。這標誌著 Perplexity 的演進,該公司早期在 AI boom 中透過將前沿模型包裝在熟悉使用者介面中(特別是類似搜尋引擎的答覆服務)而聲名鵲起,隨後於去年夏天推出了 Comet 網頁瀏覽器。競爭對手如 Google 已改變產品方向以更像 Perplexity 所建,這既是威脅也是讚美。Perplexity 因去年晚些時候放棄廣告業務而改變生態系統策略,理由是該業務損害了使用者對答覆準確性的信任。儘管其使用者規模(數千萬)遠低於擁有 8 億周活躍使用者並今年開始在 ChatGPT 測試廣告的 OpenAI,但 Perplexity 高管表示正致力於服務更精簡的使用者群體,專注於影響 GDP 的決策,並優先企業訂閱,特別是深度研究領域。 Perplexity 最近發布了名為 Draco 的複雜研究任務基準測試,其自身深度研究服務表現優於 Gemini 等競爭對手。公司聲稱已不再依賴其他公司的 API 用於網頁索引,並擁有自己的 AI 最佳化搜尋 API。然而,公司仍著力於將前沿模型包裝在消費者友好的使用者體驗中,主張編排多個第三方大型語言模型(LLM)以獲得最具成本效益和準確的答覆。高管認為多模型是未來,模型正在專業化而非商品化。資料顯示,使用者經常在不同模型間切換,2
-
Trace 筹得 300 萬美元解決企業採用 AI 代理的問題
Trace 是一家由 Y Combinator 2025 夏季孵化計劃推出的工作流編排新創公司,旨在解決企業級 AI 代理因缺乏背景資訊而難以發揮效能的問題。該公司總部設於倫敦,於週四宣佈從 Y Combinator、Zeno Ventures、Transpose Platform Management、Goodwater Capital、Formosa Capital 以及 WeFunder 等機構籌得 300 萬美元種子資金,天使投資人包括 Benjamin Bryant 和 Kevin Moore。Trace 的核心技術是建立知識圖譜,將企業現有的工具(如電子郵件、Slack 和 Airtable)整合成結構化的背景資訊,使 AI 代理能獲得執行任務所需的完整上下文。使用者只需輸入高層級指令,例如設計新微網站或制定 2027 年銷售計劃,系統便能自動規劃步驟並分配任務給 AI 代理或人類員工。Trace 執行長 Tim Cherkasov 表示,OpenAI 和 Anthropic 正在打造優秀的 AI 助手,而 Trace 則致力於構建能妥善部署這些助手的管理架構。技術長 Artur Romanov 指出,2024 至 2025 年重點在於提示工程,現在已轉向背景工程,認為提供最佳背景資訊的企業將成為 AI 優先公司的基礎設施。儘管面臨 Anthropic 推出企業代理外掛以及 Atlassian Jira 等服務自帶代理的競爭壓力,Trace 仍堅持其知識圖譜方法論是成功關鍵。