來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
Uber限制員工AI開支預算 四個月用完
Uber 因 AI 使用成本過高,近期實施內部使用上限以控制支出。彭博社報導,Uber 設立新規則,每位員工每月每套代理程式設計工具(包括 Anthropic 的 Claude Code 或 Cursor)的使用上限為 1500 美元。該限制透過內部儀錶板追蹤,員工可隨時檢視,但在特定情況下經許可可超額使用。此舉並非完全意外,因為 Uber 技術長曾在四月透露,該公司僅在四個月內就用盡了全年 AI 預算。此前有報導指出,Uber 曾鼓勵員工盡可能使用 AI,甚至將內部使用情況列入競爭榜單。Uber 首席營運官安德魯·麥當諾近期也在播客中表示,很難將 AI 使用與新消費功能之間的產出效果劃清界線。Uber 的削減措施凸顯了科技產業面臨的廣泛問題:企業投入大量資金於 AI 後,投資回報率究竟何在?目前 AI 投資回報率仍主要停留在理論階段,雖許多公司期待其早日實現,但部分企業已顯焦躁。
-
微軟新工具讓開發者能透過文字描述快速建立AI行為測試
微軟於週二推出名為 ASSERT 的開源框架,全稱為 Adaptive Spec-driven Scoring for Evaluation and Regression Testing,旨在簡化針對特定產品或服務進行 AI 系統行為測試的過程。該框架利用 AI 技術,將高層次的自然語言描述轉化為詳細的評分測試,這些測試可針對目標系統執行並記錄結果。ASSERT 能將對 AI 模型預期行為和政策的平語言描述,轉化為結構化的可接受與不可接受行為集,並生成問題情境與測試案例。它還能記錄 AI 系統的路徑,包括中間動作與工具呼叫,協助開發者檢查失敗發生地點。開發者可提供系統背景、工具及限制條件以進一步自訂評估範圍。例如,開發者可指定檔案研究 AI 代理不應向公司外人員傳送郵件,並限制機密資訊僅供 C 級高管檢視,同時根據先前背景提供簡潔摘要。ASSERT 將使用這些規則生成持續檢查系統是否遵循規則的測試案例。微軟負責 AI 的首席產品官莎拉·柏德指出,評估對於做出正確決策至關重要,若不瞭解 AI 系統行為,則難以判斷其是否符合組織標準。她強調,若要建立可信賴的系統,應評估更多與應用相關的維度。ASSERT 可用於系統開發、部署後及持續監控階段。此發布正值 AI 產業逐漸轉向更廣泛的測試與回歸檢查,隨著模型能力增強,研究人員專注於可重複測試,斯坦福的 HELM、MLCommons 的 AILuminate 及 METR 等評估團體正推出基準測試,以測量模型在不同條件下的行為。
-
馬丁·斯科西斯成為最新且最出人意料的華納兄弟AI聲援者
好萊塢傳奇導演馬丁·史柯西斯已簽約成為 AI 影像生成起點 Black Forest Labs 的合夥人與顧問,據紐約時報於週二報導。史柯西斯強調,他將僅將此技術用於故事板創作,並表示過去七十多年來一直自行製作故事板。他認為該工具能幫助他與攝影師及製片設計師更快速、高效地溝通創作構想。Black Forest Labs 是一家擁有七十名員工的公司,總部設在德國弗賴堡,而非舊金山,該地為實際黑森林最近的major城市。儘管地址獨特,該起點已為 Adobe、Canva、Microsoft 及 Meta 等公司提供影像功能,並曾被投資者以 32.5 億美元估值,其投資方包括由史柯西斯的才華經理 Rick Yorn 共同創立的 BroadLight Capital。該公司由 Stable Diffusion 團隊創立,據 Wired 報導,近期拒絕與埃隆·馬斯克旗下的 xAI 合作,此前因 Grok 影像生成器內容防護問題導致合作結束。儘管此發展僅限於特定範圍,但娛樂產業部分人士仍可能感到擔憂。這標誌著好萊塢曾經對 AI 的強烈抵制正在軟化。
-
微軟推出Scout,一款受OpenClaw啟發的個人助理
2026 年初,OpenClaw 在 AI 界引發了巨大轟動,讓許多技術人員體驗到不受拘束的 AI 代理帶來的喜悅與混亂。雖然 OpenAI 收購了其創辦人後,該專案的動能有所減緩,但其影響力尤為顯著,特別是在微軟。現在微軟推出了名為 Scout 的新 AI 助理,旨在將 OpenClaw 的強大功能與靈活性帶入 Microsoft 365 生態系統。Scout 建立在 OpenClaw 框架之上,是一個全天候運作的代理助理,擁有持續的身份與風格,可與使用者協同工作。使用者可為自己的 Scout 例項命名,例如演示中的 Sebastian,並持續提供自動化任務的反饋。Scout 副總裁 Omar Shahine 表示,目標是建立一個能主動適應使用者需求的助理,將使用者的工作習慣編碼為記憶與技能,使代理更懂使用者並獲得更多自主權。 Scout 透過微軟的 Frontier 計劃提供,需擁有 GitHub Copilot 訂閱才能使用。該系統基於雲端運作,同時支援桌面與網頁瀏覽器,方便連線郵件箱、日曆等系統。除了預裝的日曆管理與會議議程撰寫等技能外,Shahine 預期真正的價值在於使用者自行開發的技能。這種使用者行為反饋讓助理越用越強的機制,與消費級 AI 工具黏著度高的動態相同。此外,Scout 具備廣泛的安全防護,針對 OpenClaw 早期出現的代理失控問題進行改進,內建「合規系統」持續檢查操作是否符合規範,並產生獨立的審計日誌。Scout 是微軟在年度 Build 開發者大會上推出的一系列 AI 產品之一,其他產品包括硬體導向的 Project Solara、Copilot 更新以及新的推理 AI 模型。