雲端基礎設施長期是為人類使用者設計的,假設他們以穩定且可預測的方式搜尋、點選、滾動和串流。然而,AI 代理的行為截然不同,它們能在數秒內啟動多個子代理,查詢數百個資料庫、搜尋檔案並呼叫 API,隨後又迅速消失。基於此前提,亞馬遜正在重新設計其核心雲端基礎設施。週四,AWS 推出了新一代 OpenSearch Serverless,這是一款完全管理的搜尋與向量資料庫,專為代理工作負載設計。AWS 表示,新系統可在代理觸發任務時即時擴充套件,並在閒置時縮減至零。
這反映了科技業的普遍認知:原本為人類驅動網際網路設計的基礎設施,在日益充滿代理的世界中運作效果不佳。儘管 AI 代理目前佔據的網際網路活動比例尚小,但機器生成的流量已相當顯著且即將增長。Cloudflare 指出,過去六個月機器人佔整體 HTTP 流量的 31%,其中 AI 爬蟲、搜尋引擎和助手佔了約四分之一的機器人請求。Cloudflare 產品經理 Lai Yi Ohlsen 表示,非人類流量預計將在 2027 年上半年超過人類流量。
在 Google 的 I/O 開發者大會上,公司表示使用者將能將任務如購買研究、預訂旅行、瀏覽網頁等委託給 AI 系統。但這種趨勢不僅限於消費端,企業也越來越多地在內部及對客戶部署代理,創造了幕後新的機器生成流量。因此,雲端供應商和基礎設施公司正在調整為人類設計的系統,以適應不斷自主獲取資訊、呼叫工具並產生機器對機器流量的代理世界。
AWS 的新 OpenSearch Serverless 正是解決方案。亞馬遜 OpenSearch Service 總經理 Tia White 表示,代理正從實驗階段進入生產階段,創造出先前基礎設施無法處理的流量模式。關鍵技術改變在於將運算與儲存解耦,允許運算在數秒內擴充套件以應對代理流量尖峰,並在閒置時縮減至零,使客戶在代理閒置時支付零費用。這意味著不再需要保留至少一個運算例項運作,因為先前運算與儲存是耦合的。
於發布時,OpenSearch Serverless 將原生整合 AI 開發平臺如 Vercel 和 Kiro,讓開發者無需管理基礎設施即可部署生產級搜尋與向量後端。此轉變正在雲端產業