生成式 AI 正在重塑各行業,但其中最重要卻最隱形的挑戰之一是檢索,即從雜亂無章的知識庫中快速獲取正確資料並提供相關背景。大型語言模型(LLMs)的準確性取決於其能檢索到的資訊,這正是位於舊金山的初創公司 ZeroEntropy 致力解決的問題。該公司由執行長 Ghita Houir Alami 和技術長 Nicholas Pipitone 共同創立,已籌得 420 萬美元種子輪資金,旨在協助模型快速、準確且大規模地檢索相關資料。此輪融資由 Initialized Capital 主導,Y Combinator、Transpose Platform、22 Ventures、a16z Scout 等機構參與,還有來自 OpenAI、Hugging Face 和 Front 等機構的天使投資人。
ZeroEntropy 加入了一波利用檢索增強生成(RAG)技術來驅動下一代 AI 代理基礎設施的浪潮,其競爭對手包括 MongoDB 的 VoyageAI 以及 Sid.ai 等早期 YC 創始公司。 Initialized Capital 的 Zoe Perret 表示,Ghita 和 Nicolas 的模型表現優於目前所見的所有團隊,並認為檢索是 AI 下一個前沿的關鍵突破。RAG 架構目前被廣泛應用於 AI 代理,例如聊天機器人展示人力資源政策或法律助手引用案例法,但 ZeroEntropy 的創始人認為許多 AI 應用中的這一層面非常脆弱,通常由向量資料庫、關鍵字搜尋和重排序模型的拼湊組成。ZeroEntropy 提供一套 API,管理資料匯入、索引、重排序和評估。
與企業員工搜尋產品 Glean 不同,ZeroEntropy 純粹是開發者工具,能快速抓取資料,即使面對雜亂的內部檔案。執行長 Houir Alami 將其比作「搜尋界的 Supabase」,意指像 Supabase 這樣的開源資料庫自動化管理資料庫管理。目前大多數團隊要麼拼湊市場現有工具,要麼將整個知識庫丟入 LLM 的上下文視窗,前者耗時,後者易導致累積錯誤。ZeroEntropy 旨在構建以開發者為首的搜尋基礎設施,讓部署準確快速的檢索系統變得簡單高效。其核心是專有重排序模型 ze-rank-1,據稱在公共和私人檢索基準測試中優於 Cohere 和 Salesforce 的類似模型,確保 AI