Google DeepMind 透過新授權協議,收購了語音 AI 創業公司 Hume AI 的執行長 Alan Cowen 及約七名頂尖工程師,這些人才將協助最佳化 Gemini 的語音功能。Hume AI 剩餘團隊將繼續向其他 AI 企業供應技術,該交易未披露財務細節,但新上任的執行長 Andrew Ettinger 表示,Google 擁有部分技術的非獨家權利,Hume AI 預計今年能帶來一億美元營收。此「收購兼併」案例顯示,大型 AI 企業正透過收購團隊而非整家公司來規避監管,類似情況也發生在 Google 收購 Windsurf 團隊以及 OpenAI 收購 Convogo 和 Roi 團隊的事件中。美國聯邦貿易委員會已表示將更仔細檢視此類交易。
語音技術正成為 AI 的新前沿,Hume AI 的核心優勢在於其模型能根據使用者語音理解情緒與心境,該公司於 2024 年推出具備情感智慧的共情語音介面,並已籌資近八千萬美元。儘管如此,Google 持續改進 Gemini Live 功能,並發布了新的原生音訊模型以提升複雜工作流處理能力。OpenAI 正準備重構音訊模型以配合其與 Jonny Ive 合作開發的今年將推出的首發式個人裝置,傳聞該裝置可能為耳機形式。Meta 也透過收購 Play AI 加速其音訊 AI 佈局,其 Ray-Ban 智慧眼鏡日益依賴語音與音訊功能。投資者 Vanessa Larco 指出,語音是穿戴式裝置唯一可接受的輸入模式。此外,語音生成創業公司 ElevenLabs 今年營收已突破三億三千萬美元,顯示市場對語音能力的需求持續增長。