文章
所有發布的 AI 新聞與論文。
-
Google 的 AI 模式現在可存取 Gmail 與照片 提供個性化回應
Google 宣佈將其對話式搜尋功能 AI Mode 升級,引入「個人智慧」功能,使 AI 能存取 Gmail 與 Google Photos 以提供更量身打造的回應。該功能上週先在 Gemini 應用程式中推出,目前正逐步向美國地區的 Google AI Pro 與 AI Ultra 訂閱者開放。透過整合使用者在 Gmail、照片、搜尋及 YouTube 歷史等生態系統資料,Google 能比競爭對手更精準地提供個人化體驗,同時允許使用者隨時開啟或關閉此功能。 以規劃假期為例,AI Mode 可根據 Gmail 中的訂房記錄與 Photos 中的過往旅行照片,推薦適合全家人的行程,例如依據冰激凌自拍推薦老式冰激凌店。在購物方面,AI 會考量使用者購買習慣與購物地點,並結合 Gmail 中的航程確認資訊,自動推薦符合目的地天氣與個人風格的衣物。此外,使用者亦可詢問如為伴侶製作驚喜尋寶遊戲或為兒童房間提供裝飾主題等複雜問題。Google 強調,AI Mode 並非直接訓練於使用者的郵件或照片庫,而是基於特定提示與模型回應進行訓練,確保在保護隱私的同時提供貼心的服務建議。
-
Google 收購 AI 聲音創業公司 Hume AI 的團隊
Google DeepMind 透過新授權協議,收購了語音 AI 創業公司 Hume AI 的執行長 Alan Cowen 及約七名頂尖工程師,這些人才將協助最佳化 Gemini 的語音功能。Hume AI 剩餘團隊將繼續向其他 AI 企業供應技術,該交易未披露財務細節,但新上任的執行長 Andrew Ettinger 表示,Google 擁有部分技術的非獨家權利,Hume AI 預計今年能帶來一億美元營收。此「收購兼併」案例顯示,大型 AI 企業正透過收購團隊而非整家公司來規避監管,類似情況也發生在 Google 收購 Windsurf 團隊以及 OpenAI 收購 Convogo 和 Roi 團隊的事件中。美國聯邦貿易委員會已表示將更仔細檢視此類交易。 語音技術正成為 AI 的新前沿,Hume AI 的核心優勢在於其模型能根據使用者語音理解情緒與心境,該公司於 2024 年推出具備情感智慧的共情語音介面,並已籌資近八千萬美元。儘管如此,Google 持續改進 Gemini Live 功能,並發布了新的原生音訊模型以提升複雜工作流處理能力。OpenAI 正準備重構音訊模型以配合其與 Jonny Ive 合作開發的今年將推出的首發式個人裝置,傳聞該裝置可能為耳機形式。Meta 也透過收購 Play AI 加速其音訊 AI 佈局,其 Ray-Ban 智慧眼鏡日益依賴語音與音訊功能。投資者 Vanessa Larco 指出,語音是穿戴式裝置唯一可接受的輸入模式。此外,語音生成創業公司 ElevenLabs 今年營收已突破三億三千萬美元,顯示市場對語音能力的需求持續增長。
-
從隱形斗篷到AI晶片:Neurophos籌得1.1億美元打造微型光學處理器用於推論
二十年前,杜克大學教授戴維·史密斯利用人工複合材料「超材料」製作了實物隱形斗篷,這項材料科學的突破最終流傳至電磁學研究。如今,由杜克大學和史密斯執行的孵化器 Metacept 孵化的奧斯汀光子學新創公司 Neurophos,正進一步發展該研究,以解決人工智慧實驗室和超大型資料中心面臨的最大挑戰:如何在控制功耗的同時擴充套件運算能力。Neurophos 開發了一種「超表面調製器」,其光學特性使其能作為張量核心處理器執行矩陣向量乘法,這是許多人工智慧工作(特別是推論)的核心數學運算,目前由使用傳統矽基閘和電晶體的專用 GPU 和 TPU 執行。Neurophos 聲稱,將數千個調製器整合於晶片上,其「光學處理單元」比目前大規模用於人工智慧資料中心的矽基 GPU 更快,且在推論任務中效率遠高,而推論往往是一項昂貴的任務。 為了籌措晶片開發資金,Neurophos 剛在由蓋茨前線(Bill Gates 的投資機構)主導的 A 輪中籌資 1.1 億美元,參與機構包括微軟 M12、碳直接、阿美蘭科投資、博世投資、Tectonic Ventures、Space Capital 等。雖然光子晶片在理論上因光產熱少、速度快且對溫度及電磁場不敏感而表現優於傳統矽晶片,但光學元件通常體積較大且難以大規模生產,且需要轉換器將數位訊號轉換為類比訊號,這會消耗大量電力。Neurophos 聲稱其開發的超表面能一舉解決這些問題,因為其尺寸比傳統光學電晶體小約 10,000 倍。這種小型化使得晶片能同時進行更多計算,從而大幅提升效率。Neurophos 執行長兼共同創辦人帕特里克·鮑恩表示,縮小光學電晶體可在轉換回電子領域前在光學領域執行更多數學運算。 Neurophos 聲稱其光學處理單元效能遠超英偉達 B200 人工智慧 GPU。其晶片可執行於 56 GHz,峰值達每秒 2
-
Anthropic 必須持續修正其技術面試測試以因應 Claude 的進步
自 2024 年起,Anthropic 的效能最佳化團隊在招聘申請者時會提供一份居家測驗,以確保候選人具備專業知識。然而,隨著 AI 編碼工具的進步,該測驗必須不斷調整,以防候選人直接使用 Claude 填寫所有答案。團隊負責人 Tristan Hume 在週三的一篇部落格文章中描述了這一挑戰的歷史。Hume 指出,隨著每個新的 Claude 模型推出,他們都不得不重新設計測驗。當給予相同的時間限制時,Claude Opus 4 的表現優於大多數人類申請者,這雖然仍有助於篩選出最強的候選人,但隨後 Claude Opus 4.5 的表現甚至與這些候選人相當。 候選人被允許在測驗中使用 AI 工具,但這仍然構成了嚴重的評估問題。如果人類無法再超越模型的輸出,那麼測驗就只是測量不同模型的能力,而非尋找頂尖人才。Hume 表示,在居家測驗的約束下,他們已無法區分頂尖候選人的輸出與最強大模型的輸出。AI 在考試中的使用問題已在世界各地的學校和大學中造成混亂,因此 AI 實驗室面臨同樣問題頗具諷刺意味。但 Anthropic 在處理此問題方面具有獨特優勢。最終,Hume 設計了一項新測驗,其重點不再在於最佳化硬體,而是使其足夠新奇以讓當代 AI 工具無從下手。作為文章的一部分,他還分享了原始測驗,希望讀者能提出更好的解決方案。文章最後表示,若能超越 Opus 4.5,他們非常歡迎相關建議。此外,TechCrunch 更正了早期版本中關於 Anthropic 對居家測驗使用 AI 工具政策的誤述,事實上是明確允許使用 AI 工具的。