來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
推理新創 Inferact 获得 1.5 億美元資金用於商業化 vLLM
開源專案 vLLM 的創作者已宣佈將其轉型為由風險投資支援的創業公司 Inferact,並成功籌得 1.5 億美元種子資金,估值達到 8 億美元。該輪融資由 Andreessen Horowitz 和 Lightspeed Venture Partners 共同領投,確認了 TechCrunch 此前的報導,指出 vLLM 已獲得 a16z 的投資。Inferact 的首次融資案例與近期 SGLang 專案轉化為 RadixArk 的情況相似,據悉 RadixArk 由 Accel 領投,估值為 4 億美元。隨著人工智慧關注點從模型訓練轉向在應用中部署,即推論階段,能夠讓這些 AI 工具執行得更快且更經濟的技術,如 vLLM 和 SGLang,正吸引投資者關注。vLLM 和 SGLang 均於 2023 年在 Databricks 共同創辦人 Ion Stoica 的加州大學伯克利分校實驗室孵化。Inferact 執行長 Simon Mo,也是該專案的原始創作者之一,曾向 Bloomberg 表示,vLLM 的現有使用者包括 Amazon 的雲端服務以及購物應用程式。
-
AI 代理是否已準備好進入職場?新基准測試引發質疑
微軟執行長納德拉曾預測兩年前,人工智慧將取代知識型工作,但儘管基礎模型進展迅速,白領領域的變革仍顯緩慢。近期,資料訓練巨頭 Mercor 發布新研究,針對諮詢、投資銀行及法律領域的實際任務建立新基準 APEX-Agents。測試結果顯示,所有 AI 實驗室均不及格,即便是最佳模型在面對真實專業人士提問時,正確率僅達四分之一。Mercor 執行長佛迪指出,模型最大的障礙在於跨領域資訊追蹤,這正是人類知識工作者日常運作的核心。測試環境模擬了 Slack 與 Google Drive 等多工具協作的真實情境,許多代理型 AI 在此類多領域推理上表現不穩。 測試題目源自 Mercor 專家市場,涵蓋複雜的法律合規評估,例如歐盟生產停擺期間資料外洩是否符合特定隱私條款,這類問題連部分人類專家亦可能感到困難。OpenAI 的 GDPval 基準測試廣泛知識,而 APEX-Agents 則聚焦高價值專業領域的持續任務執行,更能反映自動化潛力。在參與測試的模型中,Gemini 3 Flash 表現最佳,一問一答準確率為 24%,緊隨其後的是 GPT-5.2 達 23%,其餘如 Opus 4.5、Gemini 3 Pro 及 GPT-5 均約為 18%。佛迪認為,目前 AI 表現猶如僅能答對四分之一的實習生,但隨著基準公開,業界預期未來數月內將看到顯著進步,從去年的五至十 percent 提升至更高水準。
-
Google DeepMind 董事長表示對 OpenAI 廣告推進 ChatGPT 表示驚訝
Google DeepMind 執行長 Demis Hassabis 表示,對 OpenAI 已率先在 AI 聊天機器人中引入廣告感到「驚訝」。他在於達沃斯論壇接受 Axios 採訪時回應了關於利用廣告獲利的事宜,稱 Google 團隊正「非常謹慎」地思考此議題。儘管廣告對 Google 核心業務至關重要,Hassabis 強調 DeepMind 團隊並未感受到來自科技巨頭的壓力,必須做出「衝動」的決定。此言論緊隨 OpenAI 於本週五宣佈,將開始測試廣告,以從每週 8 億活躍使用者中未訂閱付費服務的使用者群體中產生額外收入。 Hassabis 指出,雖然廣告曾資助了大部分消費者網際網路,且若執行良好可具價值,但在助手領域,特別是當聊天機器人旨在成為更強大、能為個人提供幫助的數位助手時,廣告的融入引發了信任問題。他認為這與 Google 搜尋的使用情境不同,搜尋已能理解使用者意圖並展示相關廣告,而聊天機器人則應更貼近個人生活,因此需經過深思熟慮。此外,他提及 Google 目前並無在 AI 聊天機器人中投放廣告的計畫,將先觀察使用者反應。 近期 OpenAI 曾因在聊天中建議應用程式而引發消費者反彈,儘管其聲稱無財務成分,但使用者仍因體驗受損而憤怒。Hassabis 認同此點,認為將廣告置於與 AI 助手對話的情境中會令人不適,正如消費者拒絕 Amazon 在 Alexa 中植入廣告一樣,他們想要的是助手而非購物顧問。Hassabis 重申,DeepMind 團隊秉持科學、嚴謹且深思熟慮的傳統,不會因外部壓力而草率行事,未來可能會找到正確投放廣告的方式。
-
Google 現提供由 Gemini 帶動的免費 SAT 考試練習題
Google 宣佈將其 AI 教育重點轉向標準化考試,並推出由 Gemini 驅動的免費 SAT 練習考試。學生只需輸入「我想參加 SAT 練習考試」,即可獲得由 Gemini 提供的免費模擬試題。系統會分析結果,指出強項與需加強的弱項,並提供錯誤答案的詳細解析。Google 表示已與 Princeton Review 等教育機構合作,確保題目內容經過審核,且與真實 SAT 考試高度相似。此舉被視為無法負擔個人化 SAT 輔導的學生的一大突破,有助於讓更多學生在同等基礎上競爭。然而,這也引發了關於 AI 在教育中角色的廣泛討論。許多教師擔憂學生過度依賴 Gemini 或 ChatGPT 等工具,可能削弱其獨立解決問題與批判性思維能力,相關研究亦支援此觀點。此外,免費的 AI 導向考試準備也對傳統私人 SAT 輔導行業構成威脅,可能影響輔導員的工作穩定性。此訊息緊接 Google 近期推出的 Gemini 功能,該功能允許教師建立播客式音訊課程,有助於吸引 Z 世代學生。其他 Gemini 工具還包括協助教師腦筋風暴、制定課程計劃及量身打造學習材料等功能。