來源類型: 新聞

「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。

推理新創 Inferact 获得 1.5 億美元資金用於商業化 vLLM

2026年1月22日

開源專案 vLLM 的創作者已宣佈將其轉型為由風險投資支援的創業公司 Inferact，並成功籌得 1.5 億美元種子資金，估值達到 8 億美元。該輪融資由 Andreessen Horowitz 和 Lightspeed Venture Partners 共同領投，確認了 TechCrunch 此前的報導，指出 vLLM 已獲得 a16z 的投資。Inferact 的首次融資案例與近期 SGLang 專案轉化為 RadixArk 的情況相似，據悉 RadixArk 由 Accel 領投，估值為 4 億美元。隨著人工智慧關注點從模型訓練轉向在應用中部署，即推論階段，能夠讓這些 AI 工具執行得更快且更經濟的技術，如 vLLM 和 SGLang，正吸引投資者關注。vLLM 和 SGLang 均於 2023 年在 Databricks 共同創辦人 Ion Stoica 的加州大學伯克利分校實驗室孵化。Inferact 執行長 Simon Mo，也是該專案的原始創作者之一，曾向 Bloomberg 表示，vLLM 的現有使用者包括 Amazon 的雲端服務以及購物應用程式。
AI 代理是否已準備好進入職場？新基准測試引發質疑

2026年1月22日

微軟執行長納德拉曾預測兩年前，人工智慧將取代知識型工作，但儘管基礎模型進展迅速，白領領域的變革仍顯緩慢。近期，資料訓練巨頭 Mercor 發布新研究，針對諮詢、投資銀行及法律領域的實際任務建立新基準 APEX-Agents。測試結果顯示，所有 AI 實驗室均不及格，即便是最佳模型在面對真實專業人士提問時，正確率僅達四分之一。Mercor 執行長佛迪指出，模型最大的障礙在於跨領域資訊追蹤，這正是人類知識工作者日常運作的核心。測試環境模擬了 Slack 與 Google Drive 等多工具協作的真實情境，許多代理型 AI 在此類多領域推理上表現不穩。測試題目源自 Mercor 專家市場，涵蓋複雜的法律合規評估，例如歐盟生產停擺期間資料外洩是否符合特定隱私條款，這類問題連部分人類專家亦可能感到困難。OpenAI 的 GDPval 基準測試廣泛知識，而 APEX-Agents 則聚焦高價值專業領域的持續任務執行，更能反映自動化潛力。在參與測試的模型中，Gemini 3 Flash 表現最佳，一問一答準確率為 24%，緊隨其後的是 GPT-5.2 達 23%，其餘如 Opus 4.5、Gemini 3 Pro 及 GPT-5 均約為 18%。佛迪認為，目前 AI 表現猶如僅能答對四分之一的實習生，但隨著基準公開，業界預期未來數月內將看到顯著進步，從去年的五至十 percent 提升至更高水準。
Google DeepMind 董事長表示對 OpenAI 廣告推進 ChatGPT 表示驚訝

2026年1月22日

Google DeepMind 執行長 Demis Hassabis 表示，對 OpenAI 已率先在 AI 聊天機器人中引入廣告感到「驚訝」。他在於達沃斯論壇接受 Axios 採訪時回應了關於利用廣告獲利的事宜，稱 Google 團隊正「非常謹慎」地思考此議題。儘管廣告對 Google 核心業務至關重要，Hassabis 強調 DeepMind 團隊並未感受到來自科技巨頭的壓力，必須做出「衝動」的決定。此言論緊隨 OpenAI 於本週五宣佈，將開始測試廣告，以從每週 8 億活躍使用者中未訂閱付費服務的使用者群體中產生額外收入。 Hassabis 指出，雖然廣告曾資助了大部分消費者網際網路，且若執行良好可具價值，但在助手領域，特別是當聊天機器人旨在成為更強大、能為個人提供幫助的數位助手時，廣告的融入引發了信任問題。他認為這與 Google 搜尋的使用情境不同，搜尋已能理解使用者意圖並展示相關廣告，而聊天機器人則應更貼近個人生活，因此需經過深思熟慮。此外，他提及 Google 目前並無在 AI 聊天機器人中投放廣告的計畫，將先觀察使用者反應。近期 OpenAI 曾因在聊天中建議應用程式而引發消費者反彈，儘管其聲稱無財務成分，但使用者仍因體驗受損而憤怒。Hassabis 認同此點，認為將廣告置於與 AI 助手對話的情境中會令人不適，正如消費者拒絕 Amazon 在 Alexa 中植入廣告一樣，他們想要的是助手而非購物顧問。Hassabis 重申，DeepMind 團隊秉持科學、嚴謹且深思熟慮的傳統，不會因外部壓力而草率行事，未來可能會找到正確投放廣告的方式。
Google 現提供由 Gemini 帶動的免費 SAT 考試練習題

2026年1月22日

Google 宣佈將其 AI 教育重點轉向標準化考試，並推出由 Gemini 驅動的免費 SAT 練習考試。學生只需輸入「我想參加 SAT 練習考試」，即可獲得由 Gemini 提供的免費模擬試題。系統會分析結果，指出強項與需加強的弱項，並提供錯誤答案的詳細解析。Google 表示已與 Princeton Review 等教育機構合作，確保題目內容經過審核，且與真實 SAT 考試高度相似。此舉被視為無法負擔個人化 SAT 輔導的學生的一大突破，有助於讓更多學生在同等基礎上競爭。然而，這也引發了關於 AI 在教育中角色的廣泛討論。許多教師擔憂學生過度依賴 Gemini 或 ChatGPT 等工具，可能削弱其獨立解決問題與批判性思維能力，相關研究亦支援此觀點。此外，免費的 AI 導向考試準備也對傳統私人 SAT 輔導行業構成威脅，可能影響輔導員的工作穩定性。此訊息緊接 Google 近期推出的 Gemini 功能，該功能允許教師建立播客式音訊課程，有助於吸引 Z 世代學生。其他 Gemini 工具還包括協助教師腦筋風暴、制定課程計劃及量身打造學習材料等功能。

來源類型: 新聞

推理新創 Inferact 获得 1.5 億美元資金用於商業化 vLLM

AI 代理是否已準備好進入職場？新基准測試引發質疑

Google DeepMind 董事長表示對 OpenAI 廣告推進 ChatGPT 表示驚訝

Google 現提供由 Gemini 帶動的免費 SAT 考試練習題