文章
所有發布的 AI 新聞與論文。
-
微軟建立假市集測試AI代理 他們以驚人方式失敗
微軟與亞利桑那州立大學合作,於週三發布了名為「Magentic Marketplace」的新模擬環境,旨在測試 AI 代理的行為並揭示現有模型可能存在的操控漏洞。該開放原始碼平臺模擬了客戶代理與多家餐廳代理競爭訂單的場景,初期實驗包含 100 個客戶端代理與 300 個商業端代理的互動。研究團隊測試了 GPT-4o、GPT-5 及 Gemini-2.5-Flash 等主流模型,發現了顯著弱點。當客戶代理面臨過多選項時,其效率會大幅下降,顯示當前模型難以處理大量選擇。此外,模型在協作任務中表現不佳,常無法確定各代理的角色分工,儘管提供明確指令可改善表現,但其本質能力仍顯不足。微軟研究 AI 前沿實驗室主管 Ece Kamar 指出,理解代理間的協作與談判機制至關重要,目前模型在處理複雜選項與自主協作方面仍需改進,這也引發了對 AI 公司能否兌現代理未來承諾的質疑。
-
此新創公司的金屬堆疊技術或可解決AI巨大的散熱問題
Nvidia 於三月宣佈其 Rubin 系列 GPU 時透露,預計於 2027 年推出的 Ultra 版本晶片所組建的機櫃,電力需求可能高達 600 千瓦,這幾乎是當前最快電動車充電器輸出功率的近兩倍。隨著資料中心機櫃功耗攀升至 480 千瓦並逼近 600 千瓦,如何為包括記憶體與網路晶片等佔伺服器散熱負載約 20% 的周邊元件進行液態散熱,成為工程師面臨的最大挑戰。Alloy Enterprises 開發了一項技術,利用銅片製造固態散熱板,以解決此問題。該公司共同創辦人兼執行長 Ali Forsyth 指出,過去在機櫃功耗為 120 千瓦時,工程師不太在意那 20% 的散熱需求,但現在必須為所有元件進行液態散熱,而目前針對這些部件尚無解決方案。 Alloy 採用一種名為「堆疊鍛造」的擴散結合技術,透過熱壓將金屬片層層堆疊並結合,而非傳統切削或 3D 列印。此過程成本高於傳統切削但低於 3D 列印,最終產出的散熱板為單一金屬塊,無縫隙且無孔隙,其銅材強度等同於切削製品。該技術可製作最小至 50 微米(約人類頭髮寬度一半)的微小特徵,增加冷卻液流動空間。據 Forsyth 表示,Alloy 的散熱板熱效能比競爭對手高出 35%。由於堆疊鍛造技術複雜,Alloy 負責內部設計,客戶僅提供規格與尺寸,公司軟體協助將其轉化為適合製造的形狀。工廠流程包括將銅卷預處理、雷射切割特徵、塗佈阻焊劑,最後將切片堆疊並送入擴散結合機,利用熱壓將其壓合成單一金屬塊。Alloy 最初設計時針對鋁合金,後因資料中心需求轉向銅材,因其導熱佳且抗腐蝕。產品於六月宣佈後引發巨大關注,Alloy 正與資料中心領域的各大廠商合作。
-
美國政府批准谷歌以320億美元收購Wiz
谷歌以 320 億美元收購雲端安全公司 Wiz 的行動已邁向完成階段。Wiz 執行長阿薩夫·拉帕波特(Assaf Rappaport)於週二在華爾街日報活動中表示,該收購案已獲得美國司法部反壟斷審查透過。拉帕波特指出,雖然這是重要里程碑,但交易正式關閉前仍有一段路要走。科技鉑金(TechCrunch)已聯絡 Wiz 詢問關閉時間表。谷歌最初於 2024 年提出以 230 億美元收購 Wiz,但被對方拒絕,拉帕波特當時認為該業務潛力更大。如今谷歌與 Wiz 於 2025 年初恢復收購談判,並於三月宣佈以 320 億美元完成收購。彭博社最初於六月報導該案正接受反壟斷審查。根據路透社訊息,該交易預計將於 2026 年初關閉。
-
軟銀與 OpenAI 日本設立新聯營公司 人工智能交易漸趨循環
現代人工智慧產業的運作模式呈現出一種類似的迴圈,即投資方與企業透過獲利迴圈將資金迴流至自身口袋。以軟銀為例,該公司不僅向 OpenAI 投入數十億美元,還承諾投資數十億美元建設人工智慧資料中心與基礎設施。近日,軟銀與 ChatGPT 開發商 OpenAI 在日本成立合資企業,名為 SB OAI Japan,雙方各佔 50% 股權。該合資企業將負責將 OpenAI 的企業級技術本地化並銷售給日本企業,其首個客戶將是軟銀本身。此項業務被稱為「水晶智慧」,被定義為針對日本企業管理與運營的包裝企業級人工智慧解決方案。軟銀表示,該方案旨在透過採用先進人工智慧工具幫助組織提升生產力與管理效率,並結合 OpenAI 的企業產品與由 SB OAI Japan 提供的本地化實施與支援。軟銀宣稱其所有員工都在日常運營中積極使用人工智慧,目前已建立 250 萬個自訂 ChatGPT 例項供內部使用。該合資企業的解決方案將應用於軟銀各業務部門,用於驗證產品開發與業務變革的有效性,並將所獲取的見解與專業知識透過 SB OAI Japan 回饋給其他公司。此舉發生在分析師對大量資金投入人工智慧開發及相關努力表示擔憂之際,同時也對受益公司獲得的離譜估值提出質疑。這種趨勢被比作點點網泡沫時期,當時網際網路的廣泛採用引發了風險投資浪潮與高估值,以及過去幾十年中在缺乏明確投資回報的情況下,巨額資金投入未經驗證的商業模式。