分類: 其他 AI
「其他 AI」分類的 AI 新聞與論文。
-
你已經聽過這些 AI 名詞並點頭附和了;讓我們改變這狀況
這篇文章旨在澄清人工智慧領域中常見的術語,幫助讀者理解 AI 如何運作。文章首先定義了通用人工智慧(AGI),指出 OpenAI 將其視為能勝任大多數經濟高價值工作的自主系統,而 Google DeepMind 則認為其應具備與人類相當的認知能力。AI 代理(AI agent)被描述為能自主執行多步驟任務的工具,例如編寫、測試和除錯程式碼,這比基本的聊天機器人更進階。為了提升回答的準確性,大型語言模型(LLM)會使用「思維鏈」(Chain of thought)技術,將問題分解為中間步驟進行推理。 文章進一步解釋了基礎設施與硬體概念。API 端點是軟體的介面,允許不同應用程式整合;計算(Compute)則指代 GPU、TPU 等提供運算能力的硬體。深度學習(Deep learning)利用人工神經網路結構,能從資料中自動識別特徵,但需要大量資料和昂貴的訓練成本。生成式模型常使用擴散(Diffusion)技術,透過逆向過程從噪聲中還原資料,或運用生成式對抗網路(GAN)來產生逼真的影像。 知識轉移方面,知識精煉(Distillation)是用小型學生模型模仿大型教師模型,OpenAI 的 GPT-4 Turbo 便採用此技術。微調(Fine-tuning)則是用特定領域資料最佳化模型表現。文章也提及了模型常見的問題,如幻覺(Hallucination),即模型編造不存在的資訊,這促使開發者轉向垂直領域模型。推理(Inference)是模型執行並生成預測的過程,而記憶體壟斷(RAMageddon)則描述了因 AI 產業需求導致記憶體短缺和價格上漲的現象。 最後,文章介紹了訓練(Training)與權重(Weights)的概念,權重決定了資料特徵的重要性。驗證損失(Validation loss)用於監控模型是否過擬合。此外,還提到了強化學習(Reinforcement learning)及其變體 RLHF,以及 Token 作為 LLM 處理的基本單位,其吞吐量(Throughput)直接影響服務效率。整體而言,這篇文章涵蓋了從基礎架構到前沿研究的多個關鍵概念,並強調了該領域的快速演變。
-
OpenAI 声称它解決了一個80年的數學問題 —— 這次是真的
OpenAI 宣稱其新推出的推理模型已產生一個原創的數學證明,推翻了幾何學中一個著名的未解決猜測。該猜測最早由保羅·艾爾多斯(Paul Erdős)於 1946 年提出。此舉引發了對 OpenAI 過往聲譽的質疑,因為七個月前,該公司前副總裁凱文·魏爾(Kevin Weil)曾在 X 平臺聲稱 GPT-5 解決了 10 個艾爾多斯問題並取得 11 個問題的進展。然而,後續調查顯示 GPT-5 並未真正解決這些問題,僅從現有文獻中找到了既有的解法。當時,包括亞恩·勒庫恩(Yann LeCun)和 Google DeepMind 執行長戴米斯·侯賽尼(Demis Hassabis)在內的競爭對手對此進行了嘲諷,魏爾隨後撤回了其提前發表的帖子。 此次事件似乎讓 OpenAI 避免了重蹈覆轍。公司同時發表了由數學家諾加·阿隆(Noga Alon)、梅蘭妮·伍德(Melanie Wood)和託馬斯·布魯姆(Thomas Bloom)等學者撰寫的備註,以支援該證明。布魯姆維護著艾爾多斯問題網站,並曾稱魏爾的帖子為「戲劇性的誤導」。OpenAI 在 X 平臺上表示,近 80 年來,數學家認為最佳解法大致像方格網一樣,而該模型現在證明瞭這一信念,並發現了一種全新的構建家族,表現更佳。公司宣稱這是 AI 首次自主解決一個對數學領域至關重要的著名開放問題。 該證明來自於 OpenAI 的新通用推理模型,而非專門設計用於解決數學問題或此特定問題的系統。OpenAI 認為這具有重大意義,因為這意味著 AI 系統現在能夠更好地整合長而困難的推理鏈,並以研究人員此前未探索的方式連線跨領域的觀念。這對生物學、物理學、工程和醫學等領域具有深遠影響。數學家布魯姆在宣告中表示,AI 正在幫助我們更充分地探索數學家數世紀來建立的數學大教堂,並詢問還有什麼未見的神奇事物在等待著。
-
沙盒AQ將其藥物發現模型帶給克勞德 克勞德不需計算機博士資格
藥物研發是現代產業中成本最高的領域之一,尋找單一可行分子可能耗時十年且花費數十億美元,但大多數候選分子最終仍無法成功。一群 AI 創業公司曾承諾解決此問題,但 SandboxAQ 認為瓶頸不在模型,而在介面。該公司已與 Anthropic 合作,將其科學 AI 模型直接整合進 Claude,讓強大的藥物研發與材料科學工具透過對話式介面即可使用,無需專業計算基礎設施。SandboxAQ 成立約五年,由 Google 前執行長 Eric Schmidt 擔任主席,已籌資超過 9.5 億美元,並發展出包括網路安全在內的業務線。 SandboxAQ 最獨特之處在於生產大型定量模型(LQMs)。這些專有模型是「基於物理」的,意即建立在物理世界規則而非文字模式之上。它們能執行量子化學計算,並模擬分子動力學與微動力學,研究化學反應在分子層面的展開過程。這對於研究者至關重要,因為能在進入實驗室前預測候選分子的可能行為。這些模型訓練於真實實驗室資料與科學方程式,專為「定量經濟」設計,該領域規模超過 50 兆美元,涵蓋生物製藥、金融服務、能源與先進材料。 與專注於科學本身的 Chai Discovery 和 Isomorphic Labs 不同,SandboxAQ 專注於誰能實際使用這些工具。其客戶多為計算科學家、研究科學家或實驗師,通常受僱於大型製藥或工業公司,尋找可轉化為市場產品的新材料。SandboxAQ 的總經理 Nadia Harhen 表示,使用者因現有軟體無法解決複雜問題或無法在現實世界產生正面結果而尋求協助。目前,使用者需自行提供數位基礎設施來執行模型,而 SandboxAQ 透過整合讓使用者能以自然語言存取前沿的定量模型與大型語言模型。
-
AI星系探測者加劇全球GPU短缺情勢
美國太空總署(NASA)宣佈將於 2026 年 9 月提前八個月發射南希·格雷斯·羅曼太空望遠鏡。該望遠鏡預計在其生命週期中向天文學家提供 20,000 太位元的資料,這將與自 2021 年開始運作的詹姆斯·韋伯太空望遠鏡每日下傳的 57 吉位元影像資料,以及今年晚些時候在智利山區開始運作的維拉·C·魯賓天文臺每晚收集 20 太位元的資料調查相結合。相比之下,曾經的黃金標準哈勃太空望遠鏡每天僅提供 1 到 2 吉位元的感測器讀數。隨著資料量激增,天文學家正轉向使用 GPU 來解決問題。UC 聖塔克魯茲大學的天體物理學家布蘭特·羅伯遜(Brant Robertson)長期與英偉達(Nvidia)合作,將 GPU 應用於理解太空的挑戰中。他與前研究生萊恩·豪森(Ryan Hausen)開發了一種名為墨菲斯(Morpheus)的深度學習模型,用於分析大型資料集並識別星系。早期的墨菲斯模型對韋伯資料的分析識別出大量特定型別的盤狀星系,為宇宙發展理論增添了新視角。現在,羅伯遜正將該模型的架構從卷積神經網路轉換為大型語言模型背後的變換器(transformers),這將使模型分析面積提升數倍並加快速度。此外,他還在開發基於太空望遠鏡資料的生成式 AI 模型,以改善受地球大氣扭曲影響的地面望遠鏡觀測質量。儘管火箭技術有所進步,將八米鏡片送入軌道仍很困難,因此利用軟體改善魯賓望遠鏡的觀測是最佳替代方案。然而,羅伯遜也面臨全球對 GPU 訪問需求的壓力。他利用美國國家科學基金會(NSF)在 UC 聖塔克魯茲大學建立了 GPU 叢集,但該叢集正變得過時,且更多研究者希望應用計算密集型技術。特朗普政府在其當前預算請求中提出將 NSF 預算削減 50%。羅伯遜指出,人們希望進行 AI 和機器學習分析,而 GPU 是實現這一目標的關鍵方式。由於大學資源