文章
所有發布的 AI 新聞與論文。
-
OpenAI 加強 Codex 功能對抗 Anthropic 並提升對用戶桌面的控制力
OpenAI 與 Anthropic 目前正進行一場關於 AI 編碼工具優劣的低強度競爭,儘管 Claude Code 近期被視為企業首選,OpenAI 仍持續推出 Codex 的升級版本以增強其功能。OpenAI 於本週宣佈 Codex 可於電腦背景中執行,能開啟桌面任何應用程式並透過點選與輸入遊標執行操作。此功能允許 Codex 在使用者同時使用其他應用程式時,以並行模式運作,扮演輔助程式設計夥伴的角色,協助處理前端變更、測試應用程式或操作未公開 API 的應用等任務。此外,Codex 新增內建瀏覽器功能,可對特定網頁應用程式發號施令,並計劃未來擴充套件至完全控制本地主機上的瀏覽器。其他更新包括名為「記憶」的功能,可喚取過往工作會話並生成使用者工作模式的重要背景資訊;新增影象生成能力,可用於製作產品概念、幻燈片視覺、原型圖及企業相關素材;並整合了來自 CodeRabbit、GitLab Issues 等應用的一一一個外掛,使 Codex 能處理涉及這些工具的任務,例如整理 Slack 頻道與 Google 日曆以生成待辦事項清單。OpenAI 同時推出了針對 ChatGPT 企業及商業客戶的按使用量付費的 Codex 定價選項。隨著 OpenAI 更專注於企業能力並退縮消費級工具如 Sora 2,其在企業領域與 Anthropic 的競爭日益激烈,近期亦面臨多起關於 ChatGPT 對使用者心理健康影響的訴訟爭議。
-
身為熱門機器人新創公司的Physical Intelligence宣稱其新開發的機器人腦能自行理解從未被教過的任務
美國舊金山機器人新創公司 Physical Intelligence 於週四發表新研究,顯示其最新模型 π0.7 能引導機器人執行從未明確訓練過的任務。該模型被描述為邁向通用機器人腦的早期重要一步,具備元件泛化能力,即結合不同情境中學得的技能來解決從未接觸過的問題。這打破了傳統機器人訓練依賴特定任務資料 rote memorization 的模式。研究團隊發現,當模型跨越僅執行資料對應任務的門檻後,其能力增長速度超過線性比例,類似於語言模型領域的現象。 最引人注目的演示涉及空氣炸鍋,該裝置在訓練資料中僅出現兩次相關片段:一次是機器人推閉炸鍋,另一次是將塑膠瓶放入炸鍋。模型綜合這些片段與網路預訓練資料,成功理解並操作該電器烹飪地瓜。在零指導下模型表現尚可,而在逐步語音指導下則能成功執行。此能力意味著機器人可在新環境中即時部署並改進,無需額外資料收集或模型重訓。 研究人員坦承模型仍有侷限,例如無法單從高階指令自主執行複雜多步驟任務,如直接說「幫我烤吐司」便無法達成,但若逐步指導開蓋、按鍵等步驟則運作良好。此外,缺乏標準化機器人評估指標使得外部驗證困難,團隊僅將 π0.7 與自身專項模型比較,發現其在製作咖啡、摺洗衣物及組裝紙箱等任務上表現相當。 研究結果令內部專家感到意外,因為他們清楚訓練資料內容。例如隨機詢問機器人旋轉齒輪時,模型竟能成功執行。研究人員強調,批評者常認為演示任務過於無聊,但 Physical Intelligence 認為泛化能力雖不如精心編排的特技劇本震撼,卻更具實用價值。該研究僅展示早期泛化跡象與初步演示,並非已部署產品。Physical Intelligence 迄今已籌資超過十億美元,最新估值為五十六億美元,創辦人之一 Lachy Groom 曾投資 Figma、Notion 等公司,目前公司正討論可能將估值翻倍至一百一十億美元的新融資輪次。
-
Upscale AI 說議談籌資達 20 億美元估值
美國 AI 基礎設施公司 Upscale AI 據彭博社報導,正與投資者洽談其自成立七個月以來籌得的第三輪融資。此輪融資目標為籌資約 1.8 億至 2 億美元,將使公司估值達到約 20 億美元。該公司此前於一月份宣佈完成 2 億美元的 A 輪融資,並在九月首次啟動時進行了 1 億美元的種子輪融資。其投資方包括 Tiger Global Management、Xora Innovation 以及 Premji Invest。值得注意的是,Upscale AI 尚未推出任何產品,但其專注於開發自訂晶片及建立讓這些晶片能有效溝通的基礎設施。公司押注於全棧解決方案與開放標準,認為這將是未來可擴充套件 AI 基礎設施的趨勢。此次傳聞中的估值與融資規模,反映了當前 AI 時代創業公司的典型發展模式,即公司成長迅速且估值增長更快,但市場對下一個重大突破的期待往往超過實際進度。
-
Luma 發布結合 AI 技術的製作工作室 并推出以信仰為主題的 Wonder Project
美國 AI 影片生成公司 Luma 與專注於宗教及家庭友好內容的製作工作室 Wonder Project 合作,推出了名為 Innovative Dreams 的新製作公司。Wonder Project 擁有 Amazon Prime Video 串流服務,其首個專案「The Old Stories: Moses」由英國演員 Ben Kingsley 主演,預計今年春季於 Prime Video 上線。Luma 表示,Innovative Dreams 將讓資深導演團隊與 Luma 的創意技術人員協作,利用 Luma Agents 工具進行端到端的創意工作,涵蓋文字、影像、影片與聲音。該工具旨在實現即時創作團隊協作,讓製作人能即時修改場景、道具與燈光,並加入真人演員鏡頭,這比傳統虛擬製作與表演捕捉僅在後期整合的方式更為高效。Luma 執行長 Amit Jain 指出,生成式 AI 能讓製片速度更快、成本更低且效率更高,同時不犧牲品質。此舉並非孤例,AI 起點公司 Higgsfield 上週已推出原創系列,倫敦的 Wonder Studios 則與 Campfire Studios 合作製作紀錄片。競爭對手 Runway 的創辦人 Cristóbal Valenzuela也建議電影工作室應將單部影片耗資一億美元改為利用 AI 製作五十部影片以增加爆款機率。Wonder Project 於 2023 年成立,由導演 Jon Erwin 與前 Netflix 高管 Kelly Hoogstraten 領導,其首部作品《David 之家》於 2025 年於 Amazon Prime Video 播出。Innovative Dreams 雖以宗教內容起家,但未來將擴充套件至多型別專案。Erwin 介紹了結合表演捕捉與虛擬製作的「即時混合製片」流程,利用 Luma 工具讓演員在任何地點拍攝並傳輸至寫實場景,甚至生成新臉孔以匹配演員動作與表情。