文章
所有發布的 AI 新聞與論文。
-
Luma 發布全新 AI 模型,讓用戶能從起始與結尾畫面生成視訊
美國 AI 影片與 3D 建模公司 Luma,其背後由 a16z 等機構投資,近日推出了名為 Ray3 Modify 的新模型。該模型允許使用者透過提供角色參考圖片來修改現有影片,同時保留原始影片的表演效果。使用者還可以提供起始和結束幀作為參考,引導模型生成過渡影片。Luma 表示,Ray3 Modify 解決了創意工作室在使用 AI 編輯或生成特效時,難以同時保留人類表演表現的問題。該模型能更忠實地追蹤輸入影片,讓工作室能夠使用真人演員拍攝創意或品牌影片。新模型保留了演員的原始動作、節奏、視線方向及情感表達,同時將演員的外貌轉換為指定角色,並保留服裝、相似度和身份等資訊。此外,使用者可提供起始和結束參考幀來建立影片,這有助於創作者控制角色動作或行為並保持場景間的連續性。Luma 共同創辦人兼執行長 Amit Jain 表示,生成式影片模型雖然表現力強但難以控制,Ray3 Modify 則將現實世界與 AI 表現力結合,賦予創作者完全的控制權,使團隊可以拍攝表演後立即修改場景、更換服裝,甚至用 AI 重拍而無需重新進行實體拍攝。該模型已透過 Luma 的 Dream Machine 平臺向使用者開放。Luma 與 Runway 和 Kling 等公司競爭,於 2025 年 6 月推出了影片修改功能。此次模型發布背景是該公司在 11 月宣佈獲得 9 億美元融資,由沙烏地阿拉伯公共投資基金旗下的 AI 公司 Humain 領投,現有投資者包括 a16z、Amplify Partners 和 Matrix Partners。Luma 還計劃與 Humain 在沙烏地阿拉伯建設一個 2GW 的 AI 叢集。
-
邊緣實驗室利用自駕車感測器技術,將體育迷帶入賽場體驗
多份報告指出,特定運動的現場觀賽人數正在下降,尤其是 Z 世代觀眾。為解決此問題,聯盟與廣播機構正嘗試透過不同型別的觀看體驗、資料統計與分析來提升運動的吸引力。其中一種方法是使用體積式影像生成技術,讓使用者能從多個角度觀看比賽,提供類似遊戲內的沉浸式體驗。該核心技術利用多臺相機捕捉 3D 影像,使觀眾可從不同視角欣賞賽事。加拿大基業 Peripheral Labs 希望讓此技術對聯盟、球隊及廣播機構更負擔得起,以擴大受眾。該公司由 Kelvin Cui 與 Mustafa Khan 於 2024 年創立,兩人均曾參與溫哥華大學的無人駕駛汽車專案並獲獎。Khan 曾在華為擔任研究員,Cui 則有在特斯拉擔任軟體工程師的經驗。兩人表示,因對足球及加拿大國家冰球聯盟的熱愛,加上 Mustafa 展示 3D 重建研究後,他們決定將此技術應用於體育賽事。 Peripheral Labs 利用無人駕駛汽車領域的機器人感知與 3D 視覺概念,將系統所需的相機數量從超過 100 臺減少至 32 臺,以降低成本與營運負擔。該公司計劃簽訂多年合約,並透過自有感測器堆疊提供球員的生物力學資料與統計資訊,類似於無人車感測場景深度的技術。這將允許廣播與觀眾控制觀看方式,例如僅追蹤持球球員或凍結畫面以檢視犯規細節。平臺可觀察不同關節活動,包括手指動作以測量屈伸角度,協助教練最佳化球員體位與柔韌性。 Peripheral Labs 已籌得 360 萬美元種子輪融資,由 Khosla Ventures 領投,Daybreak Capital、Entrepreneurs First 及 Transpose Platform 參與。投資人指出,儘管體育相關創業公司較難獲得投資,但此專案兼具娛樂屬性,且對體育內容的需求具有恆久性。公司目前擁有 10 名工程師,正積極擴充人力以最佳化平臺與硬體,降低延遲並提升 3D 重建解析度。目前公司正與北美多支球隊及聯盟進行洽談,競爭對手包括 Arcturus Studios 等體積式捕捉創業公司。
-
ChatGPT行動應用程式消費者開支突破30億美元新里程碑
根據應用智慧供應商 Appfigures 的估算,ChatGPT 的全球消費者在移動端的支出已達到 30 億美元的新里程碑,此資料涵蓋自 2023 年 5 月首次推出以來在 iOS 和 Android 裝置上的總消費額。值得注意的是,絕大部分消費發生在 2025 年,全球消費者在該年於 ChatGPT 手機應用上花費約 24.8 億美元,相比 2024 年的 4.87 億美元增長了 408%。而在 2023 年首年,該應用僅賺取 4290 萬美元,隨後在 2024 年增長 1036% 達到 2024 年的數字。與其他熱門應用相比,ChatGPT 僅用 31 個月就達成了 30 億美元的消費額,而排名第一的 TikTok 則用了 58 個月。此外,ChatGPT 也比迪士尼+ 和 HBO Max 等頂級串流服務更快達到此里程碑,後者分別用了 42 個月和 46 個月。xAI 的 Grok 在開始獲利後,其消費者支出速度與 ChatGPT 最為接近。除了付費訂閱如每月 20 美元的 ChatGPT Plus 或每月 200 美元的 ChatGPT Pro 外,AI 應用還可透過開發者方案及廣告獲利。ChatGPT 近日推出了類似的應用商店,並計劃未來進行商業化。Google 正探索將其健康的搜尋廣告業務轉向 AI 驅動的搜尋,包括在 AI Mode、AI Overviews、AI 購物及日益 AI 化的 Discover 頁面中投放廣告。Anthropic 則專注於企業市場,預計到 2028 年營收可達 700 億美元。
-
為何英國政客紛紛湧向美國科技巨頭
全球 AI 人才爭奪戰持續加劇,各大公司頻頻宣佈高層人事變動。前英國財政大臣喬治·奧斯本(George Osborne)在 Slack 執行長丹妮絲·德雷瑟(Denise Dresser)加入 OpenAI 擔任首席營收官不到十天後,便宣佈加入山姆·阿爾曼(Sam Altman)的 OpenAI 公司,擔任倫敦的「管理董事兼 OpenAI 國家負責人」。隨後,加密貨幣交易所 Coinbase 也任命奧斯本領導其內部諮詢委員會。奧斯本曾於 2010 年至 2016 年擔任英國財政大臣,相當於其他國家的財政部長,該職位目前由雷切爾·裡夫斯(Rachel Reeves)擔任。他在 2017 年退出政壇後,曾擔任《每日標準報》編輯,並與兄弟及朋友共同創立私募股權基金 9yards Capital,該基金投資了 Robinhood、Toast 和 Coinbase 等公司。 奧斯本在 OpenAI 的新職責是協助擴充套件和建立新夥伴關係,其「OpenAI for Countries」計劃於 2025 年 5 月推出,旨在與各國政府合作,建設本地資料中心並將 ChatGPT 本地化。此計劃是價值 5000 億美元的「星門」專案的一部分,該專案正與 Oracle 和 SoftBank 合作在美國建設五個新資料中心。OpenAI 表示,其目標是支援希望基於民主 AI 框架進行建設的國家。隨著 OpenAI 成立十週年,公司開始招聘具備深厚政治聯絡的人才,奧斯本作為牛津大學畢業生,其背景與前工黨影子財政大臣艾德·博爾斯(Ed Balls)的播客《政治貨幣》(Political Currency)所展現的廣泛網路,使其成為理想人選。 對於 Coinbase 而言,奧斯本的經驗至關重要,因為該公司正努力影響美國及全球的監管政策。OpenAI 首席全球事務官克里斯·萊恩(Chris Lehane)指出,奧斯本的決定反映了對 AI 成為關鍵基礎設施的共識,早期關於其建設、治理和部署的決策將影響未來的經濟與地緣政治。這一趨勢引發了關於「旋轉門」現象的爭議,批評者擔心前官員利用政府經驗為企業謀利,或涉及道德問題。例如