分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
Meta測試獨立應用程式用於其AI生成的「Vibes」影片
Meta 確認正在測試一款獨立的 Vibes 應用程式,該應用於去年九月推出,允許使用者建立和分享短格式 AI 生成影片,並提供專門的影片資訊流。此資訊流此前僅存在於 Meta AI 應用程式內,現在將獨立推出,旨在成為與 OpenAI 的 Sora 應用程式更直接的競爭對手。Meta 表示,隨著使用者在 Meta AI 內對 Vibes 格式的採用率顯著提升,公司正利用此動量測試獨立應用程式,以提供更專注和沉浸式的環境供使用者創作、發現和分享 AI 生成影片。使用者可從頭生成影片或對資訊流中的影片進行混音,並在發布前新增新視覺效果、疊加音樂及調整風格。完成後,影片可直接發布至 Vibes 資訊流、私訊給他人,或跨貼至 Instagram 和 Facebook 的 Stories 及 Reels。Meta 指出,合作與分享功能日益興盛,許多 Vibes 影片會被傳送給朋友,這與使用者使用 Reels 的方式相似。此外,Meta 透露除在 Facebook、Instagram 和 WhatsApp 測試新高階訂閱外,還將探索針對 AI 功能(包括 Vibes)的訂閱模式。儘管 Vibes 自推出以來一直免費,但 Meta 計劃提供免費加付費(freemium)的影片創作存取權,並允許使用者訂閱以每月解鎖額外的影片創作機會,這些測試訂閱預計將在未來幾個月內推出。
-
OpenAI 的 Sora 應用在星光熠熠的發佈後表現不佳
OpenAI 的影片生成應用程式 Sora 在十月迅速登上 App Store 榜首後,近期面臨下載量與消費額雙重下滑的困境。根據市場資料提供商 Appfigures 的統計,Sora 在十二月下載量較上月下降 32%,進入 2026 年一月後跌幅擴大至 45%,累計下載數降至 120 萬。同期消費者支出也減少 32%,本月僅耗資 367,000 美元,遠低於十二月高峰的 540,000 美元。截至目前,Sora 在全球 iOS 與 Android 平臺共累積 960 萬次下載,總消費額為 140 萬美元,其中美國市場貢獻 110 萬美元,其次是日本、加拿大、韓國及泰國。 Sora 雖曾以邀請制在 iOS 平臺首日突破 10 萬安裝,並比 ChatGPT 更快達成百萬下載里程碑,但現已失去市場關注。美國 App Store 中 Sora 已跌出前一百名,排名 101 位,最高僅在照片與影片類別排名第 7;Google Play 則排名 181 位。其衰退原因包括 Google Gemini 及其 Nano Banana 模型的強力競爭,以及 Meta AI 推出的 Vibes 影片功能。此外,OpenAI 在版權控制上遭遇挑戰,初期因允許使用史努比、皮卡丘等角色而吸引使用者,後改為 opt-in 模式並增加限制,雖與迪士尼達成合作允許使用其角色,但尚未顯著提升下載或消費。許多使用者不願讓他人使用自己的影像生成影片,加上商業版許可權制,導致興趣減退。Sora 2 雖被視為社交媒體與 TikTok 的潛在 disruptor,但缺乏熟悉面孔與嚴格的版許可權制使其吸引力下降,未來能否透過更多版權協議或新功能復甦仍待觀察。
-
Luma 發布全新 AI 模型,讓用戶能從起始與結尾畫面生成視訊
美國 AI 影片與 3D 建模公司 Luma,其背後由 a16z 等機構投資,近日推出了名為 Ray3 Modify 的新模型。該模型允許使用者透過提供角色參考圖片來修改現有影片,同時保留原始影片的表演效果。使用者還可以提供起始和結束幀作為參考,引導模型生成過渡影片。Luma 表示,Ray3 Modify 解決了創意工作室在使用 AI 編輯或生成特效時,難以同時保留人類表演表現的問題。該模型能更忠實地追蹤輸入影片,讓工作室能夠使用真人演員拍攝創意或品牌影片。新模型保留了演員的原始動作、節奏、視線方向及情感表達,同時將演員的外貌轉換為指定角色,並保留服裝、相似度和身份等資訊。此外,使用者可提供起始和結束參考幀來建立影片,這有助於創作者控制角色動作或行為並保持場景間的連續性。Luma 共同創辦人兼執行長 Amit Jain 表示,生成式影片模型雖然表現力強但難以控制,Ray3 Modify 則將現實世界與 AI 表現力結合,賦予創作者完全的控制權,使團隊可以拍攝表演後立即修改場景、更換服裝,甚至用 AI 重拍而無需重新進行實體拍攝。該模型已透過 Luma 的 Dream Machine 平臺向使用者開放。Luma 與 Runway 和 Kling 等公司競爭,於 2025 年 6 月推出了影片修改功能。此次模型發布背景是該公司在 11 月宣佈獲得 9 億美元融資,由沙烏地阿拉伯公共投資基金旗下的 AI 公司 Humain 領投,現有投資者包括 a16z、Amplify Partners 和 Matrix Partners。Luma 還計劃與 Humain 在沙烏地阿拉伯建設一個 2GW 的 AI 叢集。
-
OpenAI 繼續沿著「紅色警報」路線推進,推出全新圖像生成模型
OpenAI 推出 GPT Image 1.5 新版本,承諾提升指令遵循能力、精確編輯功能,並實現最高四倍的圖片生成速度。該模型於週二起向所有 ChatGPT 使用者及 API 使用者開放。此舉是 OpenAI 與 Google Gemini 競爭加劇的延續,OpenAI 執行長 Sam Altman 上月在洩漏的內部備忘錄中發出「程式碼紅」警報,表示 Google 因 Gemini 3 及 Nano Banana Pro 的推出而奪取市場份額,導致 OpenAI 地位動搖。儘管 OpenAI 上週已推出 GPT-5.2 回應挑戰,但此次圖片生成器的更新仍具重大意義。GPT Image 1.5 提供類似 Nano Banana Pro 的後製功能,允許使用者對臉部相似度、照明、構圖及色彩等進行細微調整以維持視覺一致性,解決了現有生成式 AI 工具在迭代修改時常重新解讀圖片導致不一致的問題。此外,OpenAI 將圖片功能整合至 ChatGPT 側邊欄,打造類似創意工作室的介面,並計劃在搜尋結果中增加更多視覺元素與清晰來源,以提升使用者體驗。