分類: 視覺與媒體

「視覺與媒體」分類的 AI 新聞與論文。

Meta測試獨立應用程式用於其AI生成的「Vibes」影片

2026年2月5日

Meta 確認正在測試一款獨立的 Vibes 應用程式，該應用於去年九月推出，允許使用者建立和分享短格式 AI 生成影片，並提供專門的影片資訊流。此資訊流此前僅存在於 Meta AI 應用程式內，現在將獨立推出，旨在成為與 OpenAI 的 Sora 應用程式更直接的競爭對手。Meta 表示，隨著使用者在 Meta AI 內對 Vibes 格式的採用率顯著提升，公司正利用此動量測試獨立應用程式，以提供更專注和沉浸式的環境供使用者創作、發現和分享 AI 生成影片。使用者可從頭生成影片或對資訊流中的影片進行混音，並在發布前新增新視覺效果、疊加音樂及調整風格。完成後，影片可直接發布至 Vibes 資訊流、私訊給他人，或跨貼至 Instagram 和 Facebook 的 Stories 及 Reels。Meta 指出，合作與分享功能日益興盛，許多 Vibes 影片會被傳送給朋友，這與使用者使用 Reels 的方式相似。此外，Meta 透露除在 Facebook、Instagram 和 WhatsApp 測試新高階訂閱外，還將探索針對 AI 功能（包括 Vibes）的訂閱模式。儘管 Vibes 自推出以來一直免費，但 Meta 計劃提供免費加付費（freemium）的影片創作存取權，並允許使用者訂閱以每月解鎖額外的影片創作機會，這些測試訂閱預計將在未來幾個月內推出。
OpenAI 的 Sora 應用在星光熠熠的發佈後表現不佳

2026年1月29日

OpenAI 的影片生成應用程式 Sora 在十月迅速登上 App Store 榜首後，近期面臨下載量與消費額雙重下滑的困境。根據市場資料提供商 Appfigures 的統計，Sora 在十二月下載量較上月下降 32%，進入 2026 年一月後跌幅擴大至 45%，累計下載數降至 120 萬。同期消費者支出也減少 32%，本月僅耗資 367,000 美元，遠低於十二月高峰的 540,000 美元。截至目前，Sora 在全球 iOS 與 Android 平臺共累積 960 萬次下載，總消費額為 140 萬美元，其中美國市場貢獻 110 萬美元，其次是日本、加拿大、韓國及泰國。 Sora 雖曾以邀請制在 iOS 平臺首日突破 10 萬安裝，並比 ChatGPT 更快達成百萬下載里程碑，但現已失去市場關注。美國 App Store 中 Sora 已跌出前一百名，排名 101 位，最高僅在照片與影片類別排名第 7；Google Play 則排名 181 位。其衰退原因包括 Google Gemini 及其 Nano Banana 模型的強力競爭，以及 Meta AI 推出的 Vibes 影片功能。此外，OpenAI 在版權控制上遭遇挑戰，初期因允許使用史努比、皮卡丘等角色而吸引使用者，後改為 opt-in 模式並增加限制，雖與迪士尼達成合作允許使用其角色，但尚未顯著提升下載或消費。許多使用者不願讓他人使用自己的影像生成影片，加上商業版許可權制，導致興趣減退。Sora 2 雖被視為社交媒體與 TikTok 的潛在 disruptor，但缺乏熟悉面孔與嚴格的版許可權制使其吸引力下降，未來能否透過更多版權協議或新功能復甦仍待觀察。
Luma 發布全新 AI 模型，讓用戶能從起始與結尾畫面生成視訊

2025年12月18日

美國 AI 影片與 3D 建模公司 Luma，其背後由 a16z 等機構投資，近日推出了名為 Ray3 Modify 的新模型。該模型允許使用者透過提供角色參考圖片來修改現有影片，同時保留原始影片的表演效果。使用者還可以提供起始和結束幀作為參考，引導模型生成過渡影片。Luma 表示，Ray3 Modify 解決了創意工作室在使用 AI 編輯或生成特效時，難以同時保留人類表演表現的問題。該模型能更忠實地追蹤輸入影片，讓工作室能夠使用真人演員拍攝創意或品牌影片。新模型保留了演員的原始動作、節奏、視線方向及情感表達，同時將演員的外貌轉換為指定角色，並保留服裝、相似度和身份等資訊。此外，使用者可提供起始和結束參考幀來建立影片，這有助於創作者控制角色動作或行為並保持場景間的連續性。Luma 共同創辦人兼執行長 Amit Jain 表示，生成式影片模型雖然表現力強但難以控制，Ray3 Modify 則將現實世界與 AI 表現力結合，賦予創作者完全的控制權，使團隊可以拍攝表演後立即修改場景、更換服裝，甚至用 AI 重拍而無需重新進行實體拍攝。該模型已透過 Luma 的 Dream Machine 平臺向使用者開放。Luma 與 Runway 和 Kling 等公司競爭，於 2025 年 6 月推出了影片修改功能。此次模型發布背景是該公司在 11 月宣佈獲得 9 億美元融資，由沙烏地阿拉伯公共投資基金旗下的 AI 公司 Humain 領投，現有投資者包括 a16z、Amplify Partners 和 Matrix Partners。Luma 還計劃與 Humain 在沙烏地阿拉伯建設一個 2GW 的 AI 叢集。
OpenAI 繼續沿著「紅色警報」路線推進，推出全新圖像生成模型

2025年12月16日

OpenAI 推出 GPT Image 1.5 新版本，承諾提升指令遵循能力、精確編輯功能，並實現最高四倍的圖片生成速度。該模型於週二起向所有 ChatGPT 使用者及 API 使用者開放。此舉是 OpenAI 與 Google Gemini 競爭加劇的延續，OpenAI 執行長 Sam Altman 上月在洩漏的內部備忘錄中發出「程式碼紅」警報，表示 Google 因 Gemini 3 及 Nano Banana Pro 的推出而奪取市場份額，導致 OpenAI 地位動搖。儘管 OpenAI 上週已推出 GPT-5.2 回應挑戰，但此次圖片生成器的更新仍具重大意義。GPT Image 1.5 提供類似 Nano Banana Pro 的後製功能，允許使用者對臉部相似度、照明、構圖及色彩等進行細微調整以維持視覺一致性，解決了現有生成式 AI 工具在迭代修改時常重新解讀圖片導致不一致的問題。此外，OpenAI 將圖片功能整合至 ChatGPT 側邊欄，打造類似創意工作室的介面，並計劃在搜尋結果中增加更多視覺元素與清晰來源，以提升使用者體驗。

分類: 視覺與媒體

Meta測試獨立應用程式用於其AI生成的「Vibes」影片

OpenAI 的 Sora 應用在星光熠熠的發佈後表現不佳

Luma 發布全新 AI 模型，讓用戶能從起始與結尾畫面生成視訊

OpenAI 繼續沿著「紅色警報」路線推進，推出全新圖像生成模型