分類: 視覺與媒體

「視覺與媒體」分類的 AI 新聞與論文。

月谷推出供電影創作者使用的「倫理」AI視頻模型，現已公開提供

2025年7月8日

洛杉磯的 AI 影片生成新創 Moonvalley 於週二公開其名為 Marey 的"3D 感知”模型，旨在提供比標準文字轉影片模型更給導演掌控的混合製作方式。該模型由前 DeepMind 研究人員共同創立，三月以測試版推出，現改為按月計費訂閱制，使用者可支付 14.99 美元獲得 100 信用點、34.99 美元獲得 250 信用點，或 149.99 美元獲得 1000 信用點。生成的影片片段長度上限為五秒。Moonvalley 聲稱 Marey 是少數完全基於開放授權資料訓練的模型，這符合其目標客戶——希望避免版權訴訟的獨立電影製作人需求。獨立導演 Ángel Manuel Soto 表示，Marey 讓他能大幅降低製作成本 20% 至 40%，並透過與 Moonvalley 工作室 Asteria（已被 Moonvalley 收購）合作 HBO 紀錄片系列《Menudo: Forever Young》，讓來自波多黎各的故事得以被講述。Marey 的混合製作方法允許在前期和後期製作中測試場景、調整鏡頭角度，並控制物體、角色、動作及場景構圖。該模型具備對物理世界的理解，能模仿運動並遵守物理法則，例如將野牛奔跑的影片轉換為卡迪拉克賽車，或將角色疊加在演員身上並同步其面部與手臂動作。Marey 支援自由鏡頭運動，使用者可透過滑鼠拖曳改變鏡頭軌跡，實現近 360 度鏡頭移動，並能模擬手持攝影機或軌道攝影機效果。此外，Marey 還能更改影片背景，讓製作人從源素材開始構建場景。Moonvalley 計劃在未來幾個月推出更多控制功能，包括照明、深度物體軌跡和角色庫。Marey 的公開發布使其直接與 Runway Gen-3、Luma Dream Machine、Pika 和 Haiper 等 growing 的 AI 影片生成模型競爭。
Google 全球推出全新 Veo 3 電影生成模型

2025年7月3日

Google 於週四宣佈，已開始將 Veo 3 影片生成模型逐步推給 Gemini 使用者，目前涵蓋超過 159 個國家。透過此新模型進行影片生成僅限於 Google AI Pro 付費訂閱使用者，且每日上限為三則影片。Veo 3 模型於五月首次亮相，允許使用者透過文字提示生成長達八秒的影片。Google 的 Josh Woodward 表示，公司正致力於為 Gemini 增加圖片轉影片的功能。
Midjourney 發布首款 AI 視頻生成模型 V1

2025年6月18日

Midjourney 於 2025 年 6 月 18 日宣佈推出其備受矚目的 AI 影片生成模型 V1。該模型允許使用者上傳圖片或 Midjourney 其他模型生成的圖片，並自動產生四段每段五秒的影片。V1 僅透過 Discord 平臺提供，初期僅支援網頁端使用，訂閱費用為每月 10 美元。此舉使 Midjourney 與 OpenAI 的 Sora、Runway 的 Gen 4、Adobe 的 Firefly 及 Google 的 Veo 3 等競爭對手展開競爭。Midjourney 執行長 David Holz 表示，該模型是邁向建立具備「即時開放世界模擬」能力的 AI 模型的下一步，未來還將開發用於 3D 渲染及即時 AI 的模型。然而，Midjourney 在推出 V1 僅一週前，便面臨迪士尼與環球影業的訴訟。兩家影業公司指控 Midjourney 的 AI 模型生成了涉及荷馬·辛普森與達斯·維達等受版權保護角色的圖片。儘管 Midjourney 強調其產品專注於創意而非商業應用，並指出影片生成費用將是圖片生成的八倍，但版權爭議仍無法迴避。針對 V1，使用者可選擇自動動畫或手動描述特定動畫，並調整相機與主體移動幅度，設定為「低動態」或「高動態」。雖然初始影片長度為五秒，但使用者可透過延長功能將影片最長擴充套件至 21 秒。目前，訂閱 Midjourney 的 $60 專業版或 $120 巨無霸版計畫，即可享有在較慢的「放鬆」模式下無限次生成影片。初期評價正面，但與市場上已存在數月的其他領先 AI 影片模型相比，其表現仍待觀察。

分類: 視覺與媒體

月谷推出供電影創作者使用的「倫理」AI視頻模型，現已公開提供

Google 全球推出全新 Veo 3 電影生成模型

Midjourney 發布首款 AI 視頻生成模型 V1