分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
月谷推出供電影創作者使用的「倫理」AI視頻模型,現已公開提供
洛杉磯的 AI 影片生成新創 Moonvalley 於週二公開其名為 Marey 的"3D 感知”模型,旨在提供比標準文字轉影片模型更給導演掌控的混合製作方式。該模型由前 DeepMind 研究人員共同創立,三月以測試版推出,現改為按月計費訂閱制,使用者可支付 14.99 美元獲得 100 信用點、34.99 美元獲得 250 信用點,或 149.99 美元獲得 1000 信用點。生成的影片片段長度上限為五秒。Moonvalley 聲稱 Marey 是少數完全基於開放授權資料訓練的模型,這符合其目標客戶——希望避免版權訴訟的獨立電影製作人需求。獨立導演 Ángel Manuel Soto 表示,Marey 讓他能大幅降低製作成本 20% 至 40%,並透過與 Moonvalley 工作室 Asteria(已被 Moonvalley 收購)合作 HBO 紀錄片系列《Menudo: Forever Young》,讓來自波多黎各的故事得以被講述。Marey 的混合製作方法允許在前期和後期製作中測試場景、調整鏡頭角度,並控制物體、角色、動作及場景構圖。該模型具備對物理世界的理解,能模仿運動並遵守物理法則,例如將野牛奔跑的影片轉換為卡迪拉克賽車,或將角色疊加在演員身上並同步其面部與手臂動作。Marey 支援自由鏡頭運動,使用者可透過滑鼠拖曳改變鏡頭軌跡,實現近 360 度鏡頭移動,並能模擬手持攝影機或軌道攝影機效果。此外,Marey 還能更改影片背景,讓製作人從源素材開始構建場景。Moonvalley 計劃在未來幾個月推出更多控制功能,包括照明、深度物體軌跡和角色庫。Marey 的公開發布使其直接與 Runway Gen-3、Luma Dream Machine、Pika 和 Haiper 等 growing 的 AI 影片生成模型競爭。
-
Google 全球推出全新 Veo 3 電影生成模型
Google 於週四宣佈,已開始將 Veo 3 影片生成模型逐步推給 Gemini 使用者,目前涵蓋超過 159 個國家。透過此新模型進行影片生成僅限於 Google AI Pro 付費訂閱使用者,且每日上限為三則影片。Veo 3 模型於五月首次亮相,允許使用者透過文字提示生成長達八秒的影片。Google 的 Josh Woodward 表示,公司正致力於為 Gemini 增加圖片轉影片的功能。
-
Midjourney 發布首款 AI 視頻生成模型 V1
Midjourney 於 2025 年 6 月 18 日宣佈推出其備受矚目的 AI 影片生成模型 V1。該模型允許使用者上傳圖片或 Midjourney 其他模型生成的圖片,並自動產生四段每段五秒的影片。V1 僅透過 Discord 平臺提供,初期僅支援網頁端使用,訂閱費用為每月 10 美元。此舉使 Midjourney 與 OpenAI 的 Sora、Runway 的 Gen 4、Adobe 的 Firefly 及 Google 的 Veo 3 等競爭對手展開競爭。Midjourney 執行長 David Holz 表示,該模型是邁向建立具備「即時開放世界模擬」能力的 AI 模型的下一步,未來還將開發用於 3D 渲染及即時 AI 的模型。 然而,Midjourney 在推出 V1 僅一週前,便面臨迪士尼與環球影業的訴訟。兩家影業公司指控 Midjourney 的 AI 模型生成了涉及荷馬·辛普森與達斯·維達等受版權保護角色的圖片。儘管 Midjourney 強調其產品專注於創意而非商業應用,並指出影片生成費用將是圖片生成的八倍,但版權爭議仍無法迴避。針對 V1,使用者可選擇自動動畫或手動描述特定動畫,並調整相機與主體移動幅度,設定為「低動態」或「高動態」。雖然初始影片長度為五秒,但使用者可透過延長功能將影片最長擴充套件至 21 秒。目前,訂閱 Midjourney 的 $60 專業版或 $120 巨無霸版計畫,即可享有在較慢的「放鬆」模式下無限次生成影片。初期評價正面,但與市場上已存在數月的其他領先 AI 影片模型相比,其表現仍待觀察。