分類: 視覺與媒體

「視覺與媒體」分類的 AI 新聞與論文。

Mixup 是一種新穎的 Mad Libs 風格應用程式，可用於從照片、文字和塗鴉創建 AI 圖像

2025年11月20日

前 Google 員工團隊開發的 3D 設計應用程式 Rooms 母公司 Things, Inc. 推出了最新專案 Mixup，這是一款僅支援 iOS 的趣味 AI 照片編輯器。該應用程式透過類似 Mad Libs 的「食譜」形式，讓使用者能透過填空式提示詞將照片、文字或草圖轉化為 AI 生成的新圖片。例如，使用者可將潦草的草圖轉化為雷諾頌風格的繪畫，或想像寵物穿著詼諧的萬聖節服裝。Mixup 建立在 Google 的 Nano Banana 模型之上，其核心創新在於將生成式工具轉化為線上派對遊戲。Things, Inc. 創辦人兼執行長 Jason Toff 指出，該模型能保持影象真實感而不顯詭異，且食譜可被分享，讓其他使用者能透過自己的素材重現效果，解決了生成式 AI 輸出不可控的「老虎機」問題。應用程式允許使用者發布食譜與照片至公開Feed，他人可點選「嘗試食譜」使用自己的素材生成類似圖片。此功能類似 OpenAI 的 Sora 影片應用，使用者可上傳照片供追蹤者使用，形成「混變」功能，雖可能引發群體創作或創作者階級，但使用者可選擇不上傳或追蹤他人以保護隱私。Mixup 利用 OpenAI 技術處理審查，並依賴 Google 內建控制機制限制色情或暴力內容。該應用程式於 11 月 21 日午夜在全球 App Store 正式上線，初期需邀請碼進入，科技媒體讀者可使用程式碼 TCHCRH 獲取邀請。Mixup 最佳化於 iOS 26，支援 iOS 18 及以上版本，預計未來可能推出網頁版或 Android 版。免費使用者獲得 100 信用點，相當於 4 美元，每張圖片成本約 4 美分。信用點用盡後，使用者可訂閱每月提供 100、250 或 500 信用點的等級。
Google 發布 Nano Banana Pro，其最新影像生成模型

2025年11月20日

Google 正在升級其影象生成模型，推出名為 Nano Banana Pro 的新版本。該模型基於 Google 最新發布的大型語言模型 Gemini 3，相比前代 Nano Banana，具備更高的解析度、更準確的文字渲染能力以及網頁搜尋功能。Nano Banana Pro 允許使用者控制相機角度、場景光線、景深、焦點及色彩校正等專業引數，並能生成 2K 或 4K 高解析度影像，突破了前代 1024 x 1024px 的限制。在功能上，新模型可整合六張高品質照片或將最多十四個物件融合於單一畫面，並能維持最多五個人物的形象一致性。此外，它支援以不同風格、字型和語言生成文字，甚至可根據搜尋結果製作閃卡。由於解析度提升，新模型的生成速度較慢且成本較高。原 Nano Banana 每張 1024px 影像成本為 0.039 美元，而 Nano Banana Pro 每張 1080p 或 2K 影像成本為 0.139 美元，每張 4K 影像成本為 0.24 美元。 Google 已推出示範應用程式，並讓新模型整合至 Gemini 應用程式中。免費訂閱使用者可生成有限數量的影像，之後將自動切換回原模型。Google AI Plus、Pro 及 Ultra 訂閱使用者享有更高的生成門檻，並可在 NotebookLM 中使用該模型。美國地區的 AI Pro 及 Ultra 使用者還可在搜尋 AI 模式中存取此功能，Ultra 使用者更可於 Flow 影片工具中使用。 Workspace 客戶可在 Google Slides 和 Vids 中存取，開發者則可透過 Gemini API、Google AI Studio 及新推出的 IDE Antigravity 進行開發。同時，Google 將 SynthID 技術整合至 Gemini 應用程式中，讓使用者上傳影像後，聊天機器人即可告知該影像是否由公司模型生成或修改。未來，Google 還將加入對 C2PA 內容憑證檢測的支援，以驗證內容真實性。
Sora for Android 首日裝機數接近五十萬

2025年11月6日

OpenAI 推出的 AI 影片應用 Sora 在 Android 平臺的首日表現十分亮眼。根據應用智慧提供商 Appfigures 的最新資料，Sora 在 Google Play 商店上架首日，在可訪問市場共下載約 47 萬次。這一數字遠超其 iOS 版本的表現，安裝量超過 4 倍，其中 iOS 版本首日安裝量為 36 萬次，增幅達 327%。不過 OpenAI 指出，由於 iOS 版本僅在美國和加拿大以邀請制開放，而 Android 版本則覆蓋美國、加拿大、日本、韓國、臺灣、泰國和越南等多個地區，且 OpenAI 已在 10 月 29 日取消部分主要市場的邀請限制，使用者無需程式碼即可下載，因此兩者並非完全可比的資料。 Sora 在 iOS 端的首日下載量最初被估計為 5.6 萬次，但經過時間推移，Appfigures 修正了這一資料，認為實際數字更接近 11 萬次，其中美國安裝量約為 6.93 萬次。相比之下，Sora Android 版本在美國的安裝量約為 29.6 萬次，顯示出即便在 iOS 熱潮退去後，使用者對該 AI 影片製作工具的興趣依然濃厚。Sora 允許使用者透過提示詞生成影片，並具備「Cameos」功能，可將使用者及其朋友以動畫形式融入影片中。應用採用類似 TikTok 的垂直滾動資訊流，方便使用者瀏覽他人創作的內容。此外，Sora 也面臨來自 Meta AI 的競爭。Meta AI 今天（2025 年 10 月 29 日）將其移動應用發布給歐洲使用者，此前已在美國推出。儘管面臨競爭，Sora 在 iOS 端首週安裝量已突破百萬，並穩居美國 App Store iPhone 免費榜單第四名。目前，Sora 在 Android 端已成為一款熱門應用，其跨平臺發展勢頭強勁。
Meta 將其 AI 經過短影音資訊推播至歐洲

2025年11月6日

Meta 於週四宣佈，其短影片資訊流 Vibes 將正式在歐洲推出，該功能整合於 Meta AI 應用程式中。Vibes 類似 TikTok 或 Instagram Reels，但所有展示給使用者的影片均由 AI 生成。此舉發生在 Meta 於六週前於美國推出該功能之後。就在 Meta 推出 Vibes 幾天後，OpenAI 也釋出了 Sora，這是一個用於建立和分享 AI 生成影片的社交媒體平臺。透過 Vibes，使用者可以建立並分享短影片，並訪問專門展示他人 AI 生成影片的資訊流。Meta 表示，該資訊流將隨著時間推移根據使用者興趣進行個性化調整。在內容創作方面，使用者可透過提示詞生成影片，或重新編輯他人的影片，並能新增視覺效果、疊加音樂或調整風格以符合個人喜好。Meta 強調這是一種本質上具有社交性和合作性的創作體驗，鼓勵使用者與朋友一起重新編輯、共同創作並構建故事。使用者可直接將影片分享到 Vibes 資訊流、傳送給朋友，或跨貼到 Instagram 和 Facebook 的限時動態與 Reels。然而，Meta 執行長 Mark Zuckerberg 於九月揭曉該功能時，使用者評論多持負面態度，質疑為何要推出 AI 生成的 TikTok 替代品。有評論直言「沒人想要這個」，也有評論批評這是「AI 垃圾」。儘管 Meta 此前宣稱正在打擊「不原創」內容，並建議創作者專注於「真實敘事」，而非缺乏價值的短影片，但此次 Vibes 的推出顯得令人困惑。Meta 表示，自該功能推出以來，Meta AI 應用程式中的媒體生成量已增加超過十倍。同時，YouTube 等公司正試圖限制 AI 內容的泛濫，因為 AI 技術的興起已導致社交媒體平臺充斥大量低品質的 AI 生成內容。

分類: 視覺與媒體

Mixup 是一種新穎的 Mad Libs 風格應用程式，可用於從照片、文字和塗鴉創建 AI 圖像

Google 發布 Nano Banana Pro，其最新影像生成模型

Sora for Android 首日裝機數接近五十萬

Meta 將其 AI 經過短影音資訊推播至歐洲