分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
Mixup 是一種新穎的 Mad Libs 風格應用程式,可用於從照片、文字和塗鴉創建 AI 圖像
前 Google 員工團隊開發的 3D 設計應用程式 Rooms 母公司 Things, Inc. 推出了最新專案 Mixup,這是一款僅支援 iOS 的趣味 AI 照片編輯器。該應用程式透過類似 Mad Libs 的「食譜」形式,讓使用者能透過填空式提示詞將照片、文字或草圖轉化為 AI 生成的新圖片。例如,使用者可將潦草的草圖轉化為雷諾頌風格的繪畫,或想像寵物穿著詼諧的萬聖節服裝。Mixup 建立在 Google 的 Nano Banana 模型之上,其核心創新在於將生成式工具轉化為線上派對遊戲。Things, Inc. 創辦人兼執行長 Jason Toff 指出,該模型能保持影象真實感而不顯詭異,且食譜可被分享,讓其他使用者能透過自己的素材重現效果,解決了生成式 AI 輸出不可控的「老虎機」問題。 應用程式允許使用者發布食譜與照片至公開Feed,他人可點選「嘗試食譜」使用自己的素材生成類似圖片。此功能類似 OpenAI 的 Sora 影片應用,使用者可上傳照片供追蹤者使用,形成「混變」功能,雖可能引發群體創作或創作者階級,但使用者可選擇不上傳或追蹤他人以保護隱私。Mixup 利用 OpenAI 技術處理審查,並依賴 Google 內建控制機制限制色情或暴力內容。該應用程式於 11 月 21 日午夜在全球 App Store 正式上線,初期需邀請碼進入,科技媒體讀者可使用程式碼 TCHCRH 獲取邀請。Mixup 最佳化於 iOS 26,支援 iOS 18 及以上版本,預計未來可能推出網頁版或 Android 版。免費使用者獲得 100 信用點,相當於 4 美元,每張圖片成本約 4 美分。信用點用盡後,使用者可訂閱每月提供 100、250 或 500 信用點的等級。
-
Google 發布 Nano Banana Pro,其最新影像生成模型
Google 正在升級其影象生成模型,推出名為 Nano Banana Pro 的新版本。該模型基於 Google 最新發布的大型語言模型 Gemini 3,相比前代 Nano Banana,具備更高的解析度、更準確的文字渲染能力以及網頁搜尋功能。Nano Banana Pro 允許使用者控制相機角度、場景光線、景深、焦點及色彩校正等專業引數,並能生成 2K 或 4K 高解析度影像,突破了前代 1024 x 1024px 的限制。 在功能上,新模型可整合六張高品質照片或將最多十四個物件融合於單一畫面,並能維持最多五個人物的形象一致性。此外,它支援以不同風格、字型和語言生成文字,甚至可根據搜尋結果製作閃卡。由於解析度提升,新模型的生成速度較慢且成本較高。原 Nano Banana 每張 1024px 影像成本為 0.039 美元,而 Nano Banana Pro 每張 1080p 或 2K 影像成本為 0.139 美元,每張 4K 影像成本為 0.24 美元。 Google 已推出示範應用程式,並讓新模型整合至 Gemini 應用程式中。免費訂閱使用者可生成有限數量的影像,之後將自動切換回原模型。Google AI Plus、Pro 及 Ultra 訂閱使用者享有更高的生成門檻,並可在 NotebookLM 中使用該模型。美國地區的 AI Pro 及 Ultra 使用者還可在搜尋 AI 模式中存取此功能,Ultra 使用者更可於 Flow 影片工具中使用。 Workspace 客戶可在 Google Slides 和 Vids 中存取,開發者則可透過 Gemini API、Google AI Studio 及新推出的 IDE Antigravity 進行開發。 同時,Google 將 SynthID 技術整合至 Gemini 應用程式中,讓使用者上傳影像後,聊天機器人即可告知該影像是否由公司模型生成或修改。未來,Google 還將加入對 C2PA 內容憑證檢測的支援,以驗證內容真實性。
-
Sora for Android 首日裝機數接近五十萬
OpenAI 推出的 AI 影片應用 Sora 在 Android 平臺的首日表現十分亮眼。根據應用智慧提供商 Appfigures 的最新資料,Sora 在 Google Play 商店上架首日,在可訪問市場共下載約 47 萬次。這一數字遠超其 iOS 版本的表現,安裝量超過 4 倍,其中 iOS 版本首日安裝量為 36 萬次,增幅達 327%。不過 OpenAI 指出,由於 iOS 版本僅在美國和加拿大以邀請制開放,而 Android 版本則覆蓋美國、加拿大、日本、韓國、臺灣、泰國和越南等多個地區,且 OpenAI 已在 10 月 29 日取消部分主要市場的邀請限制,使用者無需程式碼即可下載,因此兩者並非完全可比的資料。 Sora 在 iOS 端的首日下載量最初被估計為 5.6 萬次,但經過時間推移,Appfigures 修正了這一資料,認為實際數字更接近 11 萬次,其中美國安裝量約為 6.93 萬次。相比之下,Sora Android 版本在美國的安裝量約為 29.6 萬次,顯示出即便在 iOS 熱潮退去後,使用者對該 AI 影片製作工具的興趣依然濃厚。Sora 允許使用者透過提示詞生成影片,並具備「Cameos」功能,可將使用者及其朋友以動畫形式融入影片中。應用採用類似 TikTok 的垂直滾動資訊流,方便使用者瀏覽他人創作的內容。 此外,Sora 也面臨來自 Meta AI 的競爭。Meta AI 今天(2025 年 10 月 29 日)將其移動應用發布給歐洲使用者,此前已在美國推出。儘管面臨競爭,Sora 在 iOS 端首週安裝量已突破百萬,並穩居美國 App Store iPhone 免費榜單第四名。目前,Sora 在 Android 端已成為一款熱門應用,其跨平臺發展勢頭強勁。
-
Meta 將其 AI 經過短影音資訊推播至歐洲
Meta 於週四宣佈,其短影片資訊流 Vibes 將正式在歐洲推出,該功能整合於 Meta AI 應用程式中。Vibes 類似 TikTok 或 Instagram Reels,但所有展示給使用者的影片均由 AI 生成。此舉發生在 Meta 於六週前於美國推出該功能之後。就在 Meta 推出 Vibes 幾天後,OpenAI 也釋出了 Sora,這是一個用於建立和分享 AI 生成影片的社交媒體平臺。透過 Vibes,使用者可以建立並分享短影片,並訪問專門展示他人 AI 生成影片的資訊流。Meta 表示,該資訊流將隨著時間推移根據使用者興趣進行個性化調整。在內容創作方面,使用者可透過提示詞生成影片,或重新編輯他人的影片,並能新增視覺效果、疊加音樂或調整風格以符合個人喜好。Meta 強調這是一種本質上具有社交性和合作性的創作體驗,鼓勵使用者與朋友一起重新編輯、共同創作並構建故事。使用者可直接將影片分享到 Vibes 資訊流、傳送給朋友,或跨貼到 Instagram 和 Facebook 的限時動態與 Reels。 然而,Meta 執行長 Mark Zuckerberg 於九月揭曉該功能時,使用者評論多持負面態度,質疑為何要推出 AI 生成的 TikTok 替代品。有評論直言「沒人想要這個」,也有評論批評這是「AI 垃圾」。儘管 Meta 此前宣稱正在打擊「不原創」內容,並建議創作者專注於「真實敘事」,而非缺乏價值的短影片,但此次 Vibes 的推出顯得令人困惑。Meta 表示,自該功能推出以來,Meta AI 應用程式中的媒體生成量已增加超過十倍。同時,YouTube 等公司正試圖限制 AI 內容的泛濫,因為 AI 技術的興起已導致社交媒體平臺充斥大量低品質的 AI 生成內容。