分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
OpenAI 的 Sora 曾是手機上最詭異的應用程式,現在將關閉
OpenAI 於 2026 年 3 月 24 日宣佈關閉 Sora,這是一款於六個月前推出的類似 TikTok 的社交應用程式。儘管其底層 Sora 2 影片與音訊生成模型令人印象深刻,但該應用缺乏持續的使用者興趣,最終未能維持下去。Sora 最初作為邀請制社交網路運營,其核心功能「cameos」(後因法律糾紛改為 characters)允許使用者掃描面部並生成逼真的深度偽造影片。然而,由於缺乏有效監管,該應用迅速成為生成涉及公共人物(如馬丁·路德·金和羅賓·威廉斯)及名人(如山姆·阿爾曼)的惡搞影片的場所,引發了廣泛的倫理爭議和法律風險。 儘管迪士尼曾考慮與 OpenAI 合作,提供價值 10 億美元的投資及授權協議以使用其角色內容,但隨著 Sora 的關閉,該協議也隨之失效,且據稱未實際發生資金轉移。資料顯示,Sora 在 11 月達到約 333 萬次下載高峰,隨後在 2 月下降至約 112 萬次,其全生命週期內產生的應用內購買收入僅約 210 萬美元。與 ChatGPT 9 億周活躍使用者相比,Sora 的規模顯得微不足道。雖然 Sora 應用已停止運營,但 Sora 2 模型仍透過 ChatGPT 付費牆提供,且其他社交 AI 影片應用可能隨之出現。
-
字節跳動傳暂停全球發佈Seedance 2.0影片生成器
據《The Information》報導,位元組跳動已暫停其新 AI 影片模型在全球範圍內推出的計劃。該中國公司,即 TikTok 的母公司(並現為其美國分拆公司的少數股東),於二月份在中國推出了 Seedance 2.0。該模型生成的短影片,包括一段湯姆·克魯斯與布拉德·皮特對戰的片段,迅速引發病毒式傳播,並招致好萊塢的強烈批評。一位成功的編劇聲稱,這些影像意味著「我們可能已經結束了」,而各大影業公司隨即向位元組跳動發出了大量停止侵權的律師函。迪士尼的律師指控該公司對迪士尼的智慧財產權進行了「虛擬的搶劫」。針對此情況,位元組跳動承諾將引入更強的智慧財產權保護措施。據報導,該公司原計劃於三月中旬將 Seedance 2.0 在全球範圍內推出,但由於工程師和律師正在努力避免進一步的法律問題,該計劃已被延後。針對科技媒體 TechCrunch 的求證請求,位元組跳動尚未立即回應。
-
Google 發佈 Nano Banana 2 模型,圖像生成速度更快
Google 今日宣佈推出其熱門圖片生成模型的最新版本 Nano Banana 2,該模型技術上屬於 Gemini 3.1 Flash Image,能創造比前代更寫實的圖片。此模型將成為 Gemini 應用程式中 Fast、Thinking 和 Pro 模式的預設選項。Google 於 2025 年 8 月首次發布 Nano Banana,引發了數百萬張圖片的生成,特別是在印度等國家。隨後在 11 月推出了 Nano Banana Pro,允許使用者建立更詳細且高品質的圖片。新版的 Nano Banana 2 保留了 Pro 模型的部分高保真特性,但產出速度更快。使用者可建立解析度從 512px 到 4K 的圖片,並支援不同長寬比。該模型能維持最多五個角色的角色一致性,以及單一工作流中最多 14 個物件的忠實度,以改善故事敘述。使用者還能發出包含詳細細微之複雜請求來生成圖片,並建立具有更鮮豔照明、更豐富紋理及更清晰細節的媒體。Nano Banana 2 將成為 Gemini 應用程式中所有應用程式的預設圖片生成模型,並成為其影片編輯工具 Flow 的預設模型。在搜尋功能中,它將透過 Google Lens 和 AI 模式成為 Google 搜尋結果的預設模型,涵蓋 141 個國家,適用於 Google 應用程式及網頁上的桌面與行動裝置。在 Google 的高階計畫 Google AI Pro 和 Ultra 中,訂閱者仍可透過三個點選單重新生成圖片以使用 Nano Banana Pro 處理專門任務。開發者將透過 Gemini API、Gemini CLI、Vertex API、AI Studio 以及於去年 11 月發布的開發工具 Antigravity 取得 Nano Banana 2 的預覽版本。所有透過新模型創作的圖片將帶有 Google 的 SynthID 水印,以標示 AI 生成圖片。這些圖片亦與由 Adobe、Microsoft、Google、OpenAI 和 Meta 等公司組成的產業組織創立的 C2PA 內容憑證相容。Google 表示,自 11 月在 Gemini 應用程式中推出 SynthID 驗證以來,已有超過 2000 萬人次使用。
-
好萊塢對新Seedance 2.0影片生成器並不滿意
好萊塢組織正強烈反對 ByteDance 推出的新 AI 影片模型 Seedance 2.0,指其迅速成為嚴重侵犯版權的工具。ByteDance 近期已敲定出售 TikTok 美國業務的協議,並保留新合資企業的股權,該公司於本週初發布了 Seedance 2.0。據《華爾街日報》報導,此更新版模型目前僅對 ByteDance 剪映(Jianying)應用程式的中國使用者開放,公司表示將很快向 CapCut 應用程式的全球使用者開放。與 OpenAI 的 Sora 類似,Seedance 允許使用者僅輸入文字提示即可生成影片,目前長度限制為 15 秒。然而,該模型因缺乏對使用真人肖像及工作室智慧財產權的防護措施而引發批評。 一名 X 使用者發布了一段由 Seedance 2.0 僅用兩行提示生成的湯姆·克魯斯與布拉德·皮特對戰的影片後,《死侍》編劇雷特·里斯(Rhett Reese)表示業界可能已無生機。電影協會(MPA)總裁查爾斯·裡夫金(Charles Rivkin)隨即發表宣告,要求 ByteDance 立即停止侵權行為,並指稱該服務在一天內大規模未經授權使用美國版權作品,忽視了保護創作者權利及支撐數百萬美國就業的既定法律。 由好萊塢工會和貿易團體支援的「人類藝術運動」(Human Artistry Campaign)將 Seedance 2.0 譴責為對全球創作者的攻擊,而演員工會 SAG-AFTRA 也支援電影協會,譴責 ByteDance 的新模型造成的公然侵權。該模型生成的影片中出現了迪士尼旗下的蜘蛛人、達斯·維達及 Grogu(Baby Yoda)等角色,促使迪士尼採取法律行動。Axios 報導,迪士尼已傳送停止侵權信,指控 ByteDance 進行「虛擬砸爛搶劫」,竊取並複製其智慧財產權。儘管迪士尼曾對 Google 採取類似行動,但它已與 OpenAI 簽訂了三年的授權協議。Variety 報導,派拉蒙(Paramount)也在週六向 ByteDance 傳送停止侵權信,指稱 Seed 平臺生成的內容包含其知名系列和角色的生動描繪,且與派拉