分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
泰勒·絲維絲粉絲指控歌手在Google尋寶影片中使用AI
泰勒·斯威夫特為其第十二張專輯《The Life of a Showgirl》推出線上大逃殺活動,引導粉絲從搜尋「Taylor Swift」開始。Google 搜尋結果顯示「12 cities, 12 doors, 1 video to unlock」,粉絲需找到實體門並掃描 QR 碼解鎖 12 段包含線索的影片。當粉絲點選 1200 萬次後,橘色門開啟,揭露《The Fate of Ophelia》的歌詞影片,該影片在 YouTube 上享有獨家許可權。活動由 Google 透過 Instagram 影片宣佈,畫面從地球縮小至橘色門與搜尋列。部分粉絲擔憂影片疑似由 AI 生成,引發爭議。雖然無法確定是否使用 AI,但考慮到 OpenAI 新推出的 Sora 2 及 Google 的 Veo 3 模型,此合作可能展示 Google AI 能力。斯威夫特曾公開擔憂 AI 誤用,例如前總統特朗普分享其 AI 生成支援其競選的圖片,促使她轉向支援哈里斯。此次活動若使用 AI 生成影片,將凸顯藝術家對 AI 創作的敏感態度,儘管斯威夫特擁有資源打造奇幻場景,但 AI 在音樂產業的應用仍具爭議性。
-
OpenAI 的 Sora 登上美國 App Store 專業應用第一名
OpenAI 推出的 Sora 應用在 AI 影片領域引發熱潮,儘管目前僅限受邀使用者且僅開放美國與加拿大,首日下載量仍達 56,000 次。根據應用資料提供商 Appfigures 的新資料,Sora 於 2025 年 10 月 3 日星期五成為美國 App Store 排名第一的應用,超越 Google Gemini 與 OpenAI 的 ChatGPT。Appfigures 後續在 2025 年 11 月修正估計,將 Sora 首日安裝量提升至 110,000 次,前兩天總安裝量達 164,000 次。此表現與 xAI 的 Grok 並列,但略低於 ChatGPT 與 Gemini 的首日下載量(各約 80,000 至 81,000 次)。由於 Sora 仍為受邀制,資料比較存在限制,但顯示消費者對 AI 影片工具的需求強烈,傾向於社交化體驗。此結果令部分 OpenAI 內部人員不滿,他們希望公司專注於解決對人類有益的重大問題,而非開發如 Deepfake 技術等可能引發爭議的功能。Sora 在 App Store 排名中表現亮眼,前兩天即進入總榜前三,而 ChatGPT 與 Grok 分別在第二天達到第一與第四名。文章原於 2025 年 10 月 2 日發布,後於 10 月 3 日更新以反映排名變化。
-
OpenAI 即將推出 Sora 應用程式,其自訂 TikTok 對手,並同步發佈 Sora 2 模型
OpenAI 於 2025 年 9 月 30 日星期二宣佈推出 Sora 2,這是一款旨在取代去年 Sora 的音訊與影片生成模型。隨之而來的是一個名為 Sora 的聯動社交應用,使用者可在此生成自己及朋友的影片並分享到類 TikTok 的演算法Feed 中。雖然團隊尚未親自測試該邀請制應用與 Sora 2 模型,但 OpenAI 已分享令人印象深刻的範例。Sora 2 在遵循物理法則方面表現更佳,使影片更真實。公開片段展示了海灘排球比賽、滑板技巧、體操動作及跳水板跳入水中等場景。OpenAI 指出,先前的影片模型過於樂觀,常會扭曲現實以滿足文字提示,例如籃球未投中時球會自動飛入籃筐;而在 Sora 2 中,未投中的球會反彈至後板。 Sora 應用內含名為「Cameos」的「上傳自己」功能,允許使用者將自己置入任何 Sora 生成的場景中。為此,使用者需上傳一次性的影片與音訊錄製以驗證身份並捕捉外貌。此功能還允許使用者分享自己的 Cameos,並授予他人許可權將其形象納入生成的影片中,包括多人同框影片。OpenAI 認為,基於此功能的社交應用是體驗 Sora 2 魔力的最佳方式。Sora iOS 應用現已可下載,初期將在美國和加拿大推出,但 OpenAI 希望迅速擴充套件至其他國家。目前 Sora 社交平臺為邀請制,但 ChatGPT Pro 使用者無需邀請即可嘗試 Sora 2 Pro 模型。 生成的影片可在 Sora 應用內的 Feed 中分享,類似 TikTok、Instagram Reels 或其他短影片 Feed。Meta 上週剛在其 Meta AI 應用中新增了名為「Vibes」的影片 Feed。為了編排演算法推薦,OpenAI 將考慮使用者的 Sora 活動、位置(透過 IP 地址獲取)、過去帖子的參與情況以及 ChatGPT 對話歷史,儘管這些可關閉。Sora 應用還附帶透過 ChatGPT 實現的家長控制功能,允許家長覆蓋無限滾動限制、關閉演算法個性化並管理誰可以給孩子傳送直接訊息,但這些功能的效果取決於家長的技術知識。Sora 應用在推出
-
印度領先於谷歌的Nano Banana,並融入在地創意風格
Google 的 Nano Banana 影象生成模型(正式名稱為 Gemini 2.5 Flash Image)自上月推出以來,推動了 Gemini 應用程式在全球的熱潮,尤其在印度引發了獨特的創意風潮。根據 Google DeepMind 多模態生成負責人 David Sharon 的說法,印度目前是全球 Nano Banana 使用量最高的國家,該模型在印度 App Store 和 Google Play 免費應用程式排行榜上均居首位,且根據 Appfigures 資料,Gemini 已登上全球應用程式商店排行榜前列。印度作為全球第二大智慧型手機市場和第二大網路人口國家,其採用率自然領先,但 Google 更關注的是印度使用者如何使用該模型。 印度使用者展現出高度創意且具在地特色的用法,例如重現 1990 年代寶萊塢電影風格的復古造型,包括當時的服裝、髮型和妝容;還有被稱為"AI 紗麗”的趨勢,使用者生成身穿傳統印度服飾的復古肖像。此外,使用者還將自己置於倫敦大本鐘或英國復古電話亭等地標前,甚至將自己變成復古郵票或微型人偶。雖然某些趨勢如微型人偶最初源自泰國,但印度在將其推向全球方面扮演了關鍵角色。除了 Nano Banana,印度使用者還利用 Gemini 中的 Veo 3 影片生成模型,從祖父母或高祖父母的舊照片中建立短片。 資料顯示,Gemini 應用程式在印度的下載量極其驚人。從一月到八月,印度月均下載量約為 190 萬,比美國高出 55%,佔全球月均下載量的 16.6%。截至今年八月,印度總下載量達 1520 萬,而美國為 980 萬。Nano Banana 更新於九月一日推出後,印度每日下載量急劇上升,九月十三日達到峰值 41.4 萬次,增幅達 667%。Gemini 自九月十日以來在 iOS App Store 排名第一,九月十二日在 Google Play 也奪得全類別榜首。儘管印度在內購支出上未居首位,全球 iOS 內購總額約為 640 萬美元,其中美國佔 230 萬美元(35%),印度僅佔 9.5 萬美元(1.5%),但印度在九月一至十六日間的支出成長