分類: 視覺與媒體
「視覺與媒體」分類的 AI 新聞與論文。
-
前谷歌員工創辦的AI創業公司OpenArt現已透過單鍵產生「腦腐」視頻
由前 Google 員工於 2022 年創立的 OpenArt 公司正推動 AI 生成「腦洞」影片趨勢,該平臺擁有約 600 萬月活躍使用者。近期推出的「一鍵故事」功能允許使用者輸入單句、指令碼或歌曲,即可在 60 秒內生成包含故事架構的影片,涵蓋 TikTok 輕輕鬆鬆故事或 YouTube 音樂影片等型別。此功能提供角色 Vlog、音樂影片與說明影片三種模板,使用者可上傳角色圖片或歌曲來生成動畫,並透過編輯器調整提示詞以最佳化結果。平臺整合超過 50 個 AI 模型,包括 DALLE-3、GPT、Imagen、Flux Kontext 和 Stable Diffusion 等工具。 儘管該功能旨在降低 AI 創作者門檻,但涉及智慧財產權風險。例如,若使用皮卡丘、史努比等受版權保護角色,可能面臨侵權訴訟。OpenArt 共同創辦人兼執行長 Coco Mao 表示,系統預設會拒絕生成受版權保護的角色,但偶爾仍可能發生疏漏。公司正開放與大型智慧財產權持有者洽談授權事宜。OpenArt 強調其核心優勢在於維持角色一致性,確保視覺與敘事在整部影片中保持連貫,避免使用者需自行拼湊片段的問題。 未來,公司計劃讓使用者建立兩個角色對話的影片,並開發手機應用程式。OpenArt 採用計費制,提供四種訂閱方案:基礎版每月 14 美元含 4000 信用點,包含最多四個一鍵故事、40 部影片、4000 張圖片及四個角色;進階版每月 30 美元含 12000 信用點,最多 12 個一鍵故事;無限版每月 56 美元含 24000 信用點;另有團隊版每成員每月 35 美元。截至目前,公司已籌資 500 萬美元,來自 Basis Set Ventures 和 DCM Ventures,並擁有正向現金流,預計年度營收將超過 2000 萬美元。
-
Grok Imagine 是 xAI 新推出的 AI 圖像與影片生成器,讓你製作 NSFW 內容
Elon Musk 旗下的 xAI 公司正式將 Grok Imagine 推出至所有 SuperGrok 及 Premium+ 訂閱使用者的 iOS 應用程式中。該工具可將文字或圖片提示轉換為包含原生音效的十五秒影片,並具備允許生成不適合工作場所(NSFW)內容的「辛辣模式」。此模式允許生成性暗示內容,包括部分女性裸露影像,但存在嚴格限制。測試顯示,許多試圖生成極度露骨內容的提示詞會被系統模糊處理或拒絕,僅能生成半裸露影像。 這種不限制內容的設定符合 Musk 將 Grok 定位為無過濾、突破邊界的人工智慧的立場。此前 xAI 已發布過一個充滿色情色彩的動漫 AI 伴侶,引發了對其可能帶來非預期後果的擔憂。過去 Grok 因生成仇恨、反猶太及厭女內容而受到批評,Grok Imagine 也可能面臨類似挑戰。儘管如此,現有的限制機制仍具安慰性,因為模型允許建立名人影像,如唐納德·特朗普或泰勒·斯威夫特,但對這些物件有額外約束。例如,嘗試生成懷孕的特朗普時,系統僅生成了他抱著嬰兒或站在孕婦旁的畫面。 Grok Imagine 旨在與 Google DeepMind、OpenAI、Runway 及中國競爭對手抗衡。目前生成的真人影像與影片仍處於「恐怖谷」效應中,皮膚質感蠟質且偶爾帶有卡通化特徵。不過,該生成器表現令人印象深刻,能從文字提示在數秒內生成圖片,並隨滾動自動產生新圖,隨後可動畫化為風格化影片。其使用者介面流暢直觀,Musk 亦表示該模型將每日進步。
-
YouTube Shorts 即將推出影像轉換為視訊的 AI 工具,新增 AI 特效
YouTube 於週三宣佈,將為 Shorts 創作者提供新的生成式 AI 功能,包括影象轉影片工具及新的 AI 特效。該影象轉影片功能允許使用者將相機滾動中的照片轉換為六秒長的影片,系統會根據上傳的照片提供相關建議,可用於為風景照新增動態、讓日常照片生動或讓群體照片活躍。YouTube 舉例說明,此功能可將靜態的行人訊號圖示轉化為縮放並呈現跳舞效果的短影片。此功能運作方式類似於 Gemini 中現有的功能,也與 Meta Edits 應用中的 Animate 工具相似。新工具將於未來一週在美國、加拿大、澳大利亞和紐西蘭推出,YouTube 計劃在今年晚些時候擴充套件至更多地區。值得注意的是,Google Photos 也獲得了類似的影象轉影片工具。新的 AI 特效允許創作者將塗鴉轉化為藝術影象,並將自拍轉化為水下游泳、與他人雙胞胎等影片。使用者可透過在 Shorts 相機中點選"Effects"圖示並選擇"AI"來瀏覽所有生成式特效。YouTube 指出,今日宣佈的功能由 Google 的影片生成 AI 模型 Veo 2 驅動。YouTube 表示使用 SynthID 水印和清晰標籤來標記這些由 AI 創作的內容。此外,YouTube 還宣佈 AI Playground 是其新的生成式 AI 創作工具、靈感示例、預填提示等內容的家園,創作者可透過點選建立按鈕右上角的閃電圖示進入,該功能目前在美國、加拿大、澳大利亞和紐西蘭對所有人開放。去年在 2025 年戛納獅子獎上,YouTube 執行長 Neal Mohan 宣佈 Google 的 Veo 3 影片生成器(可生成影片和音訊)將於今年晚些時候夏季推出,並透露 Shorts 目前平均每日觀看次數超過 2000 億次。
-
Google為Veo 3新增圖像轉視頻生成功能
Google 於週四宣佈,將其影象轉影片生成功能新增至 Veo 3 AI 影片生成器,並透過 Gemini 應用程式提供。該功能此前已於五月在 Google I/O 開發者大會上推出的 AI 影片工具 Flow 中率先測試。自五月推出 Veo 3 驅動的影片生成後,Google 已於上週將此功能開放至全球超過 150 個國家。目前,僅 Google AI Ultra 和 Google AI Pro 計劃使用者可享有此功能,每日限生成三則影片,且無累積機制。 使用者可透過在提示框中選擇「影片」選項並上傳照片來生成影片片段,同時也能在提示中描述聲音以新增音效。影片生成後可下載或分享。Google 指出,自該功能推出七週以來,使用者已在 Gemini 應用程式和 Flow 工具中建立超過 4000 萬則影片。所有使用 Veo 3 模型生成的影片將帶有可見的「Veo」水印,以及 Google AI 工具採用的不可見 SynthID 數位水印,用於識別 AI 生成的數位內容。今年早些時候,Google 還發布了檢測包含 SynthID 內容的工具。