文章
所有發布的 AI 新聞與論文。
-
OpenAI 的 Sora 應用在星光熠熠的發佈後表現不佳
OpenAI 的影片生成應用程式 Sora 在十月迅速登上 App Store 榜首後,近期面臨下載量與消費額雙重下滑的困境。根據市場資料提供商 Appfigures 的統計,Sora 在十二月下載量較上月下降 32%,進入 2026 年一月後跌幅擴大至 45%,累計下載數降至 120 萬。同期消費者支出也減少 32%,本月僅耗資 367,000 美元,遠低於十二月高峰的 540,000 美元。截至目前,Sora 在全球 iOS 與 Android 平臺共累積 960 萬次下載,總消費額為 140 萬美元,其中美國市場貢獻 110 萬美元,其次是日本、加拿大、韓國及泰國。 Sora 雖曾以邀請制在 iOS 平臺首日突破 10 萬安裝,並比 ChatGPT 更快達成百萬下載里程碑,但現已失去市場關注。美國 App Store 中 Sora 已跌出前一百名,排名 101 位,最高僅在照片與影片類別排名第 7;Google Play 則排名 181 位。其衰退原因包括 Google Gemini 及其 Nano Banana 模型的強力競爭,以及 Meta AI 推出的 Vibes 影片功能。此外,OpenAI 在版權控制上遭遇挑戰,初期因允許使用史努比、皮卡丘等角色而吸引使用者,後改為 opt-in 模式並增加限制,雖與迪士尼達成合作允許使用其角色,但尚未顯著提升下載或消費。許多使用者不願讓他人使用自己的影像生成影片,加上商業版許可權制,導致興趣減退。Sora 2 雖被視為社交媒體與 TikTok 的潛在 disruptor,但缺乏熟悉面孔與嚴格的版許可權制使其吸引力下降,未來能否透過更多版權協議或新功能復甦仍待觀察。
-
我在 Google 新 AI 世界生成器中建造棉花糖城堡
Google DeepMind 於週四起開放 Project Genie 給美國 Google AI Ultra 訂閱者使用,這是一款能從文字提示或圖片建立互動遊戲世界的實驗性原型工具。該工具結合了 Genie 3 世界模型、Nano Banana Pro 圖片生成模型以及 Gemini。此舉是 DeepMind 為開發更強大的世界模型而收集使用者反饋與訓練資料的一部分。世界模型能生成環境的內部表示並預測未來結果,被視為實現人工通用智慧(AGI)的關鍵步驟。 Project Genie 允許使用者提供環境和主角的文字提示,由 Nano Banana Pro 生成圖片作為基礎,隨後 Genie 將其轉化為可探索的互動世界。使用者可修改圖片或基於真實照片建立世界,但模型偶爾會產生錯誤,例如將綠色頭髮生成為紫色。目前系統僅提供 60 秒的世界生成與導航時間,以應對計算資源限制。該工具已啟用安全防護,禁止生成涉及裸露或侵犯迪士尼等版權內容的世界。 測試顯示,Project Genie 在藝術風格(如黏土動畫、水彩、動漫)上表現出色,但在追求照片級真實感或電影效果時表現不佳,常呈現出遊戲感。使用真實照片時,模型有時會扭曲場景或產生不自然的數位感。導航控制方面,箭鍵、空格鍵及 WASD 鍵有時反應遲鈍或方向錯誤,導致移動困難。DeepMind 研究人員承認這是實驗性質的原型,未來將致力於提升真實感與互動能力,包括改善角色穿牆問題及提供更多使用者控制選項。儘管存在缺陷,該工具仍展示了在娛樂領域應用世界模型的潛力,並可能未來擴充套件至模擬訓練實體機器人。
-
蘋果買下以色列創業公司 Q.ai 繁榮 AI 競賽升温
蘋果、Meta 與 Google 正激烈爭奪下一代人工智慧領導地位,近期均加強對硬體的重視。蘋果透過收購以色列起點公司 Q.ai,旨在特別在音訊領域取得優勢。根據路透社報導,Q.ai 專精於影像與機器學習,其技術能解讀耳語並改善嘈雜環境中的音訊。蘋果已將新人工智慧功能加入 AirPods,包括去年推出的即時翻譯功能,並開發能偵測微妙面部肌肉活動的技術,可能用於強化 Vision Pro 頭戴式裝置。金融時報指出,此筆交易價值近兩億美元,為蘋果迄今第二大收購案,僅次於 2014 年以三億美元收購 Beats Electronics。值得注意的是,這已是執行長 Aviad Maizels 第二次將公司賣給蘋果,他曾在 2013 年出售 3D 感測公司 PrimeSense,協助蘋果從指紋辨識轉向面部辨識。Q.ai 於 2022 年創立,由 Kleiner Perkins、GV(前 Google Ventures)等機構投資,其創始團隊成員將加入蘋果。此訊息發布於蘋果首季財報前幾小時,分析師預估營收約一兆三百八十億美元,且預期為四年來最強勁的 iPhone 銷售成長。
-
Satya Nadella 強調人們廣泛使用 Microsoft 的 Copilot AI
微軟於週三發布財報,季營收達 813 億美元,淨利潤為 383 億美元,雲服務營收突破 500 億美元創下新高。然而週四股價受壓,投資者擔憂其龐大資本開支能否帶來回報。微軟在當前財政年度前半年資本開支已接近全年水平,去年支出 882 億美元,今年前半年已達 724 億美元,主要用於服務企業及大型 AI 實驗室,特別是 OpenAI 和 Anthropic。 投資者關注 Azure 與 Microsoft 365 增長未達預期,UBS 分析師 Karl Keirstead 指出雙重落後為主要負面因素,但他仍建議買入。關於 Copilot 使用率,儘管有報導稱使用者不願採用,但 CEO Satya Nadella 在財報會議上強調 AI 需求遠超資料中心供應。Nadella 稱消費者 Copilot 產品日活躍使用者增長近三倍,涵蓋聊天、搜尋等功能,但具體使用者數未明確披露。去年報告顯示月活躍使用者逾 1 億,目前總數已達 1.5 億,包含商業與消費者。 GitHub Copilot 付費訂閱數達 470 萬,年增 75%,去年報告為 2000 萬使用者(含免費層級)。Microsoft 365 Copilot 擁有 1500 萬付費席位,佔 4.5 億總付費席位。Dragon Copilot 醫療 AI 已服務 10 萬醫療機構,單季記錄 2100 萬患者會談,年增三倍。CFO Amy Hood 表示新裝置已滿載執行至壽命結束,顯示投資價值。