文章
所有發布的 AI 新聞與論文。
-
穩定AI發布全新音訊模型 可創作六分鐘歌曲
Stability AI 推出全新音訊模型系列 Stability Audio 3.0,旨在提升專業音樂生成能力。該系列包含四種模型:小型 SFX(4.59 億引數)、小型(4.59 億引數)、中型(14 億引數)和大型(27 億引數)。其中,小型 SFX 和小型模型適合在裝置上生成長達兩分鐘的音效與音樂;中型與大型模型則能創作結構完整、旋律穩定的六分二十秒長曲。這比 2024 年推出的 Stable Audio 2.0 生成功能長一倍以上。Stability AI 開放小型 SFX、小型及中型模型的權重供公眾使用與修改,而大型模型僅透過 API 或自託管付費服務提供,且年收入超過一百萬美元的公司需申請企業授權。此前 2024 年推出的 Stable Audio Open 僅支援四十七秒音樂生成,此次升級顯著提升產出長度。Stability AI 已與 Warner Music Group 及 Universal Music Group 簽約,確保最新模型基於完全授權資料訓練。儘管 Google 與 ElevenLabs 等企業也在音樂生成領域投入,但 Suno 與 Udio 的訴訟顯示,資料授權與唱片公司合作對服務長期生存至關重要。此外,Stability AI 前首席數位官 Ethan Kaplan 加入領導專業音樂業務,同期 Suno 與 ElevenLabs 也分別聘請前 Merlin 執行長及 Kobalt 音樂出版商高層以強化專業聲譽。
-
AI搜尋新創公司正在爆紅
昨日谷歌宣佈以 AI 驅動的體驗取代傳統搜尋,但並非唯一行動者。彭博社今日報導,由 Andreessen Horowitz 背後的 Exa Labs 已籌得 2.5 億美元,估值達 22 億美元,目標同樣是搜尋市場。這股趨勢反映眾多新創公司正爭相轉型搜尋產業,包括 Tavily、TinyFish 和 Parallel Web Systems。其中,由前推特執行長 Parag Agrawal 領導的 Parallel 近期在 Sequoia Capital 主導下籌得 1 億美元,估值為 20 億美元。同時,Amazon、LinkedIn 和 Reddit 等傳統科技平臺也試圖利用 AI 重塑其搜尋與發現功能,這意味著若新創公司有意出售,將有潛在的併購物件。目前最大競爭對手是 ChatGPT,它仍掌握介面層,並在谷歌行動前處理了絕大多數的 AI 驅動搜尋。然而,OpenAI 無法將搜尋作為優先事項,而谷歌則需保護其廣告業務,這可能為 Exa 或 Parallel 等小型實驗室留下市場縫隙。修正:前文誤報了 Exa Labs 的估值。
-
OpenAI 擔憂將於九月舉行的IPO可能因監管阻力而受阻
在埃隆·馬斯克敗訴後,威脅到 OpenAI 結構、領導層與財務的訴訟案告終,該人工智慧巨頭正準備推進首次公開募股。據《華爾街日報》訊息,OpenAI 執行長山姆·阿爾曼希望公司能在九月前完成上市。該公司正與科技 IPO 強行銀行高盛和摩根士丹利合作,並可能於數天或數週內向監管機構秘密提交 IPO 檔案。此訊息與全球等待太空探索技術公司(SpaceX)IPO 檔案公開披露的時間點重合,該檔案預計於週三出現。太空製造商 SpaceX 目前已是 OpenAI 的主要競爭對手,因為它收購了馬斯克的人工智慧模型製造商 xAI。既然馬斯克未能透過訴訟打擊其共同創立的 OpenAI,看來下一場馬斯克與阿爾曼的對決將發生在金融領域。哪一次 IPO 會更盛大?OpenAI 尚未立即回應評論請求。
-
IrisGo 由 Andrew Ng 支持的創始企業,致力成為你從未知悉卻需要的 AI 桌面夥伴
產業內人士指出,AI 下一個重要趨勢是具備「主動性」的系統,即能預先察覺並滿足使用者需求。新創公司 IrisGo 正致力於此領域,該公司於今年初以安德魯·紐(Andrew Ng)的 AI 基金為領軍團隊,成功募得 280 萬美元種子輪資金。IrisGo 開發了一款桌面夥伴應用程式,能學習使用者的日常工作流程並進行自動化,僅需極少或無需人工提示。該公司由前蘋果工程師傑弗裡·賴(Jeffrey Lai)共同創立,賴曾協助開發 Siri 的中文版本,而 Iris 的命名亦帶有諷刺意味,是 Siri 的倒寫。 核心概念在於,使用者只需示範一次操作,系統便能記住該流程並自動執行,無需重複指令。在與 TechCrunch 的對話中,賴展示了平臺如何學習線上點咖啡的步驟,包括選擇 Philz Coffee 的拿鐵、填寫信用卡資訊並完成購買。賴隨後要求系統自行重複該訂單,代理便順從地完成了任務。購買咖啡並非最終目的,系統旨在自動化各種業務相關任務。Iris 內建包含郵件撰寫、發票處理、報告建立及檔案摘要等技能庫,同時會根據使用者桌面行為自動新增任務。應用程式還包含類似 OpenAI 的 Codex 或 Anthropic 的 Claude Code 的程式碼助手,協助開發者工作。 目標受眾為知識工作者,即白領公司,因為他們常面臨重複性任務。目標是將工作從手動轉向更自主的工作流程,讓人類專注於高階概念工作,而代理系統則處理背景中的文書工作。IrisGo 的一大優勢是設計為在裝置端處理大量資料,提供比依賴雲端的其他應用程式更強的隱私保護。賴表示系統目前為混合架構,複雜任務會透過雲端處理,但公司承諾僅在使用者明確授權且使用端到端加密的情況下才進行雲端處理。 為了擴大規模,IrisGo 透過與知名人士和組織的關聯來建立公信力。賴透過共同校友卡內基梅隆大學的聯絡,安排與紐的會議,最終由紐的 AI 基金領投種子輪。Nvidia 和 Google 也提供了支援。IrisGo 近期推出了 macOS 和 Windows 版的測試版本,並正與筆記型電腦廠商洽談預裝合作。