語言: 英文
英文 的 AI 新聞與論文。
-
探討聲音AI的未來:Mati Staniszewski於TechCrunch Disrupt 2025分享
Synthetic speech 已不再是科幻小說中的幻想,從有聲書、配音到遊戲與虛擬人,AI 生成語音正迅速進入主流市場,而 ElevenLabs 的執行長兼共同創辦人 Mati Staniszewski 正協助引領這一浪潮。Mati 將於 2025 年 TechCrunch Disrupt 活動中登臺,探討如何讓語音 AI 真正具備人性。ElevenLabs 已成為生成式 AI 領域的關鍵參與者,以其在合成語音技術上的突破聞名。在該環節中,Mati 將探討 ElevenLabs 如何建立一個能複製自然語音並具備驚人細膩度與真實感的平臺,以及這如何為娛樂、無障礙服務、教育與創意敘事帶來新可能。語音作為人類最個人化且具表現力的特質之一,準確且倫理地複製它面臨獨特的技術與社會挑戰。此次對話將解析這些挑戰、探討實際應用案例,並展望 AI 語音工具將如何改變人們的聽覺、學習與連結方式。參加此 AI 環節並加入 10,000 位創業家與風險投資領袖,在 Disrupt 2025 參與塑造 AI 未來及五大產業階段突破的對話,現可立即購票並節省高達 668 美元,價格將於 9 月 26 日後上漲。
-
出售給 Spotify 後,Anchor 的創辦人重返 Oboe,一款用 AI 技術學習的應用程式
前 Spotify 聯合創始人尼爾·齊赫曼(Nir Zicherman)與邁克爾·米尼亞諾(Michael Mignano)在出售最後一家創業公司 Anchor 給 Spotify 後,推出了名為 Oboe 的新專案。Oboe 是一款由 AI 驅動的教育應用程式,允許使用者只需輸入提示詞,即可建立涵蓋科學、歷史、外語、新聞、流行文化及人生轉變等主題的輕量級、靈活性高的學習課程。該名稱靈感來自日語中「學習」一詞的詞根。 Oboe 於推出時提供九種不同的課程格式,包括文字與視覺、音訊課程、遊戲、互動測驗等,旨在讓使用者以偏好的方式學習。其核心技術架構為自研的複雜多智慧體系統,各部分並行運轉,能在數秒內生成高品質且完全個人化的課程內容。這些智慧體負責開發課程架構、驗證基礎材料、撰寫播客指令碼以及從網際網路拉取真實圖片與視覺素材,而非使用 AI 生成影象。部分智慧體還會審核內容以確保準確性與高品質。 Oboe 團隊正開發推薦引擎,幫助使用者深入探索特定主題。使用者可選擇獲取淺層知識或深入學習。在價格方面,使用者可免費消費他人創作的課程,每月可免費建立五個課程。付費層級包括每月 15 美元提供額外 30 個課程的 Oboe Plus,以及每月 40 美元提供 100 個課程的 Oboe Pro。服務初期僅在網頁及移動網頁上可用,iOS 和 Android 原生應用程式即將推出。該團隊由五名全職員工組成,米尼亞諾現為風投機構 Lightspeed 的合夥人,同時擔任 Oboe 董事會成員並保留共同創辦人頭銜。Oboe 的 400 萬美元種子輪由 Eniac Ventures 領投,其他投資方包括 Haystack、Factorial Capital、Homebrew、Offline Ventures、Scott Belsky、Kayvon Beykpour、Nikita Bier、Tim Ferriss 和 Matt Lieber。
-
RSS 共創者推出新 AI 數據授權協議
在安培克(Anthropic)達成 15 億美元版權訴訟後,AI 產業正面臨訓練資料的挑戰。目前已有 40 起待決案件尋求未授權資料的賠償,其中包括針對 Midjourney 的訴訟。若缺乏授權機制,AI 公司可能面臨大量版權訴訟。為此,一群技術人員與網路出版商推出了名為「Real Simple Licensing」(RSL)的系統,旨在實現大規模資料授權。該系統已獲得 Reddit、Quora 和 Yahoo 等主流出版商的背書。 RSL 由 Eckart Walther 共同創立,目標是建立可擴充套件的網路訓練資料授權系統。RSL 協議在技術層面定義了出版商可設定的授權條款,參與網站將條款納入「robots.txt」檔案中,以便識別資料歸屬。法律層面則成立了 RSL Collective 集體授權組織,類似於音樂界的 ASCAP 或電影界的 MPLC,負責談判條款與收取版稅。目前 Yahoo、Reddit、Medium、O'Reilly Media 等已加入該集體,而 Fastly、Quora 等則支援該標準。 值得注意的是,Reddit 已與 Google 達成每年約 6 億美元的授權協議。雖然大型公司可自行談判,但小型出版商可能依賴集體條款。然而,AI 模型在計算版稅時面臨獨特挑戰,例如難以確認特定文件是否被 LLM ingest,或是否按推理次數付費。儘管如此,RSL 創始人認為 AI 公司有能力管理此難度,並指出部分現有協議已要求報告資料使用情況。 關鍵問題在於 AI 公司是否會採用此係統。雖然 frontier labs 願意付費,但網路資料傳統上被視為低成本來源,且 Common Crawl 等資料集已廣泛可用。Cloudflare 與 Perplexity 的爭議也顯示,區分網頁抓取與機器增強瀏覽並非易事。儘管如此,RSL 團隊表示,隨著 AI 領袖如 Sundar Pichai 公開呼籲建立類似系統,RSL 有望成為現實。
-
AI遊戲新創公司Born獲1500萬美元資金建構「社交」AI夥伴对抗孤獨
柏林人工智慧遊戲創業公司 Born 的執行長兼共同創辦人 Fabian Kamberi 認為,目前市面上的 AI 伴侶產品設計具有剝削性,旨在透過與 AI 聊天機器人的一對一關係讓使用者感到孤獨,而非讓生活更有趣或改善生活。他主張 AI 伴侶的未來應著重於共同體驗,以強化現實世界的連結。Born 的首款旗艦產品是一款應用程式,使用者可以養育、與可愛虛擬寵物 Pengu 玩迷你遊戲並共同育兒。這是一款免費加付費模式的應用程式,使用者可購買 Pengu Pass 訂閱以獲得額外功能。根據 Born 的資料,該應用程式已在全球吸引超過 1500 萬使用者,但公司尚未披露付費客戶數量。Pengu 的理念在於將社交元素轉化為共同專案,幫助使用者與 AI 角色及現實生活中的關係互動。 Born 正準備推出 Pengu 應用程式的新角色,並發售另一款專為青少年設計的社交 AI 產品。該公司前身為 Slay,曾是一款圍繞讚美互動的青少年社交媒體應用程式,並已獲得 1500 萬美元 A 輪融資,總籌資額達 2500 萬美元,投資方包括 Accel、Tencent 和 Laton Ventures。獲得新資金後,Born 計劃在 Pengu 應用程式中推出另一款兼具學習功能的數位伴侶,並於今年晚些時候在紐約開設辦公室,專注於行銷與 AI 研究。該研究將致力於改進角色引擎,使每個新 AI 朋友能形成一致的人設、記住互動並隨使用者成長。 Born 主要依賴 OpenAI 的生成式 AI 模型,但已建立額外的安全層。另一款專為 16 至 21 歲青少年設計的產品目前處於保密狀態,預計允許使用者建立和互動「具有文化相關性的 AI 伴侶」,這些機器人可能會根據使用者的社交媒體內容傳送 TikTok 影片或 Instagram Reels。Kamberi 預期該產品將產生「網路效應」,因為使用者會在社交媒體上分享他們的創作。他強調現有的聊天機器人生態並非最終形式,消費者社交 AI 必須比單純輸入平臺並傳送訊息給機器人更具吸引力。Accel 的合夥人 Luca Bocchio 讚賞 Born 的願景,即建立一個圍繞情感智慧 AI 角色的全新消費級社交類別,並期待隨著 Born