文章
所有發布的 AI 新聞與論文。
-
ElevenLabs CEO 表示該聲音 AI 新創公司去年營收達到 3.3 億美元 ARR
美國人工智慧語音生成公司 ElevenLabs 的年度經常性收入(ARR)已突破 3.3 億美元,創下新紀錄。執行長 Mati Staniszewski 在接受彭博社採訪時表示,該公司自 2022 年創立、2023 年推出首款產品以來,成長速度極快。公司花費 20 個月達到 1 億美元 ARR,10 個月達到 2 億美元,而從 2 億到 3.3 億僅用了 5 個月。目前,Fortune 500 大企業與新興企業皆採用其語音代理技術,利用公司資料與知識庫來驅動客戶服務與體驗互動。公司在 X 平臺透露,企業客戶已部署其技術處理每月超過 5 萬通電話。 資金方面,ElevenLabs 於 2025 年 1 月完成由 a16z 與 ICONIQ 共同領投的 C 輪融資,融資金額為 1.8 億美元,當時估值為 33 億美元。隨後僅數月後,估值翻倍,ICONIQ 與早期投資者 Sequoia 投入另一筆 1 億美元收購員工股權。除了提供語音生成模型與語音代理外,該公司去年還推出了音樂創作功能,並與包括 Michael Caine 和 Matthew McConaughey 在內的多位名人達成協議,使用其聲音製作人工智慧生成內容。
-
1X 人形機器人製造商發布世界模型 帮助機器人學習所見內容
機器人公司 1X 推出了名為 1X World Model 的新 AI 模型,該模型基於物理定律,旨在讓其 Neo 人形機器人能夠理解真實世界的動態並自主學習新資訊。此模型結合了影片與提示詞,使 Neo 機器人能學習先前未受訓的新任務。1X 表示,公司已在十月開放 Neo 機器人的預購,並計劃於今年出貨,但發言人未透露具體出貨時間或訂單數量,僅稱預購量超出預期。1X 創辦人兼執行長 Bernt Børnich 表示,經過多年開發,Neo 現在能從網際網路規模的影片中學習並將知識應用於物理世界,甚至能將任何提示轉化為新動作。雖然宣稱機器人可將提示轉化為動作,但實際學習範圍目前仍受限於基本任務,例如移除空氣炸鍋籃子、將吐司放入烤麵包機以及擊掌等。此能力是機器人未來學習更複雜動作的第一步。該模型還為公司提供資料,使其能洞察 Neo 對特定提示的反應方式,有助於未來訓練。此故事於 2026 年 1 月 14 日更新,以更清楚解釋世界模型的運作方式。
-
醫生認為AI在醫療領域有其用武之地,但可能不太適合用作聊天機器人
iMerit 的外科醫生兼 AI 醫療領袖 Sina Bari 博士指出,ChatGPT 曾導致患者因錯誤的醫療建議而陷入困境,他曾遇到一位患者因 ChatGPT 生成該藥物有 45% 肺栓塞風險的資料而產生誤解,該資料實際來自針對結核病特定子群體的論文,並不適用於該患者。儘管如此,當 OpenAI 宣佈推出專用的 ChatGPT Health 聊天機器人時,Bari 博士感到的是興奮而非擔憂。該功能預計在幾週內推出,允許使用者在私密環境中與聊天機器人交流健康問題,且訊息不會用於訓練底層 AI 模型。使用者可透過上傳醫療記錄並同步 Apple Health 或 MyFitnessPal 等應用程式獲得更個性化的指導。 然而,對於重視安全的人士來說,這引發了立即的警訊。MIND 的聯合創辦人 Itai Schwartz 指出,醫療資料正從符合 HIPAA 標準的機構轉移至非 HIPAA 合規的供應商,並好奇監管機構將如何應對。儘管如此,Andrew Brackin 認為超過 23000 萬人已每週使用 ChatGPT 諮詢健康問題,因此 OpenAI 開發更私密、安全且最佳化的版本合乎邏輯。雖然 AI 聊天機器人在醫療領域面臨幻覺問題,且根據 Vectara 的評估模型,OpenAI 的 GPT-5 比許多 Google 和 Anthropic 的模型更容易出現幻覺,但業界仍看好其改善醫療效率的潛力。 Stanford 大學的 Nigam Shah 教授強調,美國患者難以獲得醫療照護的現狀比 ChatGPT 提供錯誤建議更為緊急,目前看診等待時間為三到六個月。Shah 認為 AI 應從醫療提供者端引入,而非患者端。由於行政任務佔據了約一半的初診醫師時間,自動化這些任務將有助於醫生見更多患者。Shah 領導的團隊正在開發 ChatEHR,該軟體整合於電子健康記錄系統中,讓臨床人員能更流暢地與患者醫療記錄互動。此外,Anthropic 也推出了針對醫療從業人員和保險商的產品,旨在減少提交先驗授權請求等繁瑣行政任務的時間,據稱每項任務可節省 20 到 30 分鐘。隨著 AI 與醫學日益緊密結合,醫生
-
環創辦人說明鏡頭公司進入「智能助手」時代
Jamie Siminoff,Ring 公司的創辦人,在將公司賣給 Amazon 五年後,因長期高強度工作而身心俱疲,決定重返公司。他受到 AI 技術發展以及帕利塞德大火(Palisades fires)的雙重驅動,希望將 Ring 從單純的視訊門鈴公司轉型為一個 AI 驅動的「智慧助手」,覆蓋整個家庭乃至更廣泛的場景。在當年的消費電子展(CES)上,Ring 推出了多項新功能,包括火警預警、異常事件通知、對話式 AI、臉部識別等。其中,「Fire Watch」功能靈感來自帕利塞德大火,與非營利組織 Watch Duty 合作,允許使用者在發生大規模火災時分享影像,協助消防部門更有效率地部署資源。另一項「Search Party」功能則利用 AI 進行類似狗臉的識別,幫助尋找走失的寵物,每日已成功協助多個家庭重聚。 然而,這些功能也引發了隱私爭議。Ring 在 2024 年終止了與警方的一些合作,但今年又與 Flock Safety 和 Axon 等公司簽署新協議,恢復了執法機構請求使用者影像的機制。Siminoff 辯稱,使用者可選擇是否分享影像,且若拒絕則保持匿名,並引用布朗大學槍擊案的案例,指出監控裝置有助於警方迅速定位兇手。此外,「Familiar Faces」功能允許系統識別並儲存常來常往的人臉,如家人或保姆,以減少不必要的警報,此功能亦受到 EFF 及美國參議員的批評。Siminoff 強調,產品不會安裝在使用者不信任的鄰居家中,並維護隱私是公司的核心價值。隨著 Ring 擴充套件至商業監控系統,包括安裝式攝影機、感測器及太陽能拖車,其客戶群將不僅限於家庭,還涵蓋企業、工地、校園及節慶活動等場所,進一步擴大了資料收集的範圍與潛在的隱私風險。