語言: 英文
英文 的 AI 新聞與論文。
-
醫生認為AI在醫療領域有其用武之地,但可能不太適合用作聊天機器人
iMerit 的外科醫生兼 AI 醫療領袖 Sina Bari 博士指出,ChatGPT 曾導致患者因錯誤的醫療建議而陷入困境,他曾遇到一位患者因 ChatGPT 生成該藥物有 45% 肺栓塞風險的資料而產生誤解,該資料實際來自針對結核病特定子群體的論文,並不適用於該患者。儘管如此,當 OpenAI 宣佈推出專用的 ChatGPT Health 聊天機器人時,Bari 博士感到的是興奮而非擔憂。該功能預計在幾週內推出,允許使用者在私密環境中與聊天機器人交流健康問題,且訊息不會用於訓練底層 AI 模型。使用者可透過上傳醫療記錄並同步 Apple Health 或 MyFitnessPal 等應用程式獲得更個性化的指導。 然而,對於重視安全的人士來說,這引發了立即的警訊。MIND 的聯合創辦人 Itai Schwartz 指出,醫療資料正從符合 HIPAA 標準的機構轉移至非 HIPAA 合規的供應商,並好奇監管機構將如何應對。儘管如此,Andrew Brackin 認為超過 23000 萬人已每週使用 ChatGPT 諮詢健康問題,因此 OpenAI 開發更私密、安全且最佳化的版本合乎邏輯。雖然 AI 聊天機器人在醫療領域面臨幻覺問題,且根據 Vectara 的評估模型,OpenAI 的 GPT-5 比許多 Google 和 Anthropic 的模型更容易出現幻覺,但業界仍看好其改善醫療效率的潛力。 Stanford 大學的 Nigam Shah 教授強調,美國患者難以獲得醫療照護的現狀比 ChatGPT 提供錯誤建議更為緊急,目前看診等待時間為三到六個月。Shah 認為 AI 應從醫療提供者端引入,而非患者端。由於行政任務佔據了約一半的初診醫師時間,自動化這些任務將有助於醫生見更多患者。Shah 領導的團隊正在開發 ChatEHR,該軟體整合於電子健康記錄系統中,讓臨床人員能更流暢地與患者醫療記錄互動。此外,Anthropic 也推出了針對醫療從業人員和保險商的產品,旨在減少提交先驗授權請求等繁瑣行政任務的時間,據稱每項任務可節省 20 到 30 分鐘。隨著 AI 與醫學日益緊密結合,醫生
-
1X 人形機器人製造商發布世界模型 帮助機器人學習所見內容
機器人公司 1X 推出了名為 1X World Model 的新 AI 模型,該模型基於物理定律,旨在讓其 Neo 人形機器人能夠理解真實世界的動態並自主學習新資訊。此模型結合了影片與提示詞,使 Neo 機器人能學習先前未受訓的新任務。1X 表示,公司已在十月開放 Neo 機器人的預購,並計劃於今年出貨,但發言人未透露具體出貨時間或訂單數量,僅稱預購量超出預期。1X 創辦人兼執行長 Bernt Børnich 表示,經過多年開發,Neo 現在能從網際網路規模的影片中學習並將知識應用於物理世界,甚至能將任何提示轉化為新動作。雖然宣稱機器人可將提示轉化為動作,但實際學習範圍目前仍受限於基本任務,例如移除空氣炸鍋籃子、將吐司放入烤麵包機以及擊掌等。此能力是機器人未來學習更複雜動作的第一步。該模型還為公司提供資料,使其能洞察 Neo 對特定提示的反應方式,有助於未來訓練。此故事於 2026 年 1 月 14 日更新,以更清楚解釋世界模型的運作方式。
-
ElevenLabs CEO 表示該聲音 AI 新創公司去年營收達到 3.3 億美元 ARR
美國人工智慧語音生成公司 ElevenLabs 的年度經常性收入(ARR)已突破 3.3 億美元,創下新紀錄。執行長 Mati Staniszewski 在接受彭博社採訪時表示,該公司自 2022 年創立、2023 年推出首款產品以來,成長速度極快。公司花費 20 個月達到 1 億美元 ARR,10 個月達到 2 億美元,而從 2 億到 3.3 億僅用了 5 個月。目前,Fortune 500 大企業與新興企業皆採用其語音代理技術,利用公司資料與知識庫來驅動客戶服務與體驗互動。公司在 X 平臺透露,企業客戶已部署其技術處理每月超過 5 萬通電話。 資金方面,ElevenLabs 於 2025 年 1 月完成由 a16z 與 ICONIQ 共同領投的 C 輪融資,融資金額為 1.8 億美元,當時估值為 33 億美元。隨後僅數月後,估值翻倍,ICONIQ 與早期投資者 Sequoia 投入另一筆 1 億美元收購員工股權。除了提供語音生成模型與語音代理外,該公司去年還推出了音樂創作功能,並與包括 Michael Caine 和 Matthew McConaughey 在內的多位名人達成協議,使用其聲音製作人工智慧生成內容。
-
Deepgram 融資 1.3 億美元並購 YC AI 新創公司
Deepgram 近日宣佈完成由 AVP 領銜的 C 輪融資,籌集 1.3 億美元,公司估值達 13 億美元。此次融資中,現有投資者如 Alkeon、In-Q-Tel、Madrona、Tiger、Wing 及 Y Combinator 繼續注資,同時新增 Alumni Ventures、哥大、Princeville Capital、Twilio 及 SAP 等機構參與。截至目前,Deepgram 總籌資額已超過 2.15 億美元。此舉延續了去年語音 AI 領域大額融資的趨勢,同期 Sesame 完成 2.5 億美元 B 輪、ElevenLabs 完成 1.8 億美元 C 輪及 Gradium 完成 7000 萬美元種子輪。AVP 合夥人 Elizabeth de Saint-Aignan 表示,2024 年與企業溝通時發現語音 AI 在聯絡中心與銷售開發中應用廣泛,且多由 Deepgram 技術驅動。語音 AI 能提升客戶體驗並降低企業成本。Deepgram 提供文字轉語音、語音轉文字等模型,以及低延遲的對話語音識別平臺與 API,目前超過 1300 家組織使用其產品,包括 Granola 與 Vapi。CEO Scott Stephenson 指出,語音 AI 已進入主流,公司去年現金流為正,此次融資旨在加速全球擴張與多語言支援,並透過收購 Y Combinator 支援的 OfOne 切入餐飲業。OfOne 的語音 AI 點餐準確率超過 93%,旨在改善過去語音助手在餐飲場景的失敗經驗,如 Taco Bell 曾因點水失敗而撤銷實驗。分析師預測語音市場年增長率將超過 30%,預計 2030 年規模達 140 億至 200 億美元。