跳至內容
AI 新聞站
返回

Speechify為其Chrome擴充功能新增語音輸入與語音助手功能

Speechify 原本主要是一款協助使用者聆聽文章、PDF 及檔案的工具,現在正將其 Chrome 擴充功能升級,新增語音偵測特性,包括語音輸入與能回答問題的語音助手。過去一年間,隨著語音識別模型品質提升,語音偵測工具大量湧現,Speechify 也趁勢推出支援英語的自訂輸入工具。該工具的語音輸入能自動修正錯誤並移除填充詞,但在測試期間發現仍有改進空間。雖然在 Gmail 和 Google Docs 上運作良好,但在 WordPress 等網站上卻難以有效觸發語音輸入,公司表示將逐步最佳化熱門網站。

在準確度方面,Speechify 的單字錯誤率高於 Wispr Flow、Willow 和 Monologue 等工具,但公司指出模型會隨著使用次數增加而學習得更快,錯誤率將逐漸降低。此外,Speechify 還推出了一個位於瀏覽器側邊欄的對話式語音助手,使用者可詢問網站內容,例如「列出三個關鍵概念」或「用更簡單的方式解釋」。針對 ChatGPT 和 Gemini 等產品將語音功能視為次要功能,Speechify 強調其產品將語音置於核心地位。公司首席商務官 Rohan Pavuluri 表示,許多使用者希望每次開啟應用程式時,語音互動都能作為預設選項。

值得注意的是,Speechify 的助手目前無法與 OpenAI 的 Atlas、Perplexity 的 Comet 及 Dia 等內建側邊欄助手的瀏覽器相容,但公司認為這不影響其目標,因為該擴充功能主要針對擁有龐大使用者群的 Chrome 瀏覽器。Speechify 計劃逐步在所有桌面與移動應用程式中整合語音輸入與語音助手,並開發能代表使用者完成任務的代理程式,例如代為撥電話預約或等待客服。


分享這篇文章:

上一篇
微軟AI對話機器人Copilot將於1月15日離開WhatsApp
下一篇
Google與Accel合作尋找印度下一波AI爆紅企業