Speechify為其Chrome擴充功能新增語音輸入與語音助手功能

Speechify 原本主要是一款協助使用者聆聽文章、PDF 及檔案的工具，現在正將其 Chrome 擴充功能升級，新增語音偵測特性，包括語音輸入與能回答問題的語音助手。過去一年間，隨著語音識別模型品質提升，語音偵測工具大量湧現，Speechify 也趁勢推出支援英語的自訂輸入工具。該工具的語音輸入能自動修正錯誤並移除填充詞，但在測試期間發現仍有改進空間。雖然在 Gmail 和 Google Docs 上運作良好，但在 WordPress 等網站上卻難以有效觸發語音輸入，公司表示將逐步最佳化熱門網站。

在準確度方面，Speechify 的單字錯誤率高於 Wispr Flow、Willow 和 Monologue 等工具，但公司指出模型會隨著使用次數增加而學習得更快，錯誤率將逐漸降低。此外，Speechify 還推出了一個位於瀏覽器側邊欄的對話式語音助手，使用者可詢問網站內容，例如「列出三個關鍵概念」或「用更簡單的方式解釋」。針對 ChatGPT 和 Gemini 等產品將語音功能視為次要功能，Speechify 強調其產品將語音置於核心地位。公司首席商務官 Rohan Pavuluri 表示，許多使用者希望每次開啟應用程式時，語音互動都能作為預設選項。

值得注意的是，Speechify 的助手目前無法與 OpenAI 的 Atlas、Perplexity 的 Comet 及 Dia 等內建側邊欄助手的瀏覽器相容，但公司認為這不影響其目標，因為該擴充功能主要針對擁有龐大使用者群的 Chrome 瀏覽器。Speechify 計劃逐步在所有桌面與移動應用程式中整合語音輸入與語音助手，並開發能代表使用者完成任務的代理程式，例如代為撥電話預約或等待客服。