跳至內容
AI 新聞站
返回

谷歌悄悄推出一款離線運作的AI口語輸入應用程式

Google 於四月七日更新其 App Store 列表,移除了對 Android 版應用程式的相關提及,並宣佈 iOS 鍵盤功能即將推出。Google 於星期一在 iOS 平臺上悄然發布了一款名為「Google AI Edge Eloquent」的離線優先口語轉文字應用程式,旨在與 Wispr Flow、SuperWhisper 及 Willow 等競爭對手抗衡。該應用程式免費下載,使用者下載基於 Gemma 的自動語音識別(ASR)模型後即可開始使用。應用程式內可顯示即時轉錄內容,當使用者暫停時,系統會自動過濾「um」、「ah」等填充詞並潤飾文字。下方提供「重點」、「正式」、「簡短」及「長篇」等選項以轉換文字格式。使用者亦可關閉雲端模式以使用僅本地處理功能,此時雲端模式則使用基於 Gemini 的模型進行文字清理。應用程式可從 Gmail 帳戶匯入特定關鍵字、名稱及專業術語,並允許使用者新增自訂詞彙。此外,該應用程式還顯示轉錄歷史記錄,支援搜尋所有記錄,並能展示最近一輪轉錄的詞彙、每分鐘詞數及總說詞數。根據官方描述,此應用程式利用 AI 捕捉使用者意圖,自動編輯掉口誤與自我修正,輸出乾淨準確的文稿。目前該應用程式僅在 iOS 平臺可用,但 App Store 描述中提及 Android 版本,並宣稱提供無縫 Android 整合,可設為預設鍵盤以實現系統級訪問,並具備類似 Wispr Flow 的浮動按鈕功能。隨著語音轉文字模型不斷進步,AI 驅動的轉文字應用程式日益普及,Google 此次測試若成功,未來 Android 平臺也可能獲得更優異的轉錄功能。


分享這篇文章:

上一篇
Atlassian推出視覺AI工具與第三方代理於Confluence
下一篇
我無法不為開發開源AI模型的微小公司Arcee感到欣喜