分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
馬斯克利用Grok想像愛的可能
特斯拉股東批准了一項可能價值一萬億美元的新補償方案後,執行長埃隆·馬斯克在社交媒體平臺 X 上似乎正在享受一個普通的週末。他在星期六凌晨 4 點 20 分發布了一段由他公司 xAI 推出的新工具 Grok Imagine 生成的影片。馬斯克描述該影片是由提示詞"She smiles and says, 'I will always love you'"(她微笑並說:「我將永遠愛你」)生成的,影片中確實顯示一名動畫女子在雨天的街道上用明顯的合成語音說出這些話。二十四分鐘後,馬斯克又發布了一段由 Grok 生成的影片,內容是演員悉尼·斯威尼用明顯不像她本人的聲音說:「你太做作了吧。」雖然越來越常見人們對 AI 生成女性感到奇怪,甚至與聊天機器人建立浪漫關係,但許多 X 使用者特別針對「永遠愛你」的影片發表評論,有人稱其為「史上最離婚的貼文」,另一人則稱其為「這個網站歷史上最悲傷的貼文」。然而,這並非馬斯克在週末收到的最尖銳批評。真正的榮譽歸於 87 歲的獲獎作家喬伊斯·卡羅爾·歐茨。歐茨回應了一連串複雜的帖子,其中一名使用者引用馬斯克回擊德州州議員批評其補償方案的內容,歐茨寫道,馬斯克從未發布任何顯示他享受或意識到幾乎所有人欣賞的事物,無論是朋友、親人、自然、寵物、電影、音樂還是書籍。她進一步指出,馬斯克似乎完全缺乏教育且無文化,並表示窮人在推特上可能擁有比「世界上最富有的人」更多的美與意義。馬斯克對此簡單回應:「歐茨在撒謊並樂於惡意中傷。她不是個好人。」
-
亞馬遜推出AI驅動的Kindle翻譯服務協助電子書作者
亞馬遜於週四宣佈推出 Kindle Translate,這是一項由 AI 驅動的翻譯服務,旨在協助使用 Kindle Direct Publishing 的作家擴大讀者群。目前該服務處於測試階段,僅支援英文與西班牙文、以及德文與英文之間的互譯,未來將逐步增加更多語言。亞馬遜指出,目前 Amazon 平臺上少於 5% 的書籍有多種語言版本,顯示 AI 翻譯存在巨大潛力。儘管 AI 翻譯可能出現錯誤,亞馬遜允許作家在出版前預覽翻譯內容。若作家僅是為了快速翻譯,預覽功能對確保最佳準確性幫助有限,仍需人類翻譯師審查。亞馬遜聲稱其 AI 翻譯在出版前會自動評估準確性,但未詳述具體步驟。作家可透過 Kindle Direct Publishing 介面管理翻譯,選擇語言、設定價格並發布。讀者將看到標註為 Kindle Translate 的作品,並能預覽樣本。目前該服務免費提供,早期測試者讚揚其對獨立作家的成本效益與可信度。翻譯作品可參與 KDP Select 計劃並包含在 Kindle Unlimited 訂閱服務中。業界部分人士批評此類 AI 應用,認為人類翻譯師更能捕捉文學作品中的細微差別,但 AI 技術正持續改進。
-
子細計算機的聲學隔離模型協助電腦在嘈雜環境中理解使用者
加州創業公司 Subtle Computing 致力於解決在嘈雜環境中捕捉人聲的難題,其開發的端到端人聲隔離模型能提升語音 AI 產品的表現。隨著 Granola、Fireflies 等語音 AI 應用及 OpenAI、ClickUp 等平臺的整合,市場對語音識別的需求激增,但現有技術在咖啡廳或辦公室等嘈雜場景中效果不佳。Subtle Computing 的創始團隊成員 Tyler Chen 指出,傳統方案將人聲傳送至雲端處理效率低下,而該公司針對特定裝置的聲學特性訓練專屬模型,而非使用通用模型。測試顯示,保留裝置聲學特徵後,效能提升一個數量級,並能提供個人化解決方案。該公司由在斯坦福大學就讀的 Tyler Chen、David Harrison、Savannah Cofer 和 Jackie Yang 共同創立,獲得 Entrada Ventures 領銜的 600 萬美元種子輪融資,參與機構包括 Amplify Partners 及 Twitter 創辦人 Biz Stone 等天使投資人。Qualcomm 已選定該公司加入其語音與音樂擴充套件計劃,使其技術可應用於相容晶片裝置。此外,Subtle Computing 已與一家消費電子品牌及一家汽車品牌合作,並計劃於明年推出整合硬體與軟體的消費者產品,旨在提供在極端噪音或安靜環境下均可靠、易用的語音介面體驗。
-
Google Maps 升級印度導航功能搭配 Gemini 提供安全警報
Google 正在將 Gemini 整合進印度的 Google Maps,並加入道路安全警報及更多路線資訊。這項於週三在美國推出的 AI 整合功能,為 Maps 帶來免手操作 AI 協助、導航時的情境化建議以及景點資訊。Google Maps 副總裁 Miriam Daniel 表示,針對印度的本地化不僅僅是語言,還需適應印度使用者的使用習慣、提問方式、地點識別方法以及地緣政治因素和街道名稱等差異。Gemini 將於未來幾週向印度所有 Android 和 iOS 使用者開放,初期支援九種印度語言。此外,Google 還推出了針對印度的導航與通勤更新,駕駛者將獲得視覺和音訊警報,提示其正經過事故高發路段。這些警報將與當地當局合作,並首先在古爾岡、海德拉巴的賽博阿巴德地區、昌迪加爾和法裡達巴德等地區的 Android 使用者中推出。 Google 曾因去年在北方邦一輛車駛離未完工橋樑導致三人死亡的事故而受到質疑。Google Maps 資深專案經理 Anal Ghosh 指出,現實條件瞬息萬變,地圖無法百分之百準確,建議使用者務必留意道路狀況。為此,Google 已與印度國家公路管理局(NHAI)合作,獲取道路關閉、改道及維修工作的近乎即時資料,並能在國家高速公路上顯示公共廁所、餐廳和加油站等路邊設施。其他新功能包括針對主要中斷或延誤的主動通知,這些警報將首先在德里、孟買和班加羅爾的高速公路及主要道路上向 Android 使用者推出。新功能還包括顯示來自當地交通部門的速度限制,此功能將首先在法裡達巴德、加齊亞巴德、古爾岡、海德拉巴、詹普爾、科爾卡塔、勒克瑙、孟買和諾伊達等九個城市的 Android 和 iOS 使用者中推出。此外,Google Maps 還將獲得飛橋的語音支援,該功能將於未來幾週向 Android 和 iOS 使用者推出。