文章
所有發布的 AI 新聞與論文。
-
Gemini 開始在全球 Android Auto 上線
Google 宣佈 Gemini 將取代 Google Assistant,成為 Android Auto 系統中的核心助手。Android Auto 是一種整合進數百萬輛汽車、卡車及 SUV 中的手機投影技術,允許使用者將導航、音樂及訊息等功能無線投射至車載螢幕。此次更新將讓使用者能透過自然對話完成更複雜的任務,並支援 45 種語言。自週四起,升級過從 Google Assistant 到 Gemini 手機版的 Android Auto 使用者即可開始使用。 Gemini 在行車中可協助使用者查詢沿途餐廳資訊,例如搜尋現在營業且靠近目的地的燒烤店,並提供熱門菜色或是否友善寵物等詳細資料。使用者還可透過 Gemini 回覆訊息,例如告知朋友自己被困在交通中並附上預計到達時間,或將訊息翻譯成其他語言後傳送。此外,Gemini 能存取 Gmail 郵件,協助使用者確認飯店地址並導航前往,或總結未讀郵件內容。 在音樂方面,使用者可要求 Gemini 根據特定指令建立播放清單,例如為家庭公路旅行製作長達三小時的輕快音樂,並與 YouTube Music、Spotify 等串流服務整合。使用者亦可透過「Hey, Google, let's chat」啟動對話模式,進行腦力激盪或學習新知,例如在前往聖路易斯參加婚禮時,請 Gemini 擔任旅遊導覽分享趣聞,或協助規劃拜訪新人父母家時的小禮物建議。 要使用此功能,使用者需確保手機安裝 Gemini 應用程式,並在車載螢幕上出現提示後,透過「Hey, Google」語音指令並點選螢幕麥克風按鈕或長按方向盤上的語音控制按鈕即可啟動。
-
辨識AI寫作的最佳指南來自維基百科
過去數個月,人們曾認為像「delve」或「underscore」等特定詞彙能識別大型語言模型,但證據薄弱且隨著模型變得更精進,這些特徵變得難以追蹤。然而,維基百科編輯團隊在 2023 年啟動的「Project AI Cleanup」專案中,成功產出一份詳盡且基於證據的公開指南,用於標記 AI 撰寫的文稿。該指南確認自動化工具基本無效,轉而關注在維基百科罕見但在一般網際網路和模型訓練資料中常見的寫作習慣。AI 提交內容常花費大量篇幅以通用術語強調主題重要性,例如使用「關鍵時刻」或「更廣泛的運動」等說法。此外,模型傾向詳細描述次要媒體報導,使主題顯得具重要性,這通常出現在個人傳記而非獨立來源中。指南特別指出一個有趣的特徵,即使用模糊的重要性宣告來結尾,例如說某事件或細節「強調了重要性」或「反映持續相關性」,這在語法上稱為現在分詞結構。另一種傾向是使用模糊的行銷語言,如描繪風景總是壯麗、視野總是令人驚嘆,這聽起來更像電視廣告的逐字稿。這份指南值得完整閱讀,雖然大型語言模型的文風發展迅速,但這些深植於訓練與部署習慣的特徵難以完全消除。若公眾更擅長識別 AI 文風,將可能引發各種有趣的後果。
-
印度TCS取得TPG資助半數資金用於20億美元AI數據中心計畫
印度 IT 巨頭塔塔諮詢服務公司(TCS)已從私募股權機構 TPG 獲得 10 億美元融資,作為一項多年期、總額 20 億美元的專案「HyperVault」的一部分,旨在在印度建設吉瓦級資料中心網路。此舉正值對 AI 運算需求激增,而企業難以建設所需的高耗能基礎設施。印度在 AI 運算方面的供需缺口尤為顯著:該國產生近 20% 的全球資料,卻僅佔全球資料中心容量的約 3%。大型科技公司和雲端供應商正投入數十億美元以擴大本地容量。透過 HyperVault,TCS 與 TPG 計劃開發液冷、高密度資料中心,具備支援主要雲端區域先進 AI 工作負載所需的電力與網路容量。液冷與高密度機架設計日益普及,因為用於 AI 推理和訓練的 GPU 比傳統 CPU 伺服器消耗更多電力並產生更多熱量。然而,這也引發了關於資源使用的擔憂,特別是印度面臨的水資源短缺問題。在孟買、班加羅爾和金奈等資料中心集中的城市,現有的水壓力可能使運營變得複雜。S&P Global 引用 Uptime Institute 的資料指出,1 MW 資料中心負載每年可能需要高達 2550 萬升水用於冷卻。快速建設 AI 資料中心還將進一步加劇印度電力供應和土地使用的瓶頸。儘管如此,全球科技公司仍將印度視為建設 AI 基礎設施的前沿。根據 S&P Global 資料,過去兩年本地和全球科技公司宣佈在該國擴大資料中心基礎設施的投資超過 320 億美元。2024 年 1 月,微軟宣佈在印度雲和 AI 基礎設施上投資 30 億美元,持續兩年;10 月,谷歌表示將花費 150 億美元在五年內於安得拉邦南部建設一個吉瓦級 AI 資料中心樞紐。2023 年,亞馬遜承諾到 2030 年投入 127 億美元建設 AWS 雲基礎設施。TCS 表示將與超規模雲服務商和 AI 公司合作設計、部署和運營 AI 基礎設施,計劃在初始階段建設約 12 吉瓦的容量。S&P Global 估計,未來五年印度新增資料中心容量超過
-
Wispr 繼其語音輸入應用程式受歡迎後,獲得 Notable Capital 的 2500 萬美元投資
美國語音 AI 公司 Wispr 的輸入應用程式 Wispr Flow 近期獲得顯著成長,使用者在連續使用三個月後,平均超過 50% 的輸入字元皆透過該應用程式完成。該公司已成功進入 270 家《財富》500 強企業,且過去幾週每週新增 125 家企業客戶。在 6 月由 Menlo Ventures 領投 3000 萬美元融資後,Wispr 又於近期獲得由 Notable Capital 領投、Steven Bartlett 的 Flight Fund 參與的 2500 萬美元追加融資,總融資額達 8100 萬美元。此輪融資後,公司估值達 7 億美元。Notable Capital 的 Hans Tung 將加入 Wispr 董事會擔任觀察員,他此前曾投資 Affirm、Airbnb、Slack、Coinbase、Anthropic 及 TikTok 等公司。 Wispr CEO Tanay Kothari 表示,自 6 月以來,Wispr Flow 的月增成長率達 40%,使用者規模年增 100 倍,且 12 個月留存率為 70%。儘管初期因非技術使用者發現應用後流失,公司已透過設計流程引導使用者將語音輸入應用至常用軟體。未來,Wispr 計劃推出 Android 版,預計年底進入測試階段,2025 年第一季正式上線,並擴充套件至更多平臺。公司正致力於開發自有語音模型,降低錯誤率,目前約為 10%,低於 OpenAI 的 Whisper(27%)與 Apple 原生轉錄(47%)。此外,Wispr 正測試其技術透過封閉 API 與企業及硬體夥伴合作,並希望未來能自動化處理如回覆郵件等任務,成為語音導向的作業系統。目前 Wispr 的競爭對手包括 YC 支援的 Willow、Aqua、Monologue、Typeless、TalkTastic、Superwhisper 及 BetterDictation 等。