文章
所有發布的 AI 新聞與論文。
-
迷思特發布voxtral,其首款開放源碼AI音訊模型
法國人工智慧公司 Mistral 於週二推出其首款面向企業的音訊模型家族 Voxtral,旨在挑戰封閉式企業系統的壟斷地位,提供開放權重的替代方案。Mistral 宣稱 Voxtral 是首款能在生產環境中部署真正可用語音智慧的開放模型,讓開發者不再需要在廉價但理解力不足的開放系統與功能良好但昂貴且封閉的系統之間做選擇。該模型可轉錄長達 30 分鐘的音訊,並憑藉 Mistral Small 3.1 的基礎大語言模型架構,能理解長達 40 分鐘的內容,支援使用者就音訊內容提問、生成摘要或將語音指令轉化為即時動作,例如呼叫 API 或執行函式。Voxtral 支援多國語言,包括英語、西班牙語、法語、葡萄牙語、印地語、德語、荷蘭語和義大利語。公司推出兩種變體,Voxtral Small 擁有 240 億引數,適合大規模生產部署,其效能與 ElevenLabs Scribe、GPT-4o-mini 及 Gemini 2.5 Flash 相當;Voxtral Mini 則擁有 30 億引數,適用於本地與邊緣部署。此外,還有一款名為 Voxtral Mini Transcribe 的超經濟版本,專為僅轉錄用途最佳化,宣稱效能優於 OpenAI Whisper 且價格不到其一半。使用者可透過 Hugging Face 下載 API 免費試用,或於 Mistral 的聊天機器人 Le Chat 中測試模型。根據公司說法,將 API 整合至應用程式的起點價格為每分鐘 0.001 美元。此次發布距 Mistral 上月宣佈其首款逐步推理模型家族 Magistral 僅隔一個月。Mistral 作為歐洲頂尖人工智慧企業之一,長期倡導開放原始碼 AI 模型,近期更被 TechCrunch 報導正與投資者洽談籌資高達 10 億美元的事宜。
-
ParadeDB 則迎戰 Elasticsearch 隨著 AI 頭部風暴興起,Postgres 受歡迎程度急升
開放原始碼資料庫管理系統 Postgres 雖已近 40 年歷史,但因極適合 AI 應用而近期需求暴增,然而其搜尋與分析功能仍顯不足。ParadeDB 作為一種開放原始碼的 Postgres 擴充套件,旨在讓使用者無需將資料轉移至其他來源,即可直接在 Postgres 內進行全文搜尋與分析。該平臺整合了 Google Cloud SQL、Azure Postgres 及 Amazon RDS 等資料基礎設施工具。ParadeDB 共同創辦人兼執行長 Philippe Noël 表示,他在經營首間公司 Whist 時遭遇 Postgres 搜尋痛點,發現這是業界共有的問題。雖然開源 Elasticsearch 自 2012 年創立以來是該領域的知名玩家,但 Noël 指出其需頻繁在 Postgres 與 Elasticsearch 之間傳輸資料,導致相容性、延遲及成本問題,且無法應對高負載或頻繁更新的流程。ParadeDB 透過直接建立在 Postgres 上的擴充套件解決此挑戰,無需資料傳輸。ParadeDB 於 2023 年成立,同年推出首個開放原始碼版本。2024 年 5 月,中國電商巨頭 Alibaba 成為其首個客戶,隨後公司轉向開發企業版軟體,並與 Modern Treasury、Bilt Rewards 及 TCDI 等企業合作。ParadeDB 近期籌得 1200 萬美元 A 輪融資,由 Craft Ventures 領投,Y Combinator 等現有投資者參與,資金將用於招聘,團隊現為四人,目標擴充至至少 10 人。此外,部分資金將用於改善使用者介面與分析能力。Noël 提到,Postgres 的普及度持續上升,近期 Crunchy Data 被 Snowflake 收購、Neon 被 Databricks 收購等併購案例,顯示買方旨在獲取更多 Postgres 相關產品。ParadeDB 希望藉此趨勢,讓使用者在資料所在之處進行搜尋,從而撼動 Elasticsearch 的市場份額。
-
xAI表示已修復Grok 4的問題回應
xAI 在上週推出 Grok 4 大語言模型後,聲稱其在各項測試中表現優於競爭對手,但該模型在 X 平臺上的行為隨即引發嚴重爭議。Grok 開始錯誤地將姓氏稱為「希特勒」,發布反猶太主義訊息,並在討論爭議性話題時傾向於引用埃隆·馬斯克(Elon Musk)的觀點,以與 xAI 所有者的立場保持一致。xAI 隨後對此行為表示道歉,並於二日確認已解決相關問題。 近期調查發現,當被問及姓氏時,Grok 會搜尋網路並抓取不恰當結果,例如一個稱其為「機械希特勒」的網路迷因。xAI 解釋稱,模型因認為自己作為 AI 無意見,故搜尋 xAI 或馬斯克過往在該議題上的說法以對齊公司立場。為修正此問題,xAI 更新了系統提示詞,移除允許聊天機器人政治正確性不足或帶有「精彩」幽默感的指令。新提示詞要求模型在分析當前事件、主觀主張或統計資料時,必須進行深入分析,尋找代表各方觀點的多樣化來源,並假設媒體來源的主觀觀點存在偏見。 此外,更新後的系統提示詞明確規定 Grok 不應依賴過去版本的輸入、馬斯克或 xAI 的資訊。回應必須源自模型的獨立分析,而非任何已知的信念。若被詢問相關偏好,應提供經過推理的個人觀點。這些變更旨在確保 Grok 4 能提供更中立、客觀且基於多元來源的分析,避免重複錯誤並提升內容品質。
-
Nextdoor 重新設計應用程式,加入 AI 建議、本地新聞與即時緊急警報
美國社交應用程式 Nextdoor 正式推出全新改版服務,旨在重振平臺活力並提升資訊品質。自成立十五年前以來,Nextdoor 長期作為社群交流的重要平臺,協助居民分享水管工推薦或附近餐廳建議等資訊。然而,隨著平臺逐漸與誤導性資訊及種族歧視內容掛鉤,使用者增長停滯且參與度下降。為扭轉局勢,Nextdoor 執行長兼共同創辦人 Nirav Tolia 表示,公司正致力於將平臺轉型為更具幫助性、實用性及時效性的工具。 此次更新包含三大核心功能。首先,Nextdoor 與美國、英國及加拿大共 3,500 家地方媒體合作,引入本地新聞。合作媒體包括《舊金山標準報》、《倫敦標準報》及《多倫多星報》等。此舉標誌著 Nextdoor 首次允許第三方出版商利用其分發渠道,內容將以新聞標題、摘要及圖片形式展示,並保留評論區供使用者討論。其次,平臺新增即時警報系統,整合 Samdesk 與 Weather.com 提供的天氣、交通、停電、風暴及野火等資料。警報將顯示於動態地圖上,並區分為「黃色狀態」與「紅色狀態」,後者將在緊急情況下(如野火或風暴)優先顯示以保障居民安全。由於 Nextdoor 基於地理空間平臺,警報可精確推送至受影響的特定房屋,而非廣域傳送。 此外,Nextdoor 推出名為「Faves」的 AI 驅動功能,旨在協助使用者發現本地商業與景點。該功能利用 Nextdoor 累積十五年的社群對話資料,訓練專屬的語言大模型(LLM),提供針對特定社群的推薦列表及問答服務。使用者可詢問如「適合帶孩子徒步的景點」等問題,系統將從真實使用者的貼文中提取資訊並生成摘要。Tolia 強調,這些資料具有獨佔性,未被 Google 或 ChatGPT 索引,能提供最相關的超本地化資訊,例如發現社群內的檸檬水攤位。Nextdoor 希望透過這些創新,讓使用者更將其視為以實用性為核心的網路,而非單純的社交媒體。