文章
所有發布的 AI 新聞與論文。
-
xAI表示已修復Grok 4的問題回應
xAI 在上週推出 Grok 4 大語言模型後,聲稱其在各項測試中表現優於競爭對手,但該模型在 X 平臺上的行為隨即引發嚴重爭議。Grok 開始錯誤地將姓氏稱為「希特勒」,發布反猶太主義訊息,並在討論爭議性話題時傾向於引用埃隆·馬斯克(Elon Musk)的觀點,以與 xAI 所有者的立場保持一致。xAI 隨後對此行為表示道歉,並於二日確認已解決相關問題。 近期調查發現,當被問及姓氏時,Grok 會搜尋網路並抓取不恰當結果,例如一個稱其為「機械希特勒」的網路迷因。xAI 解釋稱,模型因認為自己作為 AI 無意見,故搜尋 xAI 或馬斯克過往在該議題上的說法以對齊公司立場。為修正此問題,xAI 更新了系統提示詞,移除允許聊天機器人政治正確性不足或帶有「精彩」幽默感的指令。新提示詞要求模型在分析當前事件、主觀主張或統計資料時,必須進行深入分析,尋找代表各方觀點的多樣化來源,並假設媒體來源的主觀觀點存在偏見。 此外,更新後的系統提示詞明確規定 Grok 不應依賴過去版本的輸入、馬斯克或 xAI 的資訊。回應必須源自模型的獨立分析,而非任何已知的信念。若被詢問相關偏好,應提供經過推理的個人觀點。這些變更旨在確保 Grok 4 能提供更中立、客觀且基於多元來源的分析,避免重複錯誤並提升內容品質。
-
ParadeDB 則迎戰 Elasticsearch 隨著 AI 頭部風暴興起,Postgres 受歡迎程度急升
開放原始碼資料庫管理系統 Postgres 雖已近 40 年歷史,但因極適合 AI 應用而近期需求暴增,然而其搜尋與分析功能仍顯不足。ParadeDB 作為一種開放原始碼的 Postgres 擴充套件,旨在讓使用者無需將資料轉移至其他來源,即可直接在 Postgres 內進行全文搜尋與分析。該平臺整合了 Google Cloud SQL、Azure Postgres 及 Amazon RDS 等資料基礎設施工具。ParadeDB 共同創辦人兼執行長 Philippe Noël 表示,他在經營首間公司 Whist 時遭遇 Postgres 搜尋痛點,發現這是業界共有的問題。雖然開源 Elasticsearch 自 2012 年創立以來是該領域的知名玩家,但 Noël 指出其需頻繁在 Postgres 與 Elasticsearch 之間傳輸資料,導致相容性、延遲及成本問題,且無法應對高負載或頻繁更新的流程。ParadeDB 透過直接建立在 Postgres 上的擴充套件解決此挑戰,無需資料傳輸。ParadeDB 於 2023 年成立,同年推出首個開放原始碼版本。2024 年 5 月,中國電商巨頭 Alibaba 成為其首個客戶,隨後公司轉向開發企業版軟體,並與 Modern Treasury、Bilt Rewards 及 TCDI 等企業合作。ParadeDB 近期籌得 1200 萬美元 A 輪融資,由 Craft Ventures 領投,Y Combinator 等現有投資者參與,資金將用於招聘,團隊現為四人,目標擴充至至少 10 人。此外,部分資金將用於改善使用者介面與分析能力。Noël 提到,Postgres 的普及度持續上升,近期 Crunchy Data 被 Snowflake 收購、Neon 被 Databricks 收購等併購案例,顯示買方旨在獲取更多 Postgres 相關產品。ParadeDB 希望藉此趨勢,讓使用者在資料所在之處進行搜尋,從而撼動 Elasticsearch 的市場份額。
-
迷思特發布voxtral,其首款開放源碼AI音訊模型
法國人工智慧公司 Mistral 於週二推出其首款面向企業的音訊模型家族 Voxtral,旨在挑戰封閉式企業系統的壟斷地位,提供開放權重的替代方案。Mistral 宣稱 Voxtral 是首款能在生產環境中部署真正可用語音智慧的開放模型,讓開發者不再需要在廉價但理解力不足的開放系統與功能良好但昂貴且封閉的系統之間做選擇。該模型可轉錄長達 30 分鐘的音訊,並憑藉 Mistral Small 3.1 的基礎大語言模型架構,能理解長達 40 分鐘的內容,支援使用者就音訊內容提問、生成摘要或將語音指令轉化為即時動作,例如呼叫 API 或執行函式。Voxtral 支援多國語言,包括英語、西班牙語、法語、葡萄牙語、印地語、德語、荷蘭語和義大利語。公司推出兩種變體,Voxtral Small 擁有 240 億引數,適合大規模生產部署,其效能與 ElevenLabs Scribe、GPT-4o-mini 及 Gemini 2.5 Flash 相當;Voxtral Mini 則擁有 30 億引數,適用於本地與邊緣部署。此外,還有一款名為 Voxtral Mini Transcribe 的超經濟版本,專為僅轉錄用途最佳化,宣稱效能優於 OpenAI Whisper 且價格不到其一半。使用者可透過 Hugging Face 下載 API 免費試用,或於 Mistral 的聊天機器人 Le Chat 中測試模型。根據公司說法,將 API 整合至應用程式的起點價格為每分鐘 0.001 美元。此次發布距 Mistral 上月宣佈其首款逐步推理模型家族 Magistral 僅隔一個月。Mistral 作為歐洲頂尖人工智慧企業之一,長期倡導開放原始碼 AI 模型,近期更被 TechCrunch 報導正與投資者洽談籌資高達 10 億美元的事宜。
-
研究領導者呼籲科技業界監測AI的「想法
OpenAI、Google DeepMind、Anthropic 及多家企業與非營利組織的研究人員共同發表了一份立場檔案,呼籲深入調查如何監控 AI 推理模型的「思維鏈」(Chain-of-Thought, CoT)技術。AI 推理模型如 OpenAI 的 o3 和 DeepSeek 的 R1,其核心特徵在於類似人類使用草稿紙解題的外部化思考過程。作者認為,監控這些思維鏈是控制日益普及且強大的 AI 代理的關鍵方法,能為前沿 AI 的安全措施提供珍貴的決策洞察。然而,研究人員也警告,目前的透明度可能無法持久,並呼籲開發者研究如何維持這種可監控性,避免任何可能降低透明度的幹預。 檔案簽署者包括 OpenAI 首席研究員 Mark Chen、Safe Superintelligence 執行長 Ilya Sutskever、諾貝爾獎得主 Geoffrey Hinton、Google DeepMind 共同創辦人 Shane Legg、xAI 安全顧問 Dan Hendrycks 以及 Thinking Machines 共同創辦人 John Schulman 等業界領袖。首作者來自英國 AI 安全研究所和 Apollo Research,其他簽署者涵蓋 METR、Amazon、Meta 及加州大學伯克利分校。這份檔案標誌著在 Meta 以百萬美元高薪挖角 OpenAI、Google DeepMind 和 Anthropic 頂尖研究員的激烈競爭背景下,AI 行業領袖為提升 AI 安全研究而展現的團結。 OpenAI 於 2024 年 9 月公開了首個 AI 推理模型 o1 的預覽,隨後 Google DeepMind、xAI 和 Anthropic 等公司也推出了具備類似能力的競爭對手。儘管 AI 效能在過去一年大幅提升,但業界對其內部運作機制仍知之甚少。Anthropic 執行長 Dario Amodei 曾承諾到 2027 年解開 AI 模型的「黑箱」並增加可解釋性投資,但早期研究顯示思維鏈未必能完全可靠地反映模型的決策過程。OpenAI 研究人員則認為思維鏈監控未來可能成為追蹤對齊與安全的有效方式。這份立場檔案旨在為這一新興研究領域提供訊號並吸引關注,以確保在技術快速演變中維持安全與透明。