來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
和聲科技推出AI聊天機器人應用程式
Harmonic 是一家由 Robinhood 執行長 Vlad Tenev 共同創立的 AI 新創公司,於本週一宣佈推出 iOS 和 Android 平臺的聊天機器人應用程式,讓使用者能使用其 AI 模型 Aristotle。Harmonic 宣稱 Aristotle 能提供涉及數學推理問題的「無幻覺」答案,這在當前 AI 模型可靠性問題的背景下是一個大膽的宣稱。該公司專注於創造「數學超級智慧」或 MSI,最終希望協助依賴數學的所有領域,包括物理、統計學和電腦科學。Harmonic 執行長兼共同創辦人 Tudor Achim 表示,Aristotle 是首款能進行推理並正式驗證輸出結果的產品,在支援的定量推理領域中,他們保證沒有幻覺。 Harmonic 計劃未來推出 API 讓企業存取 Aristotle,並為消費者提供網頁應用程式。據稱,Aristotle 在 2025 年國際數學奧林匹克(IMO)的正式測試中獲得金牌,該測試將題目翻譯成機器可讀格式。Google 和 OpenAI 開發的 AI 模型雖在今年 IMO 中也獲得金牌,但這是透過非正式的自然語言測試取得的。Harmonic 目前尚未發布其他基準測試。Aristotle 的測試版推出僅在 Harmonic 於 Kleiner Perkins 領銜的 B 輪融資中籌得 1 億美元後幾週,當時估值為 8.75 億美元。 Achim 指出,Harmonic 透過讓 Aristotle 使用開源程式語言 Lean 產生回應來實現超準確的解決方案。在給出答案前,模型會透過不涉及 AI 的演演算法過程進行雙重檢查以確保正確性。Harmonic 執行長表示,類似技術用於醫療裝置和航空等高風險領域的輸出驗證。儘管在狹窄領域實現無幻覺表現極具挑戰性,研究發現即使是領先的 AI 模型也會產生大量幻覺,且問題似乎並未改善,OpenAI 最新的 AI 推理模型甚至比舊版幻覺更多。
-
微軟Edge現已成為具備Copilot模式的AI瀏覽器
微軟於本週一推出 Edge 瀏覽器新功能 Copilot Mode,允許使用者在瀏覽網頁時獲得 AI 協助。此功能旨在讓 AI 理解使用者的研究內容、預測需求並代為執行行動,目前仍被視為實驗性功能,預設為選開模式,且對擁有 Copilot 存取權的 Mac 或 PC 使用者免費。啟用後,Edge 使用者將看到新的標籤頁,可透過 Copilot 搜尋、聊天與導航。在特定網頁上,使用者可直接詢問 AI 協助,例如將食譜改為素食並建議替代食材,或要求直接呈現食譜以跳過冗長介紹,無需貼上內容。此外,Copilot 可代為預訂預約、建立購物清單及撰寫內容,這種「代理式」用網是 AI 瀏覽器競賽的下一步,但消費者採用率尚不明確。目標是簡化日常任務,如透過 Booking.com 或 Kayak 預訂房間與航班,雖與人工操作速度取決於熟練度,但 Copilot 支援語音輸入,對科技不熟或行動不便者尤為便利。未來使用者可提供更多上下文以管理更複雜行動。Copilot 還具備研究夥伴功能,經使用者許可可檢視所有開啟標籤以瞭解瀏覽內容,適用於產品比較或跨網站查詢航班與酒店價格。未來將推薦下一步行動以延續專案。微軟強調僅在使用者同意且透明視覺提示下才存取瀏覽內容,但允許 AI 監聽與檢視瀏覽行為可能引發部分使用者不安。
-
Anthropic 發佈新使用限制以抑制 Claude Code 強用者力量
安提洛普公司(Anthropic)宣佈將為其 Claude 系列產品實施新的每週速率限制,旨在遏制部分訂閱者持續在背景中執行 AI 編碼工具 Claude Code 的行為,並防止使用者違反使用政策,例如共享賬號和轉售訪問許可權。這些新限制將於 8 月 28 日生效,適用於 Pro 計劃(每月 20 美元)、Max 計劃(每月 100 美元和 200 美元)的訂閱者。公司估計此措施將影響不到 5% 的訂閱者。 此次更新保留了現有的每五小時重置的使用限制,並新增兩項每週重置的限制:一項為總體使用限制,另一項則針對最先進的 AI 模型 Claude Opus 4。Max 計劃的訂閱者可以超出速率限制,以標準 API 價格購買額外使用量。安提洛普表示,自推出以來,Claude Code 面臨前所未有的需求,過去一個月該工具已發生至少七次部分或重大停機,部分原因被歸咎於部分重度使用者的非連續執行。 關於具體使用量,Pro 使用者每週可預期獲得 40 至 80 小時的 Sonnet 4 使用時間。每月 100 美元的 Max 計劃使用者可獲得 140 至 280 小時的 Sonnet 4 及 15 至 35 小時的 Opus 4 使用時間。每月 200 美元的 Max 計劃使用者則可獲得 240 至 480 小時的 Sonnet 4 及 24 至 40 小時的 Opus 4 使用時間。公司強調,使用量可能因程式碼庫大小等因素而有所不同,並聲稱每月 200 美元的 Max 計劃提供的使用量是 Pro 計劃的 20 倍。速率限制是在觸及特定 token 數量時啟動,而非基於時間限制。安提洛普承諾未來將透過其他選項支援長期執行用例,但認為這些限制有助於短期內維持廣泛服務的可靠性。此舉發生在 Cursor 和 Replit 等編碼工具提供商近期調整定價策略之後。
-
為何Dispo共同創辦人從社交媒體躍進鋼鐵製造領域
Daniel Liss,社交網路 Dispo 和約會應用程式 Teaser AI 的共同創辦人,深信自己發現了下一個重大趨勢:鋼鐵製造。這一切的起點源於他為 TechCrunch 撰寫的關於社交媒體反壟斷執法的專欄文章,這些評論引起了華盛頓特區相關人士的注意,並邀請他於 2023 年春季擔任美國國家戰爭學院舉辦的戰爭遊戲結業演習的客座評審。該演習模擬了美國與中國為爭奪臺灣及南海主權而進行的衝突。Liss 從中得出的結論是,民主武裝的核心供應鏈——即他祖父曾奮戰的戰艦——目前缺乏造船能力,更遑論製造這些戰艦所需的鋼鐵。這讓他對鋼鐵供應鏈產生了極大的興趣,甚至達到痴迷的程度,這也標誌著 Nemo Industries 的誕生。 Nemo Industries 的基本理念結合了美國對鋼鐵製造和人工智慧的焦慮。該公司目前處於隱形運作狀態,但 Liss 透露其核心計畫是利用人工智慧最佳化生鐵生產,現代化這個據稱過時的產業。Liss 指出,這些工廠目前執行於 Excel 試算表甚至剪貼簿技術,儘管操作人員擁有不可思議的專業知識,但這種模式難以擴充套件。然而,Liss 並非僅將 Nemo 定位為工業軟體,公司計畫自建高爐。此決定基於 Liss 的信念,即從一開始就採用人工智慧的公司將比競爭對手擁有 20% 到 30% 的利潤率優勢。在鋼鐵製造領域,這種信念成本高昂,例如 Hyundai Motor Group 於三月宣佈將在路易斯安那州建造一座價值 60 億美元的鋼鐵廠。Nemo 的工廠可能不會花費那麼多,因為其專注於生鐵,這是鋼鐵製造商用於生產各種合金的中間產品。Nemo 將使用天然氣點燃高爐,其釋放的二氧化碳比常用的煤炭少。Liss 表示公司考慮捕捉高爐的碳汙染,且《通膨減法法案》引入的稅收優惠措施基本 intact,這使該企圖對 Nemo 有利可圖。 Nemo 的合夥人是 Michael DuBose,他曾於 Cheniere Energy 工作,該公司是一家天然氣公司,Liss 稱其已建立數十億美元的液化天然氣基礎設施。根據 PitchBook 的