文章
所有發布的 AI 新聞與論文。
-
OpenAI 推出新代理購物系統與 Google、Amazon 競爭
美國 ChatGPT 使用者現在可在對話中直接購買 Etsy 商品,並即將支援 Shopify 購物,這標誌著線上購物未來的重大進展。OpenAI 推出的「即時結帳」功能目前開放給使用 Pro、Plus 及免費版登入的使用者,針對美國 Etsy 賣家,預計超過一百萬 Shopify 商家(包括 Glossier、Skims、Spanx 和 Vuori)將陸續加入。此功能讓使用者無需離開對話即可點選「購買」確認訂單、運費及支付細節,支援 Apple Pay、Google Pay、Stripe 或信用卡。去年 Perplexity 已推出類似功能,Microsoft 則透過 Copilot 商家計劃提供類似服務。這種無摩擦體驗可能推動購物模式從 Google 搜尋引擎和 Amazon 轉向具備策展推薦與簡易結帳的對話式代理。若更多交易在 AI 聊天機器人內完成,其背後的企業將掌握更多產品曝光與佣金定價權。Google 與 Amazon 長期作為零售發現的守門人,若 OpenAI 成為新門戶,可能面臨競爭壓力。OpenAI 表示其展示結果為「有機且未贊助」,僅依相關性排序,並向商家收取「小額費用」。此外,OpenAI 將開放原始碼其驅動即時結帳的代理商務協議(ACP),該技術由 Stripe 支援,旨在讓其他商家與開發者整合代理結帳。Stripe 執行長 Will Gaybrick 指出,Stripe 正構建 AI 的經濟基礎設施,重新架構現有商業系統。儘管使用者可能擔憂隱私,OpenAI 強調訂單、支付與配送由商家透過現有系統處理,ChatGPT 僅作為安全傳遞資訊的中介。開放 ACP 將擴大 AI 聊天機器人作為虛擬商店的採用率,並可能使 OpenAI 成為 AI 商業生態系統事實上的架構師,這將與 Google 近期推出的由 AI 代理啟動的購買協議(AP2)產生張力。
-
DeepSeek 發佈「稀疏注意力」模型,將 API 使用成本減半
DeepSeek 研究團隊於本週一發布了名為 V3.2-exp 的新實驗模型,旨在大幅降低長上下文運算時的推論成本。該模型透過 Hugging Face 平臺及 GitHub 上的學術論文正式公佈,其核心技術稱為 DeepSeek Sparse Attention。此係統包含兩個主要模組:「閃電索引器」用於優先處理上下文視窗的特定片段,以及「細粒度標記選擇系統」則從這些片段中篩選出關鍵標記載入有限的注意力視窗。兩者結合使模型能在處理長上下文時保持較小的伺服器負載。初步測試顯示,在長情境下,簡單的 API 呼叫價格最高可降低一半。DeepSeek 基於中國,其 R1 模型曾因採用強化學習而引發關注,但此次推出的稀疏注意力方法雖可能不會造成同等規模的轟動,卻能為美國供應商提供降低推論成本的寶貴經驗。由於模型為開放權重且免費提供,第三方將很快能驗證相關聲稱。
-
AI recruiters Alex 筹得1700萬美元用於自動化初步職業 Interviews
求職者即將面臨更多初步篩選面試,但職位數量未必增加。招聘人員將將背景檢查、薪資需求及可用性等例行任務外包給人工智慧。Alex 是一家開發人工智慧招聘師的創業公司,其共同創辦人 Aaron Wang 表示,該公司的語音人工智慧工具可在申請後不久自動進行面試。Alex 的人工智慧招聘師每天進行數千場面試,協助全球頂尖企業錄用人才。其客戶涵蓋《財富》前 100 大企業、金融機構、全國性餐飲連鎖店及四大會計師事務所。儘管 Wang 未透露客戶名稱,但投資界視人工智慧面試師為必然趨勢。這促使 Alex 完成由 Peak XV Partners 領投的 1700 萬美元 A 輪融資,參與方包括 Y Combinator 和 Uncorrelated Ventures,以及多家未具名的《財富》前 500 大企業首席人力資源官。此輪融資緊接去年由 1984 Ventures 領投的 300 萬美元種子輪。Alex 並非唯一提供人工智慧招聘服務的企業,競爭對手包括 HeyMilo、ConverzAI 和 Ribbon。另一家快速成長的人工智慧資料標註公司 Mercor,估值達 100 億美元,其起源亦為人工智慧招聘。Alex 的長期願景是透過面試數百萬求職者,建立比 LinkedIn 更豐富深入的專業資料檔案。Wang 認為,10 分鐘的對話能提供比 LinkedIn 檔案更多的個人資訊。目前,Alex 專注於協助招聘人員節省時間,建立與預篩選候選人的關係,並為僱主提供建議。
-
DeepSeek:關於這款AI對話應用的所有資訊
中國人工智慧實驗室 DeepSeek 近期因聊天機器人應用程式在 Apple App Store 及 Google Play 排名上升而引發全球關注。該實驗室由量化對沖基金高飛者資本管理(High-Flyer Capital Management)支援,該基金由梁文風於 2019 年創立,專注於開發人工智慧演演算法。DeepSeek 實驗室於 2023 年獨立成為公司,並自建立之初便自建資料中心叢集進行模型訓練。由於受美國出口管制影響,公司訓練模型時被迫使用較弱版本的英偉達 H800 晶片,而非 H100。 DeepSeek 技術團隊以年輕且高學歷為特色,積極招募來自中國頂尖大學的博士研究員,並聘請非電腦科學背景的人才以擴充套件知識領域。該公司在 2023 年 11 月推出首批模型,包括 DeepSeek Coder、DeepSeek LLM 和 DeepSeek Chat。2024 年春季推出的 DeepSeek-V2 系列模型在效能上表現優異且執行成本較低,迫使國內競爭對手如位元組跳動和阿里巴巴降低價格或免費提供服務。2024 年 12 月推出的 DeepSeek-V3 模型在內部測試中表現優於 Meta 的 Llama 和 OpenAI 的 GPT-4o。此外,其 R1 推理模型在關鍵測試指標上與 OpenAI 的 o1 模型相當,能夠自我事實核查,在物理、科學和數學領域更具可靠性。 然而,作為中國開發的人工智慧,DeepSeek 的模型需符合中國網際網路監管機構的要求,確保回應體現「社會主義核心價值觀」。例如,其聊天機器人不會回答關於天安門廣場或臺灣自治的問題。截至 3 月,DeepSeek 的日活躍使用者量已超過 1650 萬,雖低於 ChatGPT 的 5 億周活躍使用者,但增長迅速。DeepSeek 的商業模式不明確,產品定價遠低於市場價值,且未接受風險投資。儘管模型非完全開源,但允許商業使用,這導致開發者在其平臺上建立了超過 500 個衍生模型,總下載量達 250 萬。 DeepSeek 的成功對行業產生了巨大衝擊,導致英偉達股價在 1 月下跌 18%,並