跳至內容
AI 新聞站
返回

DeepSeek:關於這款AI對話應用的所有資訊

中國人工智慧實驗室 DeepSeek 近期因聊天機器人應用程式在 Apple App Store 及 Google Play 排名上升而引發全球關注。該實驗室由量化對沖基金高飛者資本管理(High-Flyer Capital Management)支援,該基金由梁文風於 2019 年創立,專注於開發人工智慧演演算法。DeepSeek 實驗室於 2023 年獨立成為公司,並自建立之初便自建資料中心叢集進行模型訓練。由於受美國出口管制影響,公司訓練模型時被迫使用較弱版本的英偉達 H800 晶片,而非 H100。

DeepSeek 技術團隊以年輕且高學歷為特色,積極招募來自中國頂尖大學的博士研究員,並聘請非電腦科學背景的人才以擴充套件知識領域。該公司在 2023 年 11 月推出首批模型,包括 DeepSeek Coder、DeepSeek LLM 和 DeepSeek Chat。2024 年春季推出的 DeepSeek-V2 系列模型在效能上表現優異且執行成本較低,迫使國內競爭對手如位元組跳動和阿里巴巴降低價格或免費提供服務。2024 年 12 月推出的 DeepSeek-V3 模型在內部測試中表現優於 Meta 的 Llama 和 OpenAI 的 GPT-4o。此外,其 R1 推理模型在關鍵測試指標上與 OpenAI 的 o1 模型相當,能夠自我事實核查,在物理、科學和數學領域更具可靠性。

然而,作為中國開發的人工智慧,DeepSeek 的模型需符合中國網際網路監管機構的要求,確保回應體現「社會主義核心價值觀」。例如,其聊天機器人不會回答關於天安門廣場或臺灣自治的問題。截至 3 月,DeepSeek 的日活躍使用者量已超過 1650 萬,雖低於 ChatGPT 的 5 億周活躍使用者,但增長迅速。DeepSeek 的商業模式不明確,產品定價遠低於市場價值,且未接受風險投資。儘管模型非完全開源,但允許商業使用,這導致開發者在其平臺上建立了超過 500 個衍生模型,總下載量達 250 萬。

DeepSeek 的成功對行業產生了巨大衝擊,導致英偉達股價在 1 月下跌 18%,並


分享這篇文章:

上一篇
加州州長紐森簽署歷史性AI安全法案SB 53
下一篇
AI recruiters Alex 筹得1700萬美元用於自動化初步職業 Interviews