文章
所有發布的 AI 新聞與論文。
-
Anthropic 發佈 Sonnet 4.6
Anthropic 推出了其中型 Sonnet 模型的新版本,緊跟公司每四個月一次的更新週期。在發布公告中,Anthropic 強調了該模型在程式碼編寫、指令遵循以及電腦操作方面的改進。Sonnet 4.6 將成為免費版和專業版使用者的預設模型。Sonnet 4.6 的測試版將包含一百萬 token 的上下文視窗,這是之前 Sonnet 模型所能提供的最大視窗的兩倍。Anthropic 描述這個新的上下文視窗足以在一次請求中容納整個程式碼庫、長合約或數十篇研究論文。此次發布僅在 Opus 4.6 推出兩週後,預計 Haiku 模型的更新版本將在幾週內推出。此次發布伴隨著一組新的紀錄級 benchmark 分數,包括用於電腦操作的 OS World 和用於軟體工程的 SWE-Bench。但最令人印象深刻的是其在 ARC-AGI-2 測試中的 60.4% 分數,該測試旨在衡量特定於人類智慧的技能。此分數使 Sonnet 4.6 高於大多數可比模型,儘管它仍低於 Opus 4.6、Gemini 3 Deep Think 以及 GPT 5.2 的精修版本。
-
印度AI實驗室Sarvam新推出的模型是對開放源碼AI可行性的重大押注
印度人工智慧實驗室 Sarvam 於二日在印度新德里舉辦的印度 AI 影響峰會上,正式推出新一代大型語言模型。該公司希望透過較小且高效的開源 AI 模型,從美國和中國等競爭對手提供的昂貴系統中搶佔市場份額。此次發布的模型包含 300 億引數與 1050 億引數兩種版本,並搭配文字轉語音、語音轉文字及檔案解析等視覺模型。這組產品相比於 2024 年 10 月推出的 20 億引數 Sarvam 1 模型有顯著升級。新模型採用專家混合架構,僅在特定時刻啟用部分引數以大幅降低運算成本。300 億引數模型支援 32,000 token 的上下文視窗,適用於即時對話;而 1050 億引數模型則提供 128,000 token 視窗,專為複雜的多步驟推理任務設計。 Sarvam 宣稱這些模型是全新訓練而非基於現有開源系統微調。300 億引數模型在約 16 兆 token 的文字上進行預訓練,1050 億引數模型則涵蓋多種印度語言的兆級資料。這些模型旨在支援即時應用,包括印度語言的語音助手和聊天系統。1050 億引數模型被定位為與 OpenAI 的 GPT-OSS-120B 及阿里巴巴的 Qwen-3-Next-80B 競爭。模型訓練使用了印度政府支援的 IndiaAI Mission 提供的計算資源,基礎設施由 Yotta 支援,技術支援來自 Nvidia。Sarvam 執行長表示,公司將採取謹慎方式擴充套件模型,專注於實際應用而非單純追求規模。公司計劃將 300 億與 1050 億引數模型開源,但尚未說明是否公開訓練資料或完整訓練程式碼。此外,Sarvam 還計劃開發專注於程式碼的模型及企業工具,並推出名為 Samvaad 的對話式 AI 代理平臺。該公司成立於 2023 年,已籌資超過 4000 萬美元,投資方包括 Lightspeed Venture Partners、Khosla Ventures 及 Peak XV Partners。
-
印度薩爾瓦姆希望將其AI模型應用於功能手機、汽車和智慧眼鏡
印度人工智慧公司 Sarvam 計劃將其新發布的 AI 模型部署於 Nokia 和 HMD 的功能型手機、汽車以及其自身的智慧眼鏡上。該公司獲 Lightspeed、Peak XV 和 Khosla Ventures 等機構投資,在印度新德里舉行的印度 AI 影響峰會上表示,其使用的邊緣模型僅佔數百 KB 空間,可在配備現有處理器的多數手機上執行,並支援離線工作。Sarvam 正與 HMD 合作,將對話式 AI 助手引入 Nokia 和 HMD 手機。影片演示顯示,使用者可點選功能手機上的專用 AI 按鈕,以當地語言與 AI 助手對話,獲取政府計劃或當地市場指導。雖然尚不清楚活動中展示的所有 AI 功能是否均能離線執行,但 Sarvam 首席邊緣 AI 官 Tushar Goswamy 表示,透過邊緣 AI 旨在將智慧帶入每部手機、膝上型電腦、汽車乃至新一代裝置。該公司已與 Qualcomm 合作調優模型以適應其晶片,Qualcomm 則開發「主權 AI 體驗套件」以跨多種裝置執行。Sarvam 共同創始人 Vivek Raghavan 指出,與 Qualcomm 的合作將加速主權 AI 從研究到部署,使模型和應用更靠近邊緣執行,保護資料並準備大規模採用。此外,Sarvam 還與德國工程巨頭 Bosch 合作將 AI 助手引入汽車,並展示了在印度設計製造的 Sarvam Kaze 智慧眼鏡,該產品被稱為「建造者裝置」,預計於五月上市。該公司此前主要服務企業市場,提供以語音為核心的模型用於客戶支援等場景,此次新模型與合作顯示其正轉向消費級應用場景。
-
OpenAI 进入高等教育領域 印度推動擴大AI技能培訓
OpenAI 正擴大在印度的業務版圖,並透過與領先學術機構的夥伴關係進入該國高等教育體系。此舉正值南亞國家尋求擴大 AI 技能並建立本土能力,以應對全球最大人才市場之一的需求。OpenAI 表示,將與印度六所公立及私立高等教育機構合作,涵蓋頂尖的工程、管理、醫療及設計類學院,目標在未來一年內接觸超過 10 萬名學生、教職員及員工。該倡議不聚焦於消費端使用,而是將 AI 整合進核心學術功能,顯示 OpenAI 有意影響 AI 在教學、治理及普及化方面的方式。根據執行長 Sam Altman 說法,ChatGPT 在印度擁有超過 1 億月活躍使用者,印度已成為 OpenAI 第二大使用者群,僅次於美國。此公告亦與主要 AI 企業深化在印度存在的趨勢同步,印度本週正於新德里舉辦 AI 影響峰會。首批合作夥伴包括印度技術院德里、印度管理學院艾哈邁達巴德及全印度醫學科學院德里等具影響力機構,以及私立大學與專業設計學校。合作將涵蓋工程、管理、醫療及創意等領域。印度已成為 AI 在教育領域使用的關鍵測試場。上月,Google 表示印度是全球 Gemini 學習工具使用量最高的地區。微軟亦宣佈將擴充套件其在印度的 Elevate 技能培訓計劃,與政府機構合作,在學校、職業學院及高等教育機構培訓教師。OpenAI 表示,合作將涉及校園範圍內對 ChatGPT Edu 工具的存取、教職員培訓及負責任使用框架。重點在於將 AI 嵌入程式設計、研究、分析與案例研究等核心學術工作流,而非提供獨立工具存取。其中兩所合作夥伴機構,印度管理學院艾哈邁達巴德與曼尼帕爾高等教育部,將推出由 OpenAI 支援的認證課程。此外,OpenAI 將與 Physics Wallah、upGrad 及 HCL GUVI 等印度教育科技平臺合作,將 AI 培訓擴充套件至校園之外,這些平臺將推出關於 AI 基礎與 ChatGPT 使用案例的結構化課程,針對學生及初級職業人士。OpenAI 印度教育主管 Raghav Gupta 表示,教育機構是縮短快速進化的 AI 工具與實際使用之間差距的關鍵途徑,因為技能需求正隨經濟轉變。去年