文章
所有發布的 AI 新聞與論文。
-
Google推出Gemini 3 Flash並將其設為Gemini應用的預設模型
Google 今日發布了快速且廉價的 Gemini 3 Flash 模型,該模型基於上月發布的 Gemini 3,旨在與 OpenAI 競爭。此模型將成為 Gemini 應用程式及搜尋 AI 模式中的預設模型,距離 Google 宣佈 Gemini 2.5 Flash 模式已過去六個月,帶來顯著改進。在測試中,Gemini 3 Flash 在無工具使用的情況下,於「人類最後考試」 benchmarks 獲得 33.7% 的成績,優於 Gemini 2.5 Flash 的 11%,並與 Gemini 3 Pro 的 37.5% 及 GPT-5.2 的 34.5% 相當。在 MMMU-Pro 多模態與推理 benchmarks 上,該模型以 81.2% 的成績超越所有競爭對手。 Google 已在全球範圍內將 Gemini 3 Flash 設為 Gemini 應用程式的預設模型,取代 Gemini 2.5 Flash,使用者仍可選擇 Pro 模型處理數學與編碼問題。新模型擅長識別多模態內容,例如上傳pickleball 短影片獲取建議、繪製草圖讓模型猜測內容,或上傳音訊進行分析與生成測驗。此外,使用者還可透過提示詞在應用程式中建立應用原型。Gemini 3 Pro 現已對美國所有人開放,用於搜尋,更多美國使用者也能訪問 Nano Banana Pro 影象模型。 企業與開發者方面,JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已使用 Gemini 3 Flash,該模型透過 Vertex AI 和 Gemini Enterprise 提供。開發者可透過 API 和 Antigravity 編碼工具預覽該模型。Gemini 3 Pro 在 SWE-bench 驗證編碼 benchmarks 上得分 78%,僅次於 GPT-5.2。該模型適合影片分析、資料提取和視覺問答,因速度快而適用於快速重複工作流程。定價為每百萬輸入 token 0.50 美元,每百萬輸出 token 3.00 美元,略高於 Gemini Flash 2.5 的 0.30 美元和 2.50 美元,但 Google 聲稱新模型效能優於 Gemini 2.5 Pro 且速度快三倍,思考任務平均減少 30% 的 token 使用。
-
亞馬遜任命長期擔任AWS高層的彼得·德桑提斯領導新成立的AI部門
亞馬遜執行長安迪·賈西於週三透過內部訊息宣佈,資深 AWS 執行長彼得·德桑提斯將領導公司新成立的專注於人工智慧組織。該組織將負責亞馬遜的人工智慧模型如 Nova、矽晶片開發以及量子計算等領域,旨在提升人工智慧工具的效能與速度。德桑提斯在亞馬遜服務了 27 年,其中 8 年擔任 AWS 副總裁,而 AWS 作為雲端服務供應商,支撐了約三分之一的網際網路運作。在 AWS 近期舉辦的 re:Invent 活動中,亞馬遜強調了對企業級人工智慧的承諾,因此從 AWS 領導層中分拆出新團隊合情合理。賈西表示,隨著 Nova 2 模型剛在 re:Invent 上推出、自製矽晶片快速成長,以及跨模型、晶片、雲端軟體與基礎設施進行最佳化的優勢,公司希望讓彼得能專注於這些新領域的創新與領導。亞馬遜對人工智慧的日益重視,正值公司渴望在人工智慧競賽中鞏固地位,或許更傾向透過投資而非自身創新來達成。上月,AWS 宣佈投資 500 億美元於美國政府的人工智慧基礎設施。此外,亞馬遜正與 OpenAI 洽談投資 100 億美元,且已投資 80 億美元於 OpenAI 的競爭對手 Anthropic。
-
Adobe遭提議集體訴訟 被指控濫用作者作品用於AI訓練
Adobe 公司因被指控使用盜版書籍訓練其 AI 模型而面臨訴訟。原告 Elizabeth Lyon 代表一類集體訴訟,聲稱 Adobe 在其 SlimLM 小型語言模型訓練過程中使用了包括她本人在內的盜版書籍。SlimLM 被描述為一種可最佳化於移動裝置文件輔助任務的模型系列,其預訓練資料集 SlimPajama-627B 據稱由 Cerebras 於 2023 年 6 月發布。Lyon 指出,SlimPajama 資料集是透過複製和操縱 RedPajama 資料集(包括 Books3)建立而成,因此包含 Books3 資料集中的受版權保護作品。Books3 是一個包含 191,000 本書籍的龐大集合,常被用於訓練生成式 AI 系統,且已成為科技界法律糾紛的來源。近期,Apple 和 Salesforce 也分別被指控使用類似資料集訓練其 AI 模型。此前,Anthropic 已同意向作者支付 15 億美元以解決類似訴訟。這些案件顯示,AI 訓練資料中可能包含未經授權的盜版材料,正引發廣泛的法律挑戰。
-
Vibe-coding 新創公司 Lovable 融資 3.3 億美元,評價達 66 億美元
瑞典情緒編碼起點公司 Lovable 在短短五個月內估值增長超過三倍。該公司於週四宣佈完成由 CapitalG 和 Menlo Ventures 領投的 B 輪融資,籌資額達 3.3 億美元,使公司估值達到 66 億美元。此次融資參與方包括 Khosla Ventures、Salesforce Ventures 以及 Databricks Ventures 等機構。此輪融資僅在數月前該公司完成 A 輪融資後不久,當時 A 輪籌資 2 億美元,估值為 18 億美元。Lovable 是資本化利用 AI 浪潮最快的公司之一,其開發的「情緒編碼」工具允許使用者透過文字提示生成程式碼並構建完整應用。公司於 2024 年推出,增長速度極快,在八個月內達到 1 億美元年度經常性收入里程碑,僅四個月後又翻倍超過 2000 萬美元。該公司擁有 Klarna、Uber 和 Zendesk 等知名軟體客戶,聲稱其平臺每天構建超過 10 萬個新專案,首年建立專案超過 2500 萬個。Lovable 表示將利用新資金深化與第三方應用的整合,擴充套件企業級功能,並完善構建完整應用所需的基礎設施,如資料庫、支付和託管服務。Lovable 聯合創始人兼 CEO Anton Osika 在今年於芬蘭赫爾辛基舉行的 Slush 會議上表示,公司能夠規模化得益於他拒絕投資者將公司遷往矽谷的建議。Osika 強調,只要擁有強烈的使命和緊迫感,可以在本國建立全球 AI 公司,並指出當地人才資源豐富。此外,該公司在 11 月因未繳納歐盟適用的大多數商品和服務徵收的增值稅而受到批評,Osika 確認此事並承諾將補繳稅款,同時反駁了關於歐盟不適合高增長創業公司的觀點。情緒編碼仍是風險投資的熱門領域,另一家情緒編碼公司 Cursor 也在 11 月籌資 23 億美元,估值達 293 億美元,其估值在六月至十一月間翻倍。