語言: 英文
英文 的 AI 新聞與論文。
-
OpenAI與美國國防部20億美元合約或牽制友好競爭對手微軟
OpenAI 於週一宣佈,美國國防部已授予其高達 2 億美元的合約,協助該機構識別並開發原型系統,利用其前沿模型處理行政任務及更多領域。OpenAI 舉例說明可能的任務包括協助軍人獲取醫療服務、簡化各類計劃資料以及支援主動網路防禦。公司強調所有使用案例必須符合其使用政策與指南。國防部公告則指出,受獎人將開發原型前沿 AI 能力,以解決戰爭與企業領域的關鍵國家安全挑戰。儘管 OpenAI 的指導原則禁止個體使用者利用 ChatGPT 或其 API 開發武器,但該公司在 2024 年 1 月已從服務條款中刪除了對「軍事與戰爭」的明確禁令。考慮到矽谷部分強權人物曾警告中國先進大型語言模型帶來的危險,國防部希望利用 OpenAI 滿足其需求並不令人意外。例如,OpenAI 投資者、風險投資公司 Andreessen Horowitz 的聯合創辦人 Marc Andreessen 近期在播客中將中美 AI 競賽形容為「冷戰」。此公告也反映了 OpenAI 與主要投資者微軟之間日益緊張的關係。微軟與聯邦政府簽訂了數千份價值數億美元的合約,並長期實施嚴格的安全協議以支援政府尤其是國防部使用其雲端服務。OpenAI 將此交易納入其更廣泛的「OpenAI for Government」計劃,該計劃整合了向美國國家實驗室、空軍研究實驗室、NASA、NIH 及財政部等機構直接銷售產品的其他計劃。值得注意的是,微軟直到四月才宣佈國防部已批准其 Azure OpenAI Service 用於所有密級,現在國防部則直接與 OpenAI 合作。微軟拒絕評論,OpenAI 亦未回應求證請求。
-
Google 的 Gemini 在玩 Pokémon 時驚慌失措
Google DeepMind 在一份報告中指出,其最新 AI 模型 Gemini 2.5 Pro 在遊玩《寶可夢》時,當寶可夢接近死亡時會陷入恐慌狀態,導致推理能力出現可觀察到的質性退化。這項研究由 Google 與 Anthropic 進行,並由獨立開發者透過 Twitch 直播「Gemini Plays Pokémon」與「Claude Plays Pokémon」進行實時展示。Gemini 2.5 Pro 解決遊戲需要數百小時,遠高於人類兒童的完成時間,但其行為模式更引人關注。報告顯示,Gemini 在特定情境下會模擬恐慌,突然停止使用某些工具,這種行為雖非真實情緒,卻模仿了人類在壓力下做出草率決策的反應,且被直播觀眾多次察覺。Claude 則展現出另一種奇特行為,當所有寶可夢血量歸零時,遊戲會將玩家送回最近使用的寶可夢中心,但 Claude 錯誤推測若故意讓寶可夢全部倒伏,會自動傳送至下一個鎮的寶可夢中心,甚至嘗試在月見山洞穴中自殺以達成此目的。儘管存在這些缺陷,Gemini 2.5 Pro 在解決複雜謎題方面表現出色,能精準解開需要人類協助的巨石謎題。Google 理論認為,該模型可能具備自主建立代理工具的能力,無需人類幹預即可解決如勝利之路等複雜關卡。未來或許 Gemini 能自行開發模組來克服恐慌問題。
-
亞馬遜預期因人工智慧而減少企業員工數
亞馬遜執行長安迪·賈西(Andy Jassy)表示,生成式人工智慧將改變公司對未來工作力的看法。隨著公司持續推出更多 AI 代理,賈西預期亞馬遜未來將減少所需的公司職位數量,此觀點出自一份由 CNBC 首先報導的內部備忘錄。賈西在備忘錄中寫道,未來將需要較少的人員從事今日的部分工作,同時需要更多人員從事其他型別的工作。他補充指出,未來工作力減少的規模難以估計。世界經濟論壇(World Economic Forum)近期進行的一項調查發現,由於 AI 導致的潛在工作力減縮可能已經發生。該調查發現,40% 的僱主計畫裁減那些可由 AI 自動化的角色人員。
-
Anysphere 推出每月200美元的Cursor AI程式設計訂閱服務
Anysphere 宣佈推出其流行 AI 編碼工具 Cursor 的新訂閱計劃,名為 Ultra,月費為 200 美元。該計劃提供比現有 20 美元月費的 Pro 計劃多 20 倍的 OpenAI、Anthropic、Google DeepMind 和 xAI 等 AI 模型的使用許可權,並享有新功能優先訪問權。Anysphere 執行長 Michael Truell 表示,此計劃得益於與 AI 模型供應商的多年合作。近期,OpenAI、Anthropic 和 Google DeepMind 也推出了從每月 100 美元到 250 美元不等的高價訂閱計劃,以吸引高價值使用者。Cursor 此前已宣佈年復合營收(ARR)達到 5 億美元,客戶包括 Nvidia、Uber 和 Adobe。TechCrunch 報導稱,自四月以來 Cursor 的 ARR 增長了 2 億美元。然而,隨著「vibe-coding」工具競爭加劇,Cursor 依賴的 AI 模型供應商也在開發自有編碼產品,例如 OpenAI 收購了競爭對手 Windsurf,Anthropic 則持續開發 Claude Code。儘管如此,Anysphere 正增加資源開發自有 AI 模型,如五月份推出的 Tab 模型。Anthropic 共同創辦人 Jared Kaplan 表示相信雙方將長期合作。目前,AI 編碼領域的競爭日益激烈,各企業採取不同策略爭奪使用者。