分類: 觀點與分析
「觀點與分析」分類的 AI 新聞與論文。
-
開放原始碼專案中,AI程式工具是把雙刃劍
隨著 AI 編碼工具日益強大,軟體開發成本似乎大幅降低,這讓許多分析師擔憂傳統軟體公司將面臨生存危機,甚至預測軟體工程師的職將被取代。然而,對於使用代理技術處理資源限制的開源軟體專案而言,情況並非如此樂觀。業界專家指出,AI 編碼工具帶來的問題與解決的問題數量相當,其易用性導致大量低質碼湧入,威脅開源專案的穩定性。 在 VLC 專案中,VideoLAN 組織執行長 Jean-Baptiste Kempf 表示,來自初級開發者的合併請求品質極差,儘管 AI 對資深開發者建立新模組仍有助益,但維護難度大增。Blender 專案的執行長 Francesco Siddi 也指出,LLM 輔助貢獻浪費了審查員時間並影響動機,目前該專案尚未正式推薦或強制開發者使用 AI 工具。為了應對合併請求洪流,開發者 Mitchell Hashimoto 推出了限制 GitHub 貢獻者須經認證的系統,而 cURL 專案創辦人 Daniel Stenberg 則因被「AI 垃圾」淹沒而暫停其漏洞獎勵計劃。 開源專案面臨的更大挑戰在於優先順序的差異。大型企業如 Meta 重視新程式碼與產品,而開源專案則更關注穩定性。Kempf 提到,在開源生態中,撰寫程式碼能帶來晉升,但維護則無此激勵。投資者 Konstantin Vinogradov 分析認為,AI 加速了程式碼庫增長與相互依賴度,卻未能同步增加有技能的維護者數量。若將工程視為管理複雜度的過程,AI 編碼工具可能使情況更惡化。最終,AI 並未增加活躍且具備技能的維護者數量,只是賦予了優秀者更多權力,而開源專案面臨的大量工作與人力不足的根本問題依然存在。
-
最先出現 burnout 記徵的人,往往是 AI 技術最熟練的使用者
美國職場文化中,最誘人的敘事並非人工智慧會取代工作,而是會拯救人們脫離工作。產業過去三年向數百萬焦慮的民眾推廣此觀點,認為人工智慧是力量倍增器,能讓律師、顧問、程式設計員等白領工作變得更加不可或缺,讓人們工作更輕鬆且人人受益。然而,哈佛商業評論發表的新研究指出,這一前提導致的實際結論並非生產力革命,而是公司面臨成為倦怠機器的風險。 伯克利大學的研究人員在一家擁有兩百人的科技公司的內部進行八個月的觀察,並進行了超過四十次深度訪談。他們發現,該公司並未施壓員工達成新目標,但由於人工智慧工具讓更多工變得可行,員工開始在午餐時間和晚間工作。待辦事項清單填滿了所有被節省下來的時間,甚至更多。一名工程師表示,原本以為人工智慧能節省時間讓人少工作,結果是工作時數相同甚至更多。Hacker News 論壇上也有使用者反映,團隊採用人工智慧工作模式後,期望值與壓力都增加了三倍,但實際生產力僅提升約百分之十,領導層要求證明投資價值,導致員工必須延長工作時間。 這項研究並非全新,去年夏季一項試驗發現,使用人工智慧工具的資深開發者認為自己任務快百分之二十,實際卻花了百分之十九更久。國家經濟研究局另一項追蹤數千個職場的研究也發現,生產力增益僅為時間節省百分之三,對薪資或工作時數無顯著影響。儘管其他研究被質疑,這項研究因確認人工智慧能增強員工能力,卻揭示了其後果:疲勞、倦怠,以及隨著組織對速度與反應的期望上升,工作變得難以抽身。產業認為幫助人們做更多是解決一切的答案,但這可能只是另一種問題的開始。
-
或許AI代理可以成為律師
上個月作者曾提及 Mercor 推出的新基準測試,該測試評估 AI 代理在律師法務與企業分析等專業任務上的能力。當時各大實驗室得分均低於 25%,因此推斷律師暫時無需擔心被 AI 取代。然而,AI 能力僅需數週即可發生顯著變化。本週 Anthropic 發布的 Opus 4.6 模型大幅震動了排行榜,該模型在單次嘗試中得分接近 30%,在經過幾次嘗試後平均得分達到 45%。值得注意的是,此次發布包含「代理群組」等新功能,可能有助於解決多步驟問題。儘管如此,該分數相比前一個最優水平仍有巨大提升,顯示基礎模型進展並未放緩。Mercor 執行長 Brendan Foody 對此印象深刻,他稱從 18.4% 躍升至 29.8% 僅用數個月是「不可思議」的。雖然 30% 距離 100% 仍有長路,律師們不必擔心下週就會被機器取代,但他們應比上月少許信心。
-
AI實驗室新測試:你連賺錢的念頭都沒有嗎?
本文提出了一個五級分層模型,用於評估建立基礎模型的 AI 公司,其核心在於衡量企業的野心而非商業成功。第一級代表真正熱愛自我,第二級僅有概念輪廓,第三級擁有許多有前景的產品構想,第四級擁有詳細的多階段致富計畫,而第五級則是每天已賺取數百萬美元。目前 OpenAI、Anthropic、Gemini 等知名機構均處於第五級。文章隨後分析了四家新興實驗室:humans& 雖有令人信服的溝通與協調工具構想,但對具體產品化保持謹慎,被歸類為第三級。Thinking Machines Lab 由前 ChatGPT 專案負責人 Mira Murati 創立,雖曾獲兩十億美元種子輪投資,但近期因技術長 Barret Zoph 及多名高管離職,顯示內部方向出現分歧,可能從第四級滑落至第二或第三級。World Labs 由費飛飛(Fei-Fei Li)於 2024 年籌資兩億三千萬美元成立,已推出世界生成模型並實現商業化,獲得遊戲與特效產業需求,表現類似第四級,有望晉升。最後,Safe Superintelligence 由前 OpenAI 首席科學家 Ilya Sutskever 創立,目前無產品週期且拒絕 Meta 收購,被視為典型的第 1 級科學專案,但作者指出若研究進展順利或出現重大問題,該機構可能迅速晉升。