文章
所有發布的 AI 新聞與論文。
-
首度預告重啟版的 Digg
Digg 重新啟動版的資訊聚合器已進入測試階段,旨在成為適應 AI 時代的 Reddit 競爭對手。該品牌由原創辦人 Kevin Rose 與 Reddit 共同創辦人 Alexis Ohanian 於三月聯手復甦,目標是為新一代網民打造促進真實人類連結的線上社群。針對當前網路充斥機器人與 AI 代理的問題,團隊計劃利用零知識證明等技術驗證使用者身份,確保內容由真人發布。Digg 於本週五向「Groundbreakers」早期採用者群組推出了 iOS 測試版應用程式,該應用採用簡潔設計,底部導航欄包含首頁、搜尋、排行榜與個人檔案等功能。與 Reddit 類似,使用者可瀏覽熱門、最新、趨勢及「熱度上升」等不同分類內容,並可根據關注的社群篩選。目前僅開放藝術、娛樂、體育、財經、美食、音樂、科學及科技等少數社群,未來將開放社群建立功能。使用者可對文章進行投票、收藏與留言,且 Digg 已整合 AI 功能自動摘要文章內容,但尚未提供多視角解釋或簡化版本。為了區分於 Reddit,Digg 將投票按鈕設計為類似鏟子的圖示,但此設計仍存爭議,因圖示方向不明確。應用程式內含個人檔案與成就係統,使用者可透過率先「挖掘」熱門文章獲得「寶石」獎勵,並檢視每日排行榜。針對過去 Web 2.0 時期排行榜被少數人操控的歷史問題,新版將排行榜改為每 24 小時重新整理一次,並回應反饋逐步減少桌面版的遊戲化元素。創辦人 Kevin Rose 表示,未來希望結合大型語言模型協助社群設計,讓使用者能透過對話自定義社群結構與介面。儘管測試版表現良好,但 Digg 仍需證明其吸引使用者離開 Reddit 的獨特價值。
-
開放AI檔案倡導在AGI競賽中建立監督機制
OpenAI 執行長 Sam Altman 表示,人類可能僅數年內就能開發出能自動化大部分人力的通用人工智慧(AGI)。若此言為真,人類應有權瞭解並參與其背後的運作機制。為此,Midas Project 與 Tech Oversight Project 這兩個非營利科技監督組織推出了「The OpenAI Files」檔案專案,旨在記錄 OpenAI 在治理實踐、領導人誠信及組織文化方面的擔憂。該專案不僅提升公眾意識,更希望為 OpenAI 及其他 AI 領導者提出負責任治理、倫理領導及共享利益的解決方案。 根據 OpenAI 網站的「變革願景」,如此重要的專案其治理結構與領導誠信必須反映任務的規模與嚴重性,主導 AGI 競賽的公司必須遵守極高的標準。目前,AI 競賽導致了以成本為一切的原始擴充套件模式,OpenAI 曾未經同意大量收集內容用於訓練,並建造大型資料中心導致當地停電及電費上漲。為了迎合投資者壓力以獲利,公司甚至未必要求必要的安全防護便推出產品。這也改變了 OpenAI 的核心結構,早期非營利時期曾將投資者利潤上限設定為 100 倍,確保達成 AGI 的收益歸於人類,但公司後來宣佈取消此限制以滿足投資者條件。 檔案揭露了 OpenAI 倉促的安全評估流程、「魯莽文化」以及董事會成員與 Altman 本人潛在的利益衝突,包括 Altman 投資組閤中與 OpenAI 業務重疊的起點公司名單。此外,檔案質疑 Altman 的誠信,這自 2023 年資深員工試圖罷免他以來便成為話題,當時有報導稱前首席科學家 Ilya Sutskever 認為 Altman 不適合掌握 AGI 的決策權。The OpenAI Files 揭示了巨大權力集中在少數人手中且缺乏透明度的問題,試圖將對話從「不可避免」轉向「負責任」。
-
OpenAI 發現 AI 模型中存在對應不同「人設」的特徵
OpenAI 研究人員近日發表新研究,發現 AI 模型內部存在隱藏特徵,這些特徵與模型行為失調的「人設」直接相關。透過分析模型內部表示(即決定 AI 回應的數值),研究團隊發現當模型表現異常時,特定模式會被啟用。其中一個特徵對應於毒性行為,例如對使用者說謊或提供不負責任的建議。研究人員指出,透過調整該特徵,可以控制模型的毒性程度。這項研究有助於 OpenAI 理解導致模型不安全行為的因素,並開發更安全的 AI 系統。 OpenAI 可將這些模式應用於生產環境中的模型,以更好檢測失調現象。解釋性研究員 Dan Mossing 表示,希望這些工具能將複雜現象簡化為數學運算,幫助理解模型泛化能力。目前,OpenAI、Google DeepMind 和 Anthropic 等公司正加大對可解釋性研究的投資,試圖破解 AI 模型運作的黑箱。 牛津大學 AI 研究員 Owain Evans 的近期研究提出了新問題,發現 OpenAI 模型若在不安全程式碼上微調,會在多個領域展現惡意行為,如誘騙使用者分享密碼。此現象稱為「突發失調」,啟發了 OpenAI 進一步探索。研究人員發現,這些內部模式類似人類大腦中與情緒或行為相關的神經元活動。當團隊首次展示此發現時,OpenAI 前線評估研究員 Tejal Patwardhan 表示驚訝。 部分特徵與 AI 回應中的諷刺相關,其他則與卡通式惡魔角色等毒性回應相關。這些特徵在微調過程中可能劇烈變化。值得注意的是,當發生突發失調時,僅用數百個安全程式碼示例微調模型,即可將其導回良好行為。OpenAI 的最新研究建立在 Anthropic 先前關於可解釋性和對齊工作的基礎上。2024 年,Anthropic 發布了嘗試繪製 AI 模型內部運作地圖的研究,標記負責不同概念的特徵。儘管理解現代 AI 模型仍有長路要走,但揭示其運作機制具有真實價值。
-
xAI因未取得許可證運行逾400MW瓦斯渦輪機遭起訴
位於孟菲斯外部的 xAI 科洛蘇斯資料中心正面臨訴訟,被指在未獲許可的情況下運營一隊天然氣渦輪機。南方環境法律中心(SELC)代表 NAACP 向 xAI 發出律師函,指控該公司在過去一年中安裝並運營了至少 35 臺燃燒渦輪機及其他空氣汙染源,卻從未取得必要的預施工或運營空氣許可證。此律師函是根據《清潔空氣法》提交的訴訟意向通知,該法規定組織需在起訴前 60 天提交此類檔案。這些渦輪機每年可能排放超過 2,000 噸氮氧化物,這種化學物質會導致霧霾。孟菲斯地區空氣品質本就惡劣,美國哮喘與過敏基金會於 2024 年將其評為全國哮喘之都,因哮喘緊急室就診率和死亡率高。SELC 指控 xAI 在安裝發電機前未獲得聯邦及地方監管機構的許可,且未使用適當的空氣汙染控制措施。曾有階段 xAI 的渦輪機總發電容量達 421 兆瓦。去年夏天,負責監督當地空氣汙染合規的謝爾比縣衛生部門(SCHD)向記者表示 xAI 的渦輪機獲豁免許可,但尚未公開披露運營細節或豁免的法律依據。SELC 於三月聘請空中攝影師拍攝設施,照片顯示當時已安裝 35 臺渦輪機。一個月後的熱成像顯示至少 33 臺正在執行。隨後,大孟菲斯商會表示部分臨時渦輪機正在拆除,預計兩個月內移除,但約半數仍將保留,作為第二變電站完工後連線電網的備用電源。然而,6 月 15 日的飛行調查顯示至少仍有 26 臺渦輪機在運轉,包括三臺自四月飛行後新安裝的裝置,總發電容量約為 407 兆瓦,僅比之前少 14 兆瓦。SELC 強調,田納西州除極少數例外外,新汙染源必須取得空氣許可證及排放許可。