來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
Anthropic支持加州AI安全法案SB 53
安提克(Anthropic)於週一正式支援加州參議員斯科特·維尼(Scott Wiener)提出的 53 號提案(SB 53),該法案將對全球最大的人工智慧模型開發商實施全國首例透明度要求。此舉在消費電子協會(CTA)和進步協會等科技團體反對法案的背景下,成為該法案罕見的勝利。安提克表示,雖然認為前沿人工智慧安全最好由聯邦政府處理,但強大的技術進步不會等待華盛頓的共識,53 號提案提供了深思熟慮的治理途徑。若透過,該法案將要求開源 AI(OpenAI)、安提克、Google 和 xAI 等開發者建立安全框架,並在部署強大模型前發布公共安全報告,同時設立吹哨人保護機制。法案專注於限制人工智慧導致「災難性風險」,定義為造成至少 50 人死亡或超過十億美元的損失,具體針對生物武器製造協助和網路攻擊等極端風險,而非深度偽造等近期擔憂。加州參議院已透過前一版本,但需最終投票才能送交州長蓋文·紐森(Gavin Newsom)審批。儘管紐森此前廢除了維尼的另一項 AI 安全法案 1047 號,他目前對 53 號提案保持沉默。 投資機構如安德森·霍洛維茨(Andreessen Horowitz)和 Y Combinator 曾反對 1047 號法案,特朗普政府也威脅阻擋各州透過 AI 法規。反對者常以聯邦政府應主導治理為由,安德森·霍洛維茨的馬特·佩爾特(Matt Perault)等人曾撰文稱州級法案可能違反憲法商業條款。然而,安提克聯合創始人傑克·克拉克(Jack Clark)指出,科技產業無法等待聯邦政府行動,53 號提案提供了不可忽視的治理藍圖。開源 AI 首席全球事務官克里斯·萊恩(Chris Lehane)曾致信紐森反對任何可能推擠創業公司離開加州的監管,但前政策研究主管邁爾斯·布蘭達奇(Miles Brundage)批評該信件充滿誤導。53 號法案僅針對年營收超過五億美元的大型公司。專家認為該法案比過往法案更為謹慎,前白宮 AI
-
Y Combinator 資助的 Motion 再籌 38 億美元打造 AI 代理的微軟辦公室
哈瑞·奇(Harry Qi)在 23 歲時已成為量化基金的分析師,年薪約 100 萬美元,但感到職業生涯缺乏意義。2019 年,他與高中好友奧米德·魯霍爾法達(Omid Rooholfada)及大學同學伊森·尤(Ethan Yu)共同創立了 AI 日程與任務管理應用 Motion,並加入 Y Combinator 2020 冬季批次。團隊隨後辭去工作,並在六年內將客戶群從專業消費者擴充套件至中小企業。2024 年 5 月,Motion 推出整合 AI 代理套件,四個月內 B2B 客戶數突破 10,000 家,年度遞延收入(ARR)達到 1000 萬美元。該公司隨後獲得由 Scale Venture Partners 的史黛西·畢夏普(Stacey Bishop)領銜的 3800 萬美元 C 輪融資,估值達 5.5 億美元,且該輪次被 5 倍超額認購。截至目前,Motion 已從 HOF Capital、468 Capital、SignalFire 等機構籌資 7500 萬美元,Y Combinator 亦參與所有輪次。公司現已加入第四位合夥人尚德·拉梅什(Chander Ramesh),並由奇的前教練阿舒託什·德賽(Ashutosh Desai)擔任全職顧問。Motion 針對預算有限的中小企業,提供整合的代理功能,包括執行助理、銷售代表、客服代表及行銷助手,並與 Slack、Google Apps、Salesforce 等工具整合。定價模式採用使用量計費,從每月 29 美元起,最高至 600 美元。奇將 Motion 視為類似微軟 Office 的代理軟體生態,認為這是建立下一個微軟的機會。儘管面臨 AI 領域快速變化的壓力,奇表示不會重返從前,因為他認為建立有用的產品是驅使他起床的動力。
-
是否因劣質獎勵機制導致 AI 出現虛構資訊?
OpenAI 發表新研究探討大型語言模型如 GPT-5 及聊天機器人 ChatGPT 為何仍會產生幻覺,並分析是否有方法能減少此現象。研究將幻覺定義為模型生成的「看似合理但錯誤的陳述」,承認儘管有改進,幻覺仍是所有大型語言模型無法完全消除的根本挑戰。研究者舉例指出,當詢問一位作者關於其博士論文標題及生日時,常用聊天機器人分別給出三組不同的錯誤答案,且表現出極高的自信。研究認為,幻覺部分源於預訓練過程僅聚焦於預測下一個字元,缺乏真偽標籤,模型只能從流暢語言的正面範例中近似整體分佈。拼寫或括號等遵循一致模式的錯誤會隨規模縮減,但像寵物生日這類任意低頻事實無法單靠模式預測,因而導致幻覺。 針對解決方案,研究更關注大型語言模型的評估機制。現行評估模型本身不直接造成幻覺,卻設定了錯誤的激勵。研究者將此類評估比作多選題測驗,若僅以準確率評分,模型傾向猜測而非承認不確定,因為猜對有分、留空則零分。OpenAI 建議參考 SAT 等考試,引入錯題扣分或留空給分,以 discouraging 盲目猜測。評估應懲罰自信錯誤大於不確定,並給予適當表達不確定性的部分分數。研究強調,僅增加少數不確定性測試不足夠,必須更新廣泛使用的基於準確率的評估系統,使其評分機制能 discouraging 猜測。若主要排行榜繼續獎勵幸運猜測,模型將持續學習猜測行為。
-
koah 筹集 500 萬美元將廣告引入 AI 應用
Startup 與開發者如何實際將 AI 產品商業化?近期籌得 500 萬美元種子輪資的 startup Koah 認為廣告將是關鍵答案。Koah 共同創辦人兼執行長 Nic Baird 指出,一旦 AI 應用走出矽谷,要在全球規模下獲利,廣告是必經之路。Koah 並非要將廣告引入 ChatGPT,而是專注於建立在大型模型之上的「長尾」應用,特別是那些使用者主要位於美國以外的市場。Baird 表示,當消費級 AI 產品初興時,聚焦於高消費力的專業使用者並收取訂閱費是合理的策略,但如今許多拉丁美洲等地區的百萬使用者無法支付每月 20 美元的訂閱費,導致開發者難以獲得訂閱收入,卻仍需承擔相同的推理成本。 Koah 透過在 AI 聊天中成功整合廣告,能釋放「情緒程式碼」應用的潛力,這些應用若無風險投資支援可能因營運成本過高而無法擴充套件。目前 Koah 已在 AI 助手 Luzia、育兒應用 Heal、學生研究工具 Liner 及創意平臺 DeepAI 等應用中投放廣告,廣告主包括 UpWork、General Medicine 和 Skillshare。這些廣告標記為贊助內容,會在聊天相關時刻出現,例如當使用者詢問創業策略時,可能會顯示 UpWork 的廣告以連結自由職業者。Baird 表示,許多出版商認為 AI 聊天中的廣告無效,但 Koah 的點選率達 7.5%,是 AdMob 或 AppLovin 等老牌廣告技術公司效果的 4 到 5 倍,早期合作夥伴在平臺首 30 天即可賺取 10,000 美元。Koah 的種子輪由 Forerunner 領投,South Park Commons 及 AppLovin 共同創辦人 Andrew Karam 參與。Forerunner 的 Nicole Johnson 強調,訂閱制是消費者 AI 服務的標準,但過度依賴會導致疲勞與流失,多項收入模式不可避免,廣告將扮演重要角色。Baird 認為 AI 聊天處於購買漏斗中間,使用者可能向聊天機器人尋求推薦,但最終仍會去 Google 購買,因此 Koah 的挑戰在於捕捉使用者的商業意圖,而非單純展示展示廣告。