分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
世界發佈工具用以驗證AI購物代理背後的人類身份
由 Sam Altman 共同創立的 World 公司專注於開發所謂的「人類證明」技術,旨在應對日益被低品質 AI 生成內容充斥的網路環境。本週,其後臺起家的初創公司 Tools for Humanity 推出了新驗證工具的測試版,該工具專為支援代理商業(agentic commerce)而設計,即利用 AI 程式替使用者瀏覽網頁並進行購買。隨著消費者越來越多地使用 AI 代理自動購物,這雖然帶來了自動化便利,但也引發了新型詐騙、垃圾郵件及大規模網路濫用的擔憂。 World 於週二宣佈其解決方案為 AgentKit,這是一款針對商業網站的軟體開發工具,允許網站納入新驗證系統,以確認購買決策背後確實有真人。AgentKit 依賴於 World ID,這是 TFH 驗證系統的核心。最安全的 ID 版本來自於透過 World 的 Orb 裝置掃描使用者眼睛,將虹膜轉換為獨特且加密的數位程式碼,即驗證後的 World ID,使用者可透過 World app 存取 TFH 的生態系統服務。 AgentKit 允許將使用者的 World ID 整合進最近推出的 x402 協議中。該協議由 Coinbase 和 Cloudflare 開發,是一種基於區塊鏈的開放標準,允許自動化電腦程式線上上直接進行交易,無需人類在每一步進行幹預。要使用 AgentKit,使用者只需將 AI 代理註冊並連結其 World ID,該 ID 便會透過 x402 系統向網站溝通,確認有一位獨特且驗證過的真人批准了代理的購買決定。Tools for Humanity 表示,AgentKit 是作為與 Coinbase 協調的 x402 v2 協議的補充擴充套件,設計讓任何已使用 x402 的網站都能啟用獨特人類驗證,或作為微支付之外(或替代)的選項。 在 TechCrunch 的採訪中,TFH 首席產品官 Tiago Sada 將此新功能比作將「授權書」委託給代理。透過驗證 AI 程式是代表特定使用者行動,網站便可決定是否信任這些代理啟動的交易。Sada 指出,World ID 徽章告訴網站該使用者是真實且獨特的個人,網站仍可選擇阻擋他們認為操縱不當的使用者。目前,AgentKit 正以測試版形式向開發者提供,希望透過反饋進行改進。Sada 也提到,消費者必須擁有源自 Orb 掃描
-
Gamma 加入 AI 圖像生成工具以對抗 Canva 和 Adobe
美國平臺 Gamma 正推出名為 Gamma Imagine 的新產品,旨在透過文字提示生成行銷資產,以與 Canva 和 Adobe 等競爭對手抗衡。該產品允許使用者建立互動圖表、視覺化資料、行銷物料、社群媒體圖示及資訊圖表等品牌專屬內容。Gamma 目前提供超過一百個模板,並整合 ChatGPT、Claude、Make、Zapier、Atlassian、n8n 及 Superhuman Go 等工具,以支援其資料驅動的資產生成功能。Gamma 執行長兼共同創辦人 Grant Lee 表示,早期使用者在製作簡報時,對圖形設計的需求多樣,因此開發了超越傳統演示格式的新工具。Lee 認為 Gamma 定位於專業工具如 Adobe 或 Figma 與 legacy 工具如 Microsoft PowerPoint 之間,能服務那些需要視覺溝通卻缺乏專業設計資源的知識工作者與企業專業人士。Gamma 於去年十一月在由 a16z 領軍的 B 輪融資中籌得六千八百萬美元,當時估值為二百一十億美元,並宣稱擁有年收入一千萬美元及七千萬使用者。公司近期透露,其使用者數量已接近一億。
-
輝達的 OpenClaw 版本可能解決其最大問題:安全性
英偉達執行長黃仁勳在週一的 GTC 演講中宣佈,公司推出了名為 NemoClaw 的企業級 AI 代理平臺。該平臺建立在流行的開源框架 OpenClaw 之上,並內建了企業級的安全與隱私功能。黃仁勳強調,就像 Linux、HTTP/HTML 以及 Kubernetes 對產業的變革一樣,每家企業現在都需要制定自己的 OpenClaw 策略,以建立代理系統架構。NemoClaw 是由英偉達與 OpenClaw 創始人 Peter Steinberger 合作開發的早期測試版本,使用者可以透過單一命令訪問任何程式設計代理或開源 AI 模型,包括英偉達的 NemoTron 開源模型,並將其部署在本地硬體上。該平臺具有硬體無關性,不依賴英偉達專用的 GPU,且與英偉達的 NeMo AI 代理軟體套件整合。儘管目前處於開發階段,存在粗糙邊緣,但目標是提供生產級別的沙箱編排能力。此舉回應了近期企業對 AI 代理平臺的關注,例如 OpenAI 於二月推出的 Frontier 平臺,以及 Gartner 在十二月關於 AI 代理治理平臺重要性的報告。黃仁勳認為,OpenClaw 在正確的時間提供了產業急需的基礎設施,使整個行業能夠基於開源堆疊進行創新。
-
Memories AI 正在為穿戴裝置與機器人建立視覺記憶層
Shawn Shen 認為人工智慧若要成功應用於實體世界,必須具備記憶視覺資訊的能力。他創立的 Memories.ai 公司正與半導體巨頭 Nvidia 合作,利用 Nvidia Cosmos-Reason 2 推理視覺語言模型及 Metropolis 參考架構,開發穿戴裝置與機器人所需的視覺記憶基礎設施。Shen 與共同創辦人兼技術長 Ben Zhou 在開發 Meta Ray-Ban 眼鏡背後的 AI 系統時,意識到若使用者無法回溯錄影資料,技術將難以真正融入生活,因此決定從 Meta 獨立出來專注於此領域。目前 OpenAI 於 2024 年更新 ChatGPT 以開始記憶過往對話,並在 2025 年進行微調,Elon Musk 的 xAI 與 Google Gemini 也於過去兩年推出記憶工具,但這些進展多聚焦於結構化且易索引的文字記憶,對於主要透過視覺互動的實體 AI 應用幫助有限。Memories.ai 於 2024 年成立,截至 2025 年 7 月已籌資 1600 萬美元,其中包括由 Susa Ventures 領投的 800 萬美元種子輪及另一筆 800 萬美元融資,參與機構包含 Seedcamp、Fusion Fund 及 Crane Venture Partners 等。公司於 2025 年 7 月推出大型視覺記憶模型(LVMM),其功能類似於 Gemini Embedding 2,並自製名為 LUCI 的硬體裝置供資料收集者佩戴以錄影訓練模型。雖然公司不打算銷售該硬體,但認為現有的高畫質且耗電的錄影裝置不適合其需求。Memories.ai 已推出 LVMM 第二代,並與 Qualcomm 合作,預計今年晚些時候將執行於 Qualcomm 處理器上。儘管目前已有部分穿戴裝置公司表達合作意願,Shen 表示公司尚未透露具體物件,並認為穿戴裝置與機器人市場潛力巨大,但商業化時機可能尚未完全成熟,公司目前更專注於模型與基礎設施的建設。