語言: 英文
英文 的 AI 新聞與論文。
-
OpenAI 加強開發者推廣並推出更強大的模型於其 API
OpenAI 於週一在其開發者日活動中推出了新的 API 更新,正式介紹了最新語言模型 GPT-5 Pro、全新的影片生成模型 Sora 2,以及一款更小型且廉價的語音模型。這些更新旨在吸引開發者加入 OpenAI 生態系統,包括推出代理程式建構工具及在 ChatGPT 中建立應用程式的能力。GPT-5 Pro 的加入可能吸引金融、法律及醫療等需要高準確度與深度推理能力的開發者。OpenAI 執行長 Sam Altman 指出,語音功能將成為未來人們與 AI 互動的主要方式之一。為此,OpenAI 推出了名為 gpt-realtime mini 的小型語音模型,支援低延遲串流互動,其價格比 OpenAI 先前進階語音模型便宜 70%,並承諾提供相同的語音品質與表現力。此外,參與 OpenAI 開發者生態系統的創作者現在可以透過 API 預覽使用 Sora 2。OpenAI 於上週與 Sora App 一同發布了 Sora 2,該 App 被視為 TikTok 的競爭對手,允許使用者根據提示生成自己、朋友或任何事物的影片,並透過類 TikTok 的演演算法Feed 分享。Altman 表示,開發者現在可以直接在自己的應用程式中使用驅動 Sora 2 驚人影片輸出的模型。Sora 2 在上一代基礎上進行了改進,提供更真實且物理一致性更高的場景,並具備同步音效與更大的創作控制力,從詳細的攝影機方向到風格化視覺效果皆可調整。Altman 舉例說明,使用者可以將 iPhone 視角提示 Sora 擴充套件為宏大的電影式全景鏡頭。他還強調,該模型在將聲音與視覺結合方面的表現令人興奮,不僅是語音,更包含豐富的音效、環境音與與畫面同步的效果。Sora 2 被定位為概念開發工具,可用於廣告的視覺起點,或是如 Mattel 設計師將草圖轉化為玩具概念,這也反映了 OpenAI 與芭比製造商的合作,將生成式 AI 引入玩具製作流程。
-
MrBeast 說 AI 可能威脅創作者生計,形容為「恐懼時代
頂流 YouTube 創作者 MrBeast(吉米·唐納森)擔憂人工智慧對創作者生計的衝擊,儘管他本人也嘗試過使用相關技術。他在社交媒體上公開質疑,隨著 OpenAI 推出 Sora 2 及一款可生成包括使用者自製影片在內的 AI 應用程式,這種技術可能對數百萬靠內容維生的創作者造成生存威脅。MrBeast 在福布斯 2025 年創作者排行榜中排名第一,擁有 8.5 億美元收入與 6.34 億追蹤者,其言論對產業具有巨大影響力。YouTube 亦積極整合 AI,推出 AI 編輯工具、利用 Veo 模型動畫化靜態照片,並在 YouTube Studio 內建 AI 聊天機器人協助管理。MrBeast 曾因推出使用 AI 生成縮圖的工具引發 backlash,隨後撤下該工具並改為連結人工藝術家。目前業界仍對 AI 影片是否會取代人類創意存在爭議,部分人認為 AI 內容品質低劣,若未來 AI 無法被識別,未揭露使用 AI 的創作者恐將失去粉絲信任並損害聲譽。
-
OpenAI 發布 AgentKit 助開發者建立與發佈 AI 代理
OpenAI 執行長 Sam Altman 於週一在 Dev Day 活動中宣佈推出 AgentKit,這是一套旨在協助開發者將 AI 代理從原型階段快速推向生產環境的完整工具集。Altman 表示,AgentKit 提供了構建、部署及最佳化代理工作流所需的所有功能,並大幅降低了使用門檻。此舉標誌著 OpenAI 致力於提升開發者採用率,同時回應其他 AI 平臺在企業級自主代理工具上的競爭壓力。AgentKit 包含多個核心功能,首先是類似 Canva 的 Agent Builder,允許開發者透過直觀的視覺介面快速設計代理邏輯與步驟,該功能建立在數以萬計開發者已使用的回應 API 之上。其次為 ChatKit,提供可嵌入的聊天介面,讓開發者能將自定義品牌與工作流整合至自有應用程式中。此外,還引入了針對代理的評估工具,包含逐步追蹤評分、評估個別元件的資料集、自動化提示最佳化以及直接在 OpenAI 平臺上執行外部模型評估的能力。開發者亦可透過管理控制檯安全地將代理連線到內部工具與第三方系統。為證明其易用性,OpenAI 工程師 Christina Huang 在現場僅用不到八分鐘便構建了完整的 AI 工作流與兩個代理。目前 OpenAI 已有數家合作夥伴開始利用 AgentKit 擴充套件其代理應用,而 ChatGPT 的週活躍使用者數已突破八億。
-
OpenAI 在 ChatGPT 內推出應用程式
OpenAI 於 2025 年 10 月 6 日在 DevDay 2025 開發者大會上宣佈,將推出讓開發者能在 ChatGPT 內部建立應用程式的新方式。自下週一開始,使用者即可在 ChatGPT 中直接存取 Booking.com、Expedia、Spotify、Figma、Coursera、Zillow 和 Canva 等公司的互動應用程式。OpenAI 同時推出了面向開發者的 Apps SDK 預覽版,作為建構這些應用程式的工具套件。執行長 Sam Altman 表示,這些應用程式將具備互動性、適應性和個人化特點,讓使用者能透過對話操作。 此係統讓應用程式直接嵌入 ChatGPT 的回應中,取代了之前的 GPT Store 獨立商店模式。使用者只需輸入應用程式名稱,例如「Figma,將此草圖轉為可工作的圖表」,即可呼叫相關工具。系統也會根據情境主動推薦應用程式,例如當使用者詢問週末派對歌單時,ChatGPT 可能會呼叫 Spotify。未來預計 DoorDash、Instacart、Uber 和 AllTrails 等服務也將加入。 技術上,該系統採用 Model Context Protocol (MCP),允許開發者將資料來源連線到 AI 系統,並觸發動作或渲染完整互動介面。部分應用程式支援在 ChatGPT 中播放影片,且已訂閱使用者可直接登入帳戶。OpenAI 表示將透過 Instant Checkout 等功能支援應用程式的未來商業化。然而,關於隱私與資料存取範圍仍存疑點,開發者必須遵循最小資料收集原則並透明化許可權。此外,OpenAI 強調將優先考量使用者體驗,而非讓公司透過付費影響應用程式在回應中的呈現順序。