語言: 英文
英文 的 AI 新聞與論文。
-
Poe 的 AI 應用現已支援跨 AI 模型的群組對話
Quora 推出的 Poe 應用程式正式啟動群組聊天功能,允許全球使用者在單一對話中與最多兩百人進行互動,並能協作使用超過兩百個不同的 AI 模型,涵蓋文字、影象、影片及音訊生成器。此舉僅在 OpenAI 的 ChatGPT 於數天前於日本、紐西蘭、韓國及臺灣等市場開始測試群組聊天後不久推出,旨在將聊天機器人從一對一互動轉變為使用者可與朋友、家人或同事共同參與的協作空間。Quora 表示,該功能可創造新的互動體驗,例如家庭或朋友可結合 Gemini 2.5 的搜尋功能與 o3 Deep Research 共同規劃旅行,團隊可利用 Poe 上的各種影象模型為心情板腦暴圖片,或透過應用程式內的問答機器人一起玩Trivia遊戲。群組聊天支援任何組合的 AI 模型或創作者自製機器人,包括 Claude 4.5 Sonnet、ElevenLabs v3、ElevenLabs Music、Nano Banana、GPT-5.1、Kling 2.5 Turbo Pro、o3 Deep Research、Sora 2 Pro 及 Veo 3.1 等。使用者可從 poe.com 網站首頁啟動群組聊天,且聊天記錄會實時同步至不同裝置,確保從桌面切換至手機時不會遺失對話內容。Poe 團隊耗時六個月開發此功能,並計劃根據使用者反饋在未來幾週持續最佳化群組聊天體驗。公司強調,由 AI 介導的群組互動與協作機會潛力巨大且目前尚未被充分開發,同時允許任何人自製機器人並分享給他人使用於自己的群組中。
-
Google 發布 Gemini 3,推出全新程式設計應用並創下紀錄 benchmarks 分數
Google 於週二發布了最新且最先進的基礎模型 Gemini 3,該模型已透過 Gemini 應用程式及 AI 搜尋介面立即上線。此版本距離 Gemini 2.5 發布僅七個月,被視為 Google 目前最強大的大型語言模型,也是市場上最具競爭力的 AI 工具之一。此次發布時間緊接在 OpenAI 推出 GPT 5.1 之後,且僅在 Anthropic 發布 Sonnet 4.5 兩個月後,凸顯了前沿模型開發的驚人速度。另一種更具研究性質的版本 Gemini 3 Deepthink 將透過 Google AI Ultra 訂閱服務在數週內提供,待透過更多安全測試後上線。Google 產品主管 Tulsee Doshi 表示,Gemini 3 展現了巨大的推理能力進步,其回應的深度與細膩度前所未見。在獨立評估中,該模型在 Humanity's Last Exam benchmarks 上以 37.4 分創下新高,超越前高 GPT-5 Pro 的 31.64 分。Gemini 3 亦在由人類主導的 LMArena 排行榜上奪冠。目前 Gemini 應用程式擁有超過 6.5 億月活躍使用者,1300 萬軟體開發者將其納入工作流程。此外,Google 還推出了名為 Google Antigravity 的 Gemini 驅動編碼介面,提供類似 Warp 或 Cursor 2.0 的多面板代理編碼功能,整合聊天式提示、命令列介面與瀏覽器視窗,讓開發者能即時觀察編碼代理所帶來的變更影響。DeepMind 技術長 Koray Kavukcuoglu 指出,該代理能與編輯器、終端機及瀏覽器協作,協助開發者以最佳方式構建應用程式。
-
Stack Overflow 正在重塑自己成為 AI 數據供應商
微軟於週二在 Ignite 會議期間宣佈,Stack Overflow 推出全新產品線,旨在將其轉型為企業 AI 架構的重要組成部分。核心產品「Stack Internal」是針對企業環境設計的內部論壇版本,具備額外的安全機制與管理控制許可權。該產品專為餵養內部 AI 代理而設計,利用模型上下文協定(Model Context Protocol)處理特定於 Stack Overflow 的變體。執行長 Prashanth Chandrasekar 指出,由於已有企業客戶使用其 API 進行訓練,促使公司轉向此新方向。此外,Stack Overflow 與多家 AI 實驗室達成內容合作,允許這些實驗室以統一費用使用公開資料訓練模型,類似於 Reddit 的協議,後者已為平臺帶來超過 2 億美元收入。 Stack Internal 的關鍵在於其匯出的後設資料層,包含回答者資訊、時間戳、內容標籤及內部一致性評估等複雜資料。這些資料用於生成通用可信度分數,幫助 AI 代理判斷答案的可信程度。CTO Jody Bailey 表示,客戶可自定義標籤系統或由其動態建立,未來將利用知識圖譜連線概念與資訊,而非依賴 AI 自行處理。雖然 Stack Internal 不直接開發 AI 代理,但其寫作功能允許代理在無法回答或發現知識缺口時,自動建立 Stack Overflow 查詢。Bailey 認為,這種讀寫功能將減少開發者捕捉業務獨特資訊的難度,使企業能更輕鬆地演進其 AI 應用。
-
Intuit 與 OpenAI 签訂 1 億美元以上協議將其應用程式引入 ChatGPT
Intuit 與 OpenAI 簽署了一份價值超過 1 億美元的多年合約,使該公司的稅務與金融應用程式能夠在 ChatGPT 中執行,並擴大其產品對 OpenAI 模型的應用。Intuit 表示,其工具如 TurboTax、Credit Karma、QuickBooks 和 Mailchimp 將透過 ChatGPT 可供訪問,允許使用者詢問問題並完成估算稅務退稅、審查信貸選項或管理企業財務等任務。在使用者許可下,Intuit 的應用程式將能夠訪問其金融資料以生成回應並完成任務,例如傳送營銷訊息或發出發票提醒。客戶還將能夠在 ChatGPT 中使用這些工具審查信用卡、個人貸款和房貸。 此協議反映了技術與金融機構在消費者和企業軟體中採用大型語言模型的廣泛趨勢。OpenAI 於十月推出了讓開發者建立可透過 ChatGPT 訪問應用程式的方式,早期參與者包括 Booking.com、Expedia、Spotify 等。但 Intuit 的整合與現有 ChatGPT 應用程式不同,因為它將用於直接影響財務決策的任務,這引發了關於 AI 系統可靠性的擔憂,因為它們可能產生錯誤或具有誤導性的輸出。Intuit 採用多種驗證方法並利用大型領域特定資料集來最小化錯誤或「幻覺」回應的風險。Intuit 發言人 Bruce Chan 表示,當 AI 向客戶提供答案或指導時,它會呼叫 Intuit 多年來開發的深厚專業知識,以及提供 360 度客戶視角的資料,確保答案相關且基於客戶自身資料。 Intuit 繼續支援其產品提供的準確性保證,包括 TurboTax,但並未澄清公司或客戶是否會為 AI 生成建議或洞察產生的錯誤負責。Intuit 近年來一直在擴大 AI 的使用,以利用其龐大的資料基礎設施。2023 年,該公司推出了 Intuit Assist,一款跨產品執行的 AI 助手。該合作還涉及 Intuit 擴大對 OpenAI 模型的應用,該公司已經將 OpenAI 的 AI 模型與其他商業和開源大型語言模型並用。Intuit 表示,該合作將使其透過 ChatGPT 接觸新受眾,為其小型企業和消費者金融工具增加另一個分銷渠道。該協議還涵蓋 Intuit 繼續使用 ChatGPT Enterprise,該公司表示已內部部署以支援員工工作流程。