來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
Anthropic 發布 Opus 4.6 具備全新「代理人團隊」功能
安提洛普(Anthropic)於週四發布了 Opus 4.6,這是其最先進的模型版本,也是對 Claude Code 至關重要的更新。該版本旨在擴大模型的能力與吸引力,使其適用於更多樣化的用途與客戶。最顯著的新增功能包括公司所稱的「代理團隊」(agent teams),這是一組能夠將大型任務分割成分段工作的代理。與單一代理順次處理任務不同,此功能允許將工作分派給多個代理,每個代理負責其部分並直接與其他代理協調。安提洛普產品負責人斯科特·懷特(Scott White)將此新功能比作擁有為你工作的天才人類團隊,指出這種代理職責的分段化使得它們能夠並行協調並更快工作。目前,代理團隊功能僅對 API 使用者和訂閱者開放研究預覽。 Opus 4.6 還配備了更長的上下文視窗,使程式能於每次使用者會話中回憶更多資訊。新模型提供 100 萬個 token 的上下文容量,這與公司目前的 Sonnet(版本 4 和 4.5)所提供的容量相當。這些上下文視窗允許處理涉及更大程式碼庫的工作,也能處理更大的檔案。此外,新版本將 Claude 直接整合進 PowerPoint,作為可訪問的側邊欄。這一步超越了 PowerPoint 先前與聊天機器人整合的方式。先前使用者可以指示 Claude 建立 PowerPoint 簡報,但檔案必須轉移到 PowerPoint 才能編輯。現在,簡報可以在 PowerPoint 內製作,並獲得 Claude 的直接協助。 懷特表示,Opus 已從一個在特定領域(軟體開發)高度 capable 的模型,演變為對更廣泛知識工作者真正有用的程式。他注意到許多非專業軟體開發者使用 Claude Code,僅因為它是一個執行任務的驚人引擎。懷特補充,公司所見的使用者不僅限於軟體工程師,還包括產品經理、財務分析師以及來自各種其他行業的人士。
-
Meta測試獨立應用程式用於其AI生成的「Vibes」影片
Meta 確認正在測試一款獨立的 Vibes 應用程式,該應用於去年九月推出,允許使用者建立和分享短格式 AI 生成影片,並提供專門的影片資訊流。此資訊流此前僅存在於 Meta AI 應用程式內,現在將獨立推出,旨在成為與 OpenAI 的 Sora 應用程式更直接的競爭對手。Meta 表示,隨著使用者在 Meta AI 內對 Vibes 格式的採用率顯著提升,公司正利用此動量測試獨立應用程式,以提供更專注和沉浸式的環境供使用者創作、發現和分享 AI 生成影片。使用者可從頭生成影片或對資訊流中的影片進行混音,並在發布前新增新視覺效果、疊加音樂及調整風格。完成後,影片可直接發布至 Vibes 資訊流、私訊給他人,或跨貼至 Instagram 和 Facebook 的 Stories 及 Reels。Meta 指出,合作與分享功能日益興盛,許多 Vibes 影片會被傳送給朋友,這與使用者使用 Reels 的方式相似。此外,Meta 透露除在 Facebook、Instagram 和 WhatsApp 測試新高階訂閱外,還將探索針對 AI 功能(包括 Vibes)的訂閱模式。儘管 Vibes 自推出以來一直免費,但 Meta 計劃提供免費加付費(freemium)的影片創作存取權,並允許使用者訂閱以每月解鎖額外的影片創作機會,這些測試訂閱預計將在未來幾個月內推出。
-
Fundamental 系列 A 融資 2.55 億美元,提出大數據分析新觀點
美國人工智慧實驗室 Fundamental 於週四正式脫離隱蔽狀態,推出名為 Nexus 的新基礎模型,旨在解決企業如何從海量結構化資料中獲取洞察力的老問題。執行長 Jeremy Fraenkel 指出,雖然大型語言模型(LLM)在處理文字、音訊、影片等無結構資料方面表現優異,但在處理表格等結構化資料時存在不足。Fundamental 的 Nexus 被稱為大型表格模型(LTM),其設計理念與 OpenAI 或 Anthropic 等當代實驗室截然不同。該模型採用確定性架構,每次回答相同問題時結果一致,且不依賴定義當代 AI 的變換器(Transformer)架構。 Fundamental 此次以 2.55 億美元的資金脫離隱蔽,投後估值達 14 億美元。主要資金來自近期由 Oak HC/FT、Valor Equity Partners、Battery Ventures 和 Salesforce Ventures 領投的 2.25 億美元 A 輪融資,Hetz Ventures 亦參與其中,天使投資人包括 Perplexity 執行長 Aravind Srinivas、Brex 共同創辦人 Henrique Dubugras 及 Datadog 執行長 Olivier Pomel。由於變換器模型受上下文視窗限制,難以處理包含數十億行的龐大資料表,這為 Nexus 提供了巨大機會。Fundamental 表示,利用 Nexus 可讓企業單一模型覆蓋所有使用場景,並提升效能,甚至取代數百名資料科學家的工作。目前該公司已與多家 Fortune 100 企業簽訂百萬美元級合約,並與 AWS 達成戰略合作,允許使用者直接在現有例項上部署 Nexus。
-
ElevenLabs CEO:聲音是AI的下一階介面
ElevenLabs 共同創辦人兼執行長 Mati Staniszewski 在杜哈舉行的 Web Summit 上表示,語音正成為人工智慧下一個主要的介面,人們將透過語音與機器互動,而非僅限於文字與螢幕。他指出,ElevenLabs 開發的語音模型已超越單純模仿人類聲音,開始結合大型語言模型的推理能力,改變人與科技的互動方式。他預言未來手機將重新放回口袋,人們可沉浸於現實世界,以語音控制技術。此願景推動 ElevenLabs 本週以十一億美元估值籌資五億美元,且該觀點在 AI 產業日益普及。OpenAI 與 Google 均將語音列為下一代模型核心,Apple 則透過收購 Q.ai 等公司低調建構語音相關技術。隨著 AI 滲透穿戴裝置與汽車等新硬體,控制方式從觸控螢幕轉向語音,語音成為 AI 發展下一階段的重要戰場。 Iconiq Capital 合夥人 Seth Pierrepont 也支援此觀點,認為雖然螢幕對遊戲與娛樂仍具重要性,但鍵盤等傳統輸入方式已顯陳舊。隨著 AI 系統變得更具代理性,互動方式將改變,模型將獲得防護機制、整合功能與情境資料,減少使用者明確提示的需求。Staniszewski 指出,未來語音系統將依賴長期累積的持續記憶與情境,使互動更自然且減少使用者負擔。ElevenLabs 正推動混合架構,結合雲端與裝置端處理,以支援耳機等穿戴裝置,讓語音成為常伴隨的夥伴而非需主動啟用的功能。ElevenLabs 已與 Meta 合作將技術應用於 Instagram 及 Horizon Worlds 虛擬實境平臺,並表示願意合作開發 Ray-Ban 智慧眼鏡等新型態語音介面。然而,語音技術日益嵌入日常硬體也引發隱私、監控及個人資料儲存等嚴重擔憂,Google 等公司已因濫用資料而受指責。