分類: AI 應用
「AI 應用」分類的 AI 新聞與論文。
-
Anthropic 發佈 Claude Design 新產品,用於快速創建視覺圖形
Anthropic 於週五宣佈推出 Claude Design,這是一款新的實驗性產品,允許使用者利用 Claude 建立原型、簡報、單頁檔案等視覺內容。該產品旨在幫助沒有設計背景的創始人和產品經理更輕鬆地分享想法。使用者只需描述需求,Claude 即可生成初版視覺,隨後使用者可透過直接編輯或請求進行修飾。例如,使用者可以要求 Claude 原型化一個寧靜的移動冥想應用,並指定其具有安撫性字型、微妙的自然啟發色調以及簡潔的佈局,之後再調整顏色、字型大小或新增深色模式切換功能。 雖然 Claude Design 初看之下似乎與剛擴充套件 AI 功能的設計應用程式 Canva 競爭,但 Anthropic 向 TechCrunch 表示,其意圖是補充而非取代 Canva。該產品專為從無設計工具開始並需快速將想法轉化為視覺內容的使用者打造。團隊完成簡報或原型後,可將其匯出為 PDF、網址、PPTX 檔案或傳送給 Canva。進入 Canva 後,內容將完全可編輯且具備協作功能。此外,Claude Design 能將團隊的設計系統應用於每個專案,確保結果與公司整體視覺風格一致。這透過讀取公司的程式碼庫和設計檔案實現,團隊亦可修訂這些元件並維護多個設計系統。 新產品由 Claude Opus 4.7 驅動,目前對 Claude Pro、Max、Team 及 Enterprise 訂閱者開放研究預覽。此次發布突顯了 Anthropic 持續推進企業和專業消費市場的戰略,隨著 AI 職場工具競爭加劇,該舉動尤為重要。今年一月,Anthropic 推出了專為複雜任務設計的代理助手 Claude Cowork,幾週後又推出了旨在自動化公司各部門專門任務的代理外掛。此次公告距離彭博社報導風險投資公司正提供價值高達八百億美元或以上的預先融資輪次僅數日,該估值幾乎與或超越其競爭對手 OpenAI。不過,根據報導,Anthropic 目前對最新報價並不感興趣。
-
Luma 發布結合 AI 技術的製作工作室 并推出以信仰為主題的 Wonder Project
美國 AI 影片生成公司 Luma 與專注於宗教及家庭友好內容的製作工作室 Wonder Project 合作,推出了名為 Innovative Dreams 的新製作公司。Wonder Project 擁有 Amazon Prime Video 串流服務,其首個專案「The Old Stories: Moses」由英國演員 Ben Kingsley 主演,預計今年春季於 Prime Video 上線。Luma 表示,Innovative Dreams 將讓資深導演團隊與 Luma 的創意技術人員協作,利用 Luma Agents 工具進行端到端的創意工作,涵蓋文字、影像、影片與聲音。該工具旨在實現即時創作團隊協作,讓製作人能即時修改場景、道具與燈光,並加入真人演員鏡頭,這比傳統虛擬製作與表演捕捉僅在後期整合的方式更為高效。Luma 執行長 Amit Jain 指出,生成式 AI 能讓製片速度更快、成本更低且效率更高,同時不犧牲品質。此舉並非孤例,AI 起點公司 Higgsfield 上週已推出原創系列,倫敦的 Wonder Studios 則與 Campfire Studios 合作製作紀錄片。競爭對手 Runway 的創辦人 Cristóbal Valenzuela也建議電影工作室應將單部影片耗資一億美元改為利用 AI 製作五十部影片以增加爆款機率。Wonder Project 於 2023 年成立,由導演 Jon Erwin 與前 Netflix 高管 Kelly Hoogstraten 領導,其首部作品《David 之家》於 2025 年於 Amazon Prime Video 播出。Innovative Dreams 雖以宗教內容起家,但未來將擴充套件至多型別專案。Erwin 介紹了結合表演捕捉與虛擬製作的「即時混合製片」流程,利用 Luma 工具讓演員在任何地點拍攝並傳輸至寫實場景,甚至生成新臉孔以匹配演員動作與表情。
-
身為熱門機器人新創公司的Physical Intelligence宣稱其新開發的機器人腦能自行理解從未被教過的任務
美國舊金山機器人新創公司 Physical Intelligence 於週四發表新研究,顯示其最新模型 π0.7 能引導機器人執行從未明確訓練過的任務。該模型被描述為邁向通用機器人腦的早期重要一步,具備元件泛化能力,即結合不同情境中學得的技能來解決從未接觸過的問題。這打破了傳統機器人訓練依賴特定任務資料 rote memorization 的模式。研究團隊發現,當模型跨越僅執行資料對應任務的門檻後,其能力增長速度超過線性比例,類似於語言模型領域的現象。 最引人注目的演示涉及空氣炸鍋,該裝置在訓練資料中僅出現兩次相關片段:一次是機器人推閉炸鍋,另一次是將塑膠瓶放入炸鍋。模型綜合這些片段與網路預訓練資料,成功理解並操作該電器烹飪地瓜。在零指導下模型表現尚可,而在逐步語音指導下則能成功執行。此能力意味著機器人可在新環境中即時部署並改進,無需額外資料收集或模型重訓。 研究人員坦承模型仍有侷限,例如無法單從高階指令自主執行複雜多步驟任務,如直接說「幫我烤吐司」便無法達成,但若逐步指導開蓋、按鍵等步驟則運作良好。此外,缺乏標準化機器人評估指標使得外部驗證困難,團隊僅將 π0.7 與自身專項模型比較,發現其在製作咖啡、摺洗衣物及組裝紙箱等任務上表現相當。 研究結果令內部專家感到意外,因為他們清楚訓練資料內容。例如隨機詢問機器人旋轉齒輪時,模型竟能成功執行。研究人員強調,批評者常認為演示任務過於無聊,但 Physical Intelligence 認為泛化能力雖不如精心編排的特技劇本震撼,卻更具實用價值。該研究僅展示早期泛化跡象與初步演示,並非已部署產品。Physical Intelligence 迄今已籌資超過十億美元,最新估值為五十六億美元,創辦人之一 Lachy Groom 曾投資 Figma、Notion 等公司,目前公司正討論可能將估值翻倍至一百一十億美元的新融資輪次。
-
Google 現在讓你用 AI 模式並排瀏覽網頁
Google 於週四宣佈推出 AI Mode,這是一種新的探索網頁方式,旨在透過對話式搜尋體驗提升效率。當使用者在 Chrome 桌面版使用 AI Mode 時,點選連結將使網頁與 AI Mode 並排顯示。此功能讓使用者能更輕鬆地探索相關網站、比較細節並提出後續問題,同時保留搜尋上下文。例如,若需購買咖啡機,使用者可在 AI Mode 中描述需求並獲得選項,點選後即可在旁開啟零售商網站詢問具體問題,如「清潔是否方便」,AI Mode 將整合頁面內容與網路資訊來回答。早期測試者表示,無需頻繁切換標籤頁即可獲得全面協助,並能專注於任務。此外,Google 還推出了搜尋已開啟 Chrome 標籤頁的新功能。使用者可在「新標籤頁」或 AI Mode 的搜尋框點選新增選單,選擇近期標籤加入搜尋,從而混合多個標籤、圖片或檔案的上下文。這對於研究當地登山步道或準備統計學考試等情境尤為有用,可將開關的筆記、講義等內容帶入搜尋以獲取範例。目前這些更新已在美國推出,Google 計劃未來擴充套件至更多地區。