Luma 發布全新「統一智能」模型驅動的創意 AI 代理

美國 AI 影片生成新創公司 Luma 於週四推出了 Luma Agents，旨在處理跨文字、影象、影片與音訊的端到端創意工作。該平臺由 Luma 的統一智慧（Unified Intelligence）模型家族驅動，其核心架構基於 Uni-1 模型，該模型是此係列中首款整合了音訊、影片、影象、語言及空間推理能力的 AI 模型。Luma 執行長兼共同創辦人 Amit Jain 表示，Uni-1 模型能夠「以語言思考、想像並渲染畫素或影象」，他將此稱為「畫素中的智慧」。

Luma Agents 被定位為廣告公司、行銷團隊、設計工作室及企業的新工作模式。該系統具備規劃與生成多媒體內容的能力，並能與包括 Luma 的 Ray 3.14、Google 的 Veo 3、Nano Banana Pro、ByteDance 的 Seedream 以及 ElevenLabs 的語音模型在內的其他 AI 模型協同運作。與傳統需要反覆提示（prompt）不同，Luma Agents 能自動生成大量變體，使用者僅需透過對話引導方向。Jain 指出，這種能力讓系統能維持跨資產、合作者及創意迭代的持續情境，並透過自我批評的迭代迴圈來評估與最佳化輸出結果。

目前，Luma 已將新平臺滾動式推出給現有客戶，包括全球廣告公司 Publicis Groupe 和 Serviceplan，以及品牌 Adidas、Mazda 和沙特 AI 公司 Humain。Jain 舉例說明，系統曾將一個 200 字的簡報與一支口紅產品的圖片，轉化為廣告活動的各種地點、模特兒與配色方案概念。另一項示範中，Luma Agents 在 40 小時內將某品牌的 1500 萬美元年度廣告活動轉化為多個國家的本地化廣告，且費用低於 20,000 美元，並透過了品牌內部品質與準確性檢查。雖然 Luma Agents 目前透過 API 公開可用，但 Luma 計劃逐步開放訪問許可權，以確保使用者獲得可靠的服務並避免工作流程中斷。