跳至內容
AI 新聞站
返回

Luma 發布全新「統一智能」模型驅動的創意 AI 代理

美國 AI 影片生成新創公司 Luma 於週四推出了 Luma Agents,旨在處理跨文字、影象、影片與音訊的端到端創意工作。該平臺由 Luma 的統一智慧(Unified Intelligence)模型家族驅動,其核心架構基於 Uni-1 模型,該模型是此係列中首款整合了音訊、影片、影象、語言及空間推理能力的 AI 模型。Luma 執行長兼共同創辦人 Amit Jain 表示,Uni-1 模型能夠「以語言思考、想像並渲染畫素或影象」,他將此稱為「畫素中的智慧」。

Luma Agents 被定位為廣告公司、行銷團隊、設計工作室及企業的新工作模式。該系統具備規劃與生成多媒體內容的能力,並能與包括 Luma 的 Ray 3.14、Google 的 Veo 3、Nano Banana Pro、ByteDance 的 Seedream 以及 ElevenLabs 的語音模型在內的其他 AI 模型協同運作。與傳統需要反覆提示(prompt)不同,Luma Agents 能自動生成大量變體,使用者僅需透過對話引導方向。Jain 指出,這種能力讓系統能維持跨資產、合作者及創意迭代的持續情境,並透過自我批評的迭代迴圈來評估與最佳化輸出結果。

目前,Luma 已將新平臺滾動式推出給現有客戶,包括全球廣告公司 Publicis Groupe 和 Serviceplan,以及品牌 Adidas、Mazda 和沙特 AI 公司 Humain。Jain 舉例說明,系統曾將一個 200 字的簡報與一支口紅產品的圖片,轉化為廣告活動的各種地點、模特兒與配色方案概念。另一項示範中,Luma Agents 在 40 小時內將某品牌的 1500 萬美元年度廣告活動轉化為多個國家的本地化廣告,且費用低於 20,000 美元,並透過了品牌內部品質與準確性檢查。雖然 Luma Agents 目前透過 API 公開可用,但 Luma 計劃逐步開放訪問許可權,以確保使用者獲得可靠的服務並避免工作流程中斷。


分享這篇文章:

上一篇
美國防部正式將Anthropic列為供應鏈風險
下一篇
OpenAI 發佈 GPT-5.4 具 Pro 與 Thinking 版本