Google 正在升級其影象生成模型,推出名為 Nano Banana Pro 的新版本。該模型基於 Google 最新發布的大型語言模型 Gemini 3,相比前代 Nano Banana,具備更高的解析度、更準確的文字渲染能力以及網頁搜尋功能。Nano Banana Pro 允許使用者控制相機角度、場景光線、景深、焦點及色彩校正等專業引數,並能生成 2K 或 4K 高解析度影像,突破了前代 1024 x 1024px 的限制。
在功能上,新模型可整合六張高品質照片或將最多十四個物件融合於單一畫面,並能維持最多五個人物的形象一致性。此外,它支援以不同風格、字型和語言生成文字,甚至可根據搜尋結果製作閃卡。由於解析度提升,新模型的生成速度較慢且成本較高。原 Nano Banana 每張 1024px 影像成本為 0.039 美元,而 Nano Banana Pro 每張 1080p 或 2K 影像成本為 0.139 美元,每張 4K 影像成本為 0.24 美元。
Google 已推出示範應用程式,並讓新模型整合至 Gemini 應用程式中。免費訂閱使用者可生成有限數量的影像,之後將自動切換回原模型。Google AI Plus、Pro 及 Ultra 訂閱使用者享有更高的生成門檻,並可在 NotebookLM 中使用該模型。美國地區的 AI Pro 及 Ultra 使用者還可在搜尋 AI 模式中存取此功能,Ultra 使用者更可於 Flow 影片工具中使用。 Workspace 客戶可在 Google Slides 和 Vids 中存取,開發者則可透過 Gemini API、Google AI Studio 及新推出的 IDE Antigravity 進行開發。
同時,Google 將 SynthID 技術整合至 Gemini 應用程式中,讓使用者上傳影像後,聊天機器人即可告知該影像是否由公司模型生成或修改。未來,Google 還將加入對 C2PA 內容憑證檢測的支援,以驗證內容真實性。