20个Nano Banana 2创意工作流
你可能已经生成过一些AI图像了。也许是头像、Logo概念,或者穿着太空服的奇怪猫咪。但如果我告诉你有一个图像模型可以让你在单一对话式API中生成、编辑、合成多张图像、渲染可读文本,甚至通过实时网络搜索验证其输出呢?
这个模型就是Nano Banana 2,Google为其Gemini原生图像生成能力的公开名称,它正在悄悄成为开发者可用的最具生产就绪性的创意工具之一。
你将在本文中学到:
- Nano Banana 2到底是什么:模型架构、关键设置以及它与其他图像生成器的区别
- 20个生产级工作流:每个都配有可以直接复制粘贴运行的电影级提示词
- 多图像合成:如何将多张参考图像组合成连贯的场景,无需Photoshop
- 实用陷阱和后期技巧:没人告诉你的关于让AI生成图像真正可用的那些事
什么是Nano Banana 2,为什么你应该关注?
Nano Banana是Gemini原生图像生成的总称。Nano Banana 2具体对应gemini-3.1-flash-image-preview模型。它接受文本和图像输入,可以根据你配置responseModalities的方式单独输出图像或交错输出文本和图像。
这对创意专业人士来说有趣的地方在于:与大多数将每个提示词视为独立事件的图像生成器不同,Nano Banana 2是对话式的。你生成一张图像,然后告诉它只改变背景雾气。然后你要求它更换配色方案。然后你放大到最终分辨率。这是迭代式艺术指导,而不是提示词轮盘赌。
你需要了解的关键控制参数是:imageConfig.aspectRatio用于构图,imageConfig.imageSize(1K用于草稿,2K/4K用于最终版),以及thinkingLevel(minimal用于速度,high用于复杂多约束场景)。温度默认为1.0,种子存在但确定性是尽力而为。
在我们开始之前快速说明:Nano Banana 2不像许多开源管道那样暴露"扩散步骤"控制。你的质量和速度调节旋钮是imageSize和thinkingLevel。相应地使用它们。
现在让我们深入了解20个工作流,解锁这个模型的全部能力。
1、电影级英雄静态照
这是你的基线。像电影摄影师而不是插画家那样提示Nano Banana 2。使用电影静态公式:主体+动作+环境+灯光+镜头+胶片+调色+构图。
提示词:
电影胶片静态照,35mm,低角度中景,街头萨克斯手在霓虹灯下细雨中,
湿沥青上的反光,浅景深,柔和散景,青橙色调,轻微胶片颗粒,16:9
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终 | aspectRatio: 16:9
陷阱:矛盾的灯光描述(如"黑色硬光"加"阴天柔光")会产生模糊的画面。选择一个方向。
2、三面板故事板分镜
即时预可视化。生成三个镜头,通过命名角色和在面板间重复使用相同描述符来保持服装、道具和地点一致。
提示词:
创建3面板故事板(包含三个框的单一图像)。同一角色贯穿:
"MARA"=成年女性,短黑发,黄色雨衣。场景:黎明时分的雾港。
面板1:远景建立镜头。面板2:中景,她打开生锈的储物柜。
面板3:她眼睛反射闪烁红光的特写。电影灯光,16:9整体布局
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:面板内小文字会漂移。仅在必要时添加面板标签,并在后期叠加干净的矢量边框。
3、带排版的标题卡和海报
Nano Banana 2处理图像内文字比大多数生成器好。把确切文字放在引号中并明确描述排版风格。
提示词:
电影海报设计,粗粝科幻黑色。中央图像:浓雾中路灯下孤独身影,
35mm,高对比度,胶片颗粒。添加标题文字确切为:"GLASS RAIN"
粗体紧凑无衬线字体,轻微磨损,顶部居中。添加标语:"A CITY THAT
FORGETS"小型大写。4:5
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
陷阱:小尺寸时偶尔会出现字母错误。将AI文字视为草稿,最终印刷用真实字体替换。
4、从产品包装照编辑产品生活方式照
这是多图像合成的亮点。结合产品包装照、背景板和可选道具创建生活方式画面。模型自动匹配灯光、阴影和透视。
提示词:
使用提供的图像,创建高端生活方式照片。将图像1中的产品放在
图像2的厨房台面上。匹配温暖窗户灯光方向,添加真实的接触阴影
和微妙反光。35mm,浅景深,电影调色,3:2
设置: thinkingLevel: high | imageSize: 2K合成,4K最终 | aspectRatio: 3:2
陷阱:参考图像间灯光不一致会破坏合成。后期应用统一调色和颗粒处理。
5、编辑服装替换用于时尚电商
从一张图取一件衣服让另一张图的人穿上,灯光和阴影调整匹配。这为目录和造型手册启用快速虚拟造型打样。
提示词:
创建专业电商时尚照片。取图像1的夹克让图像2的模特穿上。
保持模特面部不变,调整灯光和阴影匹配,真实面料褶皱,4:5
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
陷阱:注意手部伪影和不合理的下摆。这是生成式合成,不是布料模拟——始终进行真实性检查。
6、使用语义蒙版编辑室内重新设计
不需要绘制蒙版。只需告诉模型要改变什么——"只换沙发"——同时保留其他一切。这是室内设计迭代的黄金法则。
提示词:
使用提供的图像,只将地毯改为深红色调的复古波斯地毯。
保持所有家具、墙饰、灯光和相机角度完全不变。保留阴影和透视。16:9
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:模糊目标如"让它更好看"会导致全局变化。精确指定什么改变什么保留。
7、编辑日转夜和情绪转换
将Nano Banana 2用作数字灯光师。将正午变成蓝调时刻,添加雾气,切换到钨丝室内灯光,或在保留场景几何的同时创建雨效。
提示词:
使用提供的照片,将场景从晴朗下午转为雨夜。
保持相机位置和主体不变。添加湿润反光、远处街灯光晕、
微妙薄雾、电影对比度,16:9
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:过度添加大气效果显得不自然。后期降低饱和度并添加一致颗粒。
8. 用于外观开发的编辑风格转换
取一张地点勘景照,用黑色墨水、水彩、合成波或绘画印象派重新渲染,不改变分镜。
提示词:
将提供的照片转换为1970年代电影海报插画风格。
保留原始构图,但使用粗犷半色调纹理、
有限调色和戏剧性阴影渲染。4:5
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终 | aspectRatio: 4:5
陷阱:如果不明确说"保留构图",模型可能重构你的图像。始终包含该约束。
9. 镜头和相机分镜探索
用不同镜头选择、相机高度和构图风格运行同一场景提示词。这是导演在承诺高分辨率渲染前找到正确电影摄影的沙盒。
提示词:
同一场景,双机测试:侦探进入昏暗汽车旅馆房间。
渲染为广角24mm建立镜头,低角度,实用灯+月光,胶片颗粒,21:9
设置: thinkingLevel: minimal | imageSize: 1K | aspectRatio: 21:9
陷阱:一次改变太多变量无法看出什么重要。一次扫描一个参数并建立联系表。
10. 保持主角一致的角色圣经
一致性是多步骤工作流,不是单一提示词。生成带多个角度的角色参考表,然后在后续提示词中重复使用该命名角色作为身份锚点。
提示词:
为"MARA"创建角色参考表(单一图像):成年女性,短黑发,
黄色雨衣,平静表情。包含3个视图(正面、侧面、3/4),
中性背景,一致灯光,电影写实,16:9
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:停止命名角色的那一刻就会出现漂移。保持一个"正典"画面可见并在每个后续提示词中引用。
11. 本地化和广告适配
翻译或替换图像中的文字并为新市场调整视觉。保持布局,交换语言,并调整小的文化线索如颜色选择或符号。
提示词:
使用提供的广告图像,只将标题翻译为西班牙语并确切设置为:
"OFERTA DE FIN DE SEMANA"。保持布局、字体和所有其他元素不变。
保留颜色和构图。4:5
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
陷阱:逐字错误仍会发生。将这些视为快速草稿,面向客户的工作在设计工具中替换最终排版。
12. 笔记转图表和信息图生成
Nano Banana 2可以将粗略笔记变成干净的图表和信息图,利用世界知识并可选地引用网络。与纯扩散模型不同,Gemini可以同时生成文本加图像输出。
提示词:
创建干净的等距信息图:"地球的层次"带标注地壳、地幔、
外核、内核。现代极简风格,清晰标注,核心微妙发光,16:9
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:要求太多标注会导致间距崩溃。保持干净简单,需要时在后期添加详细注释。
13. 基于搜索的精确渲染
这是Gemini独有的。启用Google搜索锚定在生成前验证事实并获取实时图像参考。非常适合旅行海报、建筑研究和"以X风格绘制这个特定东西"的请求。
提示词:
先使用网络图像搜索参考,然后生成:Bletchley Park Mansion
日出时的电影广角镜头,亮合成立体主义风格,无文字,16:9
设置: 启用google_search工具 | thinkingLevel: high | imageSize: 2K+ | aspectRatio: 16:9
陷阱:搜索锚定偏向常见照片。后期通过自定义调色和纹理叠加推进原创性。
14. 杂志封面和社论拼贴
将肖像、纹理背景和图形元素组合成杂志封面。推荐工作流是先生成不含文字的封面图像,然后在第二轮测试排版位置,最后在设计工具中定版字体。
提示词:
使用提供的图像,创建杂志封面打样:将图像1中的主体放在
图像2的纹理背景上。添加确切的报头文字:"NATURE"粗体无衬线
顶部。左侧添加3个短封面标语。社论灯光,4:5
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
陷阱:印刷仍需CMYK检查和真实字体控制。将AI输出作为布局方向,而非最终交付物。
15. 贴纸包和图标表
为保持多个小资产间线条粗细和阴影一致,在提示词中标准化调色板(3-5色)、描边粗细和阴影风格。
提示词:
贴纸表(单一图像含6个贴纸):可爱赛博朋克动物,粗净描边,
简单赛璐珞着色,有限调色板,每个贴纸带白边,干净白底,1:1
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终 | aspectRatio: 1:1
陷阱:低分辨率小细节模糊。生产资源几乎总是需要矢量重绘或带锐化的放大。
16. UI模型和设备框架产品照
Nano Banana 2可以起草UI模型并将其放入写实设备框架中。将排版限制为少量大字并指定网格系统。
提示词:
写实产品照:桌上现代智能手机,柔和窗户灯光,浅景深。
屏幕显示极简音乐播放器UI,确切标题"MIDNIGHT LOOP"和大播放按钮。
干净排版,3:2
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 3:2
陷阱:小UI文字会出错。在Figma或你选择的设计工具中用正确字体渲染替换微文案。
17. 多参考环境套件拼接
Vertex AI支持最多14张输入图像,启用套件拼接工作流。提供天空板、建筑参考、纹理色板和主体参考,请求统一灯光的连贯场景。
提示词:
使用提供的参考图像,创建连贯的电影城景:取图像1的天际线形状、
图像2的街景情绪和图像3的调色板。强制统一灯光方向、真实比例、
大气薄雾,21:9
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 21:9
陷阱:没有清晰层次的太多参考会产生混乱。为每个图像分配特定角色并在提示词中说明。
18. 房地产虚拟布置和去杂
让虚拟布置变得简单。去除杂物,添加有品味的家具,或现代化固定装置同时保持透视完整。始终保留原始照片并在政策要求时披露AI修改。
提示词:
使用提供的房间照片,只去除台面上的杂物,其他一切不变。
保留灯光、阴影和相机角度。16:9
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱:注意弯曲的直线。后期应用镜头校正和透视拉直。
19. 摄影连续性清理
AI清理笔刷。一次做一个改变——移除物体、修复反光、调整颜色——并保留对话历史让模型维持连续性上下文。
提示词:
使用提供的照片,只移除背景中分散注意力的标志。
保持主体的面部、头发和服装完全不变。匹配灯光和颗粒。3:2
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 3:2
陷阱:要求"更干净的图像"会触发全局平滑。精确指定要移除什么,后期加回微对比度和颗粒。
20. 快速多轮编辑循环
这是元工作流。生成草稿,请求定向编辑,放大到最终分辨率。使用官方SDK聊天/历史功能让思考签名自动管理。
提示词(第1轮):
生成雨夜霓虹小巷孤独骑车人的电影静态照,16:9。
然后我会请求迭代编辑——除非明确请求保持构图稳定
提示词(第2轮):
使用上一轮提供的图像,只将配色方案改为柔和青色和琥珀色,
略微增加雾气密度,锐化骑车人轮廓。保持所有几何不变。16:9
设置: 草稿用thinkingLevel: minimal开始,最终迭代切到high | imageSize: 1K到4K | aspectRatio: 16:9
陷阱:不要在一轮中堆积五个编辑。一次一到两个改变保持稳定。
21. 多图像合成剧本
上述工作流涵盖单独的技术,但Nano Banana 2的真正威力在你将它们组合成生产管道时显现。以下是始终有效的模式。
步骤1:锁定你的简报。开始前选择宽高比和分辨率目标。API支持显式imageConfig控制,没有规格开始会导致迭代浪费。
步骤2:建立风格指南。组装调色板参考、排版说明(如果嵌入文字)和2-4张情绪图像。使用风格、主体、场景、动作和构图清单作为你的标准。
步骤3:用最小思考草拟。用thinkingLevel: minimal和imageSize: 1K快速生成草稿以低成本探索构图。在锁定构图前不要在质量上浪费时间。
步骤4:用局部编辑迭代。使用语义蒙版语言——"只改变背景雾气密度"——避免意外漂移。一轮一个改变是最佳点。
步骤5:提升到高思考用于最终版。对于复杂约束(文字加构图加多主体),切换到thinkingLevel: high并提升到目标分辨率层级。
步骤6:后期制作。统一元素间的颗粒和对比度,如果专业发布用真实字体替换AI渲染的排版。Nano Banana 2在文字方面比大多数好,但生产排版仍受益于手动控制。
22. Nano Banana 2的定位
作为背景,以下是它与竞争对手的比较。
相比OpenAI的Image API,两者都支持文本到图像和修复式编辑。Nano Banana 2的领先之处在于原生搜索锚定和用于教程和信息图的"解释加渲染"交错。
相比Midjourney,他们交互式的"变化区域"修复对艺术家驱动迭代出色,而Gemini的优势是通过聊天或API更紧密集成到程序化管道和多图像合成。
相比Stable Diffusion 3,SD3通过其开源权重生态系统提供更深层可控性,但需要更多管道工程。Nano Banana 2用低层旋钮换取更快的端到端迭代。
相比FLUX,开源权重工具方法强调可自托管工作流,而Nano Banana 2强调集成多模态推理、多轮编辑和基于网络的生成。
差异化在于工作流,而不仅是输出质量。你可以在一个对话中进行定向迭代艺术指导,而不是每次都从头重新生成提示词。
23、接下来做什么
你现在有20个可直接运行的工作流和一个可以适应几乎任何创意项目的合成管道。以下是如何投入使用。
从工作流#1(电影英雄静态照)开始校准你的提示词风格并理解模型如何响应相机语言。然后选择最接近你实际生产需求的工作流,运行合成剧本中描述的草稿到最终循环。
模型名称是gemini-3.1-flash-image-preview,你可以通过Gemini API、Vertex AI或直接使用Gemini。从1K草稿开始,低成本迭代,只在最终渲染上花费4K token。
如果你一直困在其他图像工具的"生成并祈祷"模式中,Nano Banana 2的对话式编辑可能终于让AI图像生成感觉像真正的创意工作流。
原文链接:20 Creative Workflows That Make Nano Banana 2 the Most Versatile Image Model You're Not Using Yet
汇智网翻译整理,转载请标明出处