20个Nano Banana 2创意工作流
你可能已经生成过一些AI图像了。也许是头像、logo概念图,或者一只穿着宇航服的奇怪猫咪。但如果我告诉你,有一个图像模型可以让你生成图像、编辑图像、合成多张图像、渲染可读文字,甚至还能通过实时网络搜索来锚定输出结果,而且全部都在一个对话式API中完成,你会怎么想?
这个模型就是Nano Banana 2,Google对其Gemini原生图像生成能力的公开命名,它正悄然成为开发者可用的最成熟的创意工具之一。
在本文中你将学到:
- Nano Banana 2到底是什么:模型架构、关键设置,以及它与其他图像生成器的区别
- 20个生产级工作流:每个都附带可直接复制粘贴运行的电影级提示词
- 多图像合成:如何在不使用Photoshop的情况下将多张参考图像组合成连贯场景
- 实用陷阱与后期技巧:关于如何让AI生成图像真正可用,那些没人告诉你的事
0. Nano Banana 2是什么,为什么你应该关注?
Nano Banana是Gemini原生图像生成的总称。Nano Banana 2特指gemini-3.1-flash-image-preview模型。它接受文本和图像输入,可以根据你如何配置responseModalities来单独输出图像或交错输出文本和图像。
以下是它让创意专业人士感兴趣的地方。与大多数将每个提示视为独立事件的图像生成器不同,Nano Banana 2采用对话式工作方式。你生成一张图像,然后告诉它只改变背景雾气。然后你要求它更换调色板。然后你提升到最终分辨率。这是迭代式艺术指导,不是提示词轮盘赌。
你需要了解的关键控制参数包括用于构图的imageConfig.aspectRatio、用于分辨率的imageConfig.imageSize(1K用于草稿,2K/4K用于最终稿),以及用于复杂多约束场景的thinkingLevel(minimal用于速度,high用于质量)。Temperature默认为1.0,seed存在但确定性是尽力而为。
在我们深入之前快速说明一下:Nano Banana 2不像许多开源流程那样提供"扩散步数"控制。你的质量和速度调节旋钮是imageSize和thinkingLevel。请相应地使用它们。
现在让我们深入了解20个工作流,解锁这个模型的全部功能。
1. 电影级主视觉静帧
这是你的基准。像电影摄影师而不是插画师那样提示Nano Banana 2。使用电影静帧公式:主体 + 动作 + 环境 + 光线 + 镜头 + 胶片 + 调色 + 构图。
提示词:
Cinematic film still, 35mm, low-angle medium shot of a street saxophonist under
a neon sign in light rain, reflections on wet asphalt, shallow depth of field,
soft bokeh, teal-orange color grade, subtle film grain, 16:9.
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终稿 | aspectRatio: 16:9
陷阱: 矛盾的光线描述(如"黑色电影硬光"加"阴天柔光")会产生模糊的画面。选择一个方向。
2. 三格故事板画面
即时预可视化。生成三个保持服装、道具和场景一致的画面,通过命名角色并在各画面中重复使用相同的描述词来实现。
提示词:
Create a 3-panel storyboard (single image containing three frames). Same
character throughout: "MARA" = adult woman, short black hair, yellow raincoat.
Scene: foggy harbor at dawn. Panel 1: wide establishing shot. Panel 2: medium
shot as she opens a rusted locker. Panel 3: close-up on her eyes reflecting
flashing red light. Cinematic lighting, 16:9 overall layout.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱: 画面内的小文字会漂移。仅在必要时添加画面标签,并在后期叠加干净的矢量边框。
3. 带字体的标题卡和海报
Nano Banana 2处理图像内文字的能力优于大多数生成器。将确切文字放在引号中,并明确描述字体样式。
提示词:
Cinematic poster design, gritty sci-fi noir. Central image: lone figure under a
streetlamp in thick fog, 35mm, high contrast, film grain. Add the title text
exactly: "GLASS RAIN" in bold condensed sans-serif, slightly distressed, top
center. Add tagline: "A CITY THAT FORGETS" in small caps. 4:5.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
陷阱: 小尺寸时偶尔会出现字形错误。将AI文字视为草稿,最终印刷时替换为真实字体。
4. 从产品白底图编辑生活方式照片
这是多图像合成大放异彩的地方。将产品白底图、背景板和可选道具组合起来创建生活方式画面。模型会自动匹配光线、阴影和透视。
提示词:
Using the provided images, create a premium lifestyle photo. Place the product
from image 1 on the kitchen counter from image 2. Match the warm window light
direction and add realistic contact shadows and subtle reflections. 35mm,
shallow DOF, cinematic color grade, 3:2.
设置: thinkingLevel: high | imageSize: 2K合成,4K最终稿 | aspectRatio: 3:2
输入图像1:
输入图像2:
输出:
陷阱: 参考图像之间光线不一致会破坏合成效果。在后期处理中应用统一的调色和颗粒效果。
5. 时尚电商的服装替换编辑
从一张图像中取出服装,让另一张图像中的人物穿上,并调整光线和阴影以匹配。这可以实现目录和造型手册的快速虚拟造型样稿。
提示词:
Create a professional e-commerce fashion photo. Take the jacket from image 1 and
let the model from image 2 wear it. Keep the model's face unchanged, adjust
lighting and shadows to match, realistic fabric folds, 4:5.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
输入图像1:
输入图像2:
输出图像:
陷阱: 注意手部伪影和不合理的下摆。这是生成式合成,不是布料模拟,始终要进行真实感检查。
6. 语义遮罩室内重设计编辑
无需绘制遮罩。只需通过对话告诉模型要更改什么,比如"只改沙发",同时保留其他一切。这对室内设计迭代来说是黄金工作流。
提示词:
Using the provided image, change only the rug to a vintage Persian rug in deep
red tones. Keep all furniture, wall art, lighting, and camera angle exactly the
same. Preserve shadows and perspective. 16:9.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
输入图像:
输出图像:
陷阱: 模糊的目标如"让它更好看"会导致全局变化。对要更改和保留的内容要精确到手术般的程度。
7. 白天到夜晚和氛围转换编辑
将Nano Banana 2用作数字灯光师。将正午变成蓝调时刻,添加雾气,切换到钨丝室内灯光,或在保留场景几何结构的同时创建雨景。
提示词:
Using the provided photo, transform the scene from sunny afternoon into rainy
night. Keep the camera position and main subject unchanged. Add wet reflections,
distant streetlight glow, subtle mist, cinematic contrast, 16:9.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
输入图像:
输出图像:
陷阱: 过度添加大气效果会显得合成感强。在后期处理中降低饱和度并添加一致的颗粒效果。
8. 风格迁移用于外观开发编辑
取一张勘景照片,在不改变构图的情况下,用黑色墨水、水彩、合成波或印象派绘画风格重新渲染。
提示词:
Transform the provided photograph into a 1970s film poster illustration style.
Preserve the original composition, but render with bold halftone texture,
limited color palette, and dramatic shadows. 4:5.
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终稿 | aspectRatio: 4:5
输入图像:
输出图像:
陷阱: 如果你不明确说"保留构图",模型可能会重新构图你的图像。始终包含这个约束条件。
9. 镜头和机位探索
用不同的镜头选择、相机高度和构图风格运行相同的场景提示。这是导演在提交高分辨率渲染之前寻找合适摄影手法的沙盒。
提示词:
Same scene, two-camera test: a detective entering a dim motel room. Render as a
wide 24mm establishing shot, low angle, practical lamp + moonlight, film grain,
21:9.
设置: thinkingLevel: minimal | imageSize: 1K | aspectRatio: 21:9
输入图像:
输出图像:
陷阱: 一次改变太多变量会让你无法看出什么起了作用。一次只扫描一个参数并建立联系表。
10. 角色设定集用于一致的主角
一致性是一个多步骤工作流,不是单个提示词。生成一个包含多个角度的角色参考表,然后在后续提示中重用该命名角色作为身份锚点。
提示词:
Create a character reference sheet (single image) for "MARA": adult woman, short
black hair, yellow raincoat, calm expression. Include 3 views (front, side, 3/4)
on a neutral background, consistent lighting, cinematic realism, 16:9.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱: 一旦你停止命名角色,漂移就会发生。保留一张"官方"参考帧并在每次后续提示中引用它。
11. 本地化和广告适配
翻译或替换图像中的文字,并调整视觉以适应新市场。保留布局,更换语言,并调整小的文化线索如颜色选择或符号。
提示词:
Using the provided ad image, translate only the headline into Spanish and set it
exactly as: "OFERTA DE FIN DE SEMANA". Keep the layout, fonts, and all other
elements unchanged. Preserve colors and framing. 4:5.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
输入图像:
输出图像:
陷阱: 逐字母错误仍然会发生。将这些视为快速草稿,并在设计工具中替换最终字体以用于面向客户的工作。
12. 笔记转图表和信息图生成
Nano Banana 2可以将粗略的笔记转换为干净的图表和信息图,利用世界知识并可选地使用网络参考。与仅支持扩散的模型不同,Gemini可以同时生成文本加图像输出。
提示词:
Create a clean isometric infographic: "The Layers of the Earth" with labeled
crust, mantle, outer core, inner core. Modern minimal style, crisp labels,
subtle glow in the core, 16:9.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
陷阱: 请求太多标签会导致间距崩溃。保持简洁,如果需要的话在后期添加详细注释。
13. 搜索锚定的准确渲染
这是Gemini独有的。启用Google Search锚定来验证事实并在生成前拉取实时图像参考。非常适合旅行海报、建筑研究和"用X风格画这个特定事物"的请求。
提示词:
Use web image search references first, then generate: a cinematic wide shot of
Bletchley Park Mansion at sunrise, bright Synthetic Cubism style, no text, 16:9.
设置: 启用google_search工具 | thinkingLevel: high | imageSize: 2K+ | aspectRatio: 16:9
陷阱: 搜索锚定偏向常见照片。在后期通过自定义调色和纹理叠加来推动原创性。
14. 杂志封面和编辑拼贴
将肖像、纹理背景和图形元素组合成杂志封面。推荐的工作流是先生成不带文字的封面图像,然后在第二轮测试中排版位置,最后在 design 工具中定稿字体。
提示词:
Using the provided images, create a magazine cover mockup: place the subject
from image 1 on the textured backdrop from image 2. Add masthead text exactly:
"NATURE" in bold sans-serif at top. Add 3 short cover lines on the left.
Editorial lighting, 4:5.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 4:5
输入图像1:
输入图像2:
输出图像:
陷阱: 对于印刷,你仍然需要CMYK检查和真正的字体控制。将AI输出用作布局方向,而不是最终交付物。
15. 贴纸包和图标表
为了在多个小资源中保持一致的线宽和阴影,在提示中标准化你的调色板(3-5种颜色)、轮廓粗细和阴影样式。
提示词:
Sticker sheet (single image with 6 stickers): cute cyberpunk animals, bold clean
outlines, simple cel shading, limited palette, each sticker with a white border,
clean white background, 1:1.
设置: thinkingLevel: minimal | imageSize: 1K草稿,2K最终稿 | aspectRatio: 1:1
陷阱: 低分辨率下微小细节会模糊。矢量重绘或带锐化的放大几乎总是生产资源所需要的。
16. UI样机和带设备边框的产品照片
Nano Banana 2可以起草UI样机并将它们放入逼真的设备边框中。将你的字体限制为少量大字,并指定网格系统。
提示词:
Photoreal product shot: a modern smartphone on a desk, soft window light,
shallow DOF. On screen, show a minimalist music player UI with the exact title
"MIDNIGHT LOOP" and a large play button. Clean typography, 3:2.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 3:2
陷阱: 小UI文字会出错。在Figma或你选择的设计工具中用适当的字体渲染替换微文案。
17. 多参考环境拼接
Vertex AI支持多达14张输入图像,实现拼接工作流。输入天空板、建筑参考、纹理样本和主体参考,并要求生成光线统一的有凝聚力的场景。
提示词:
Using the provided reference images, create a cohesive cinematic cityscape: take
skyline shapes from image 1, street-level mood from image 2, and color palette
from image 3. Enforce one light direction, realistic scale, atmospheric haze,
21:9.
设置: thinkingLevel: high | imageSize: 2K+ | aspectRatio: 21:9
输入图像1:
输入图像2:
输入图像3:
输出图像:
陷阱: 太多参考而没有清晰的层次会产生混乱。为每张图像分配特定角色并在提示中明确指出。
18. 房地产虚拟布置和清理
虚拟布置变得简单。移除杂物,添加雅致的家具,或在保持透视不变的情况下现代化固定装置。始终保留原始照片,并在政策要求的地方披露AI修改。
提示词:
Using the provided room photo, remove only the clutter on the countertops and
keep everything else unchanged. Preserve lighting, shadows, and camera angle.
16:9.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 16:9
房间照片:
输出图像:
陷阱: 注意扭曲的直线。在后期应用镜头校正和透视拉直。
19. 摄影连续性清理
AI清理画笔。一次只做一处更改,移除物体、修复反射、调整颜色,并保留你的对话历史以便模型保持连续性上下文。
提示词:
Using the provided photo, remove only the distracting sign in the background.
Keep the subject's face, hair, and clothing completely unchanged. Match lighting
and grain. 3:2.
设置: thinkingLevel: high | imageSize: 2K | aspectRatio: 3:2
输入图像:
输出图像:
陷阱: 要求"更干净的图像"会触发全局平滑。具体说明要移除什么,并在后期添加回微对比度和颗粒。
20. 快速多轮编辑循环
这是元工作流。生成草稿,请求针对性编辑,提升到最终分辨率。使用官方SDK聊天/历史功能以便自动管理思维签名。
提示词(第1轮):
Generate a cinematic still of a rainy neon alleyway with a lone cyclist, 16:9.
Then I will ask for iterative edits - keep composition stable unless explicitly
requested.
提示词(第2轮):
Using the provided image from the previous turn, change only the color palette
to muted teal and amber, increase fog density slightly, and sharpen the cyclist
silhouette. Keep all geometry unchanged. 16:9.
设置: 草稿用thinkingLevel: minimal,最终迭代切换到high | imageSize: 1K到4K | aspectRatio: 16:9
提示词1:
提示词2:
陷阱: 不要在一个回合中堆叠五个编辑。一次一到两个更改保持稳定。
21. 多图像合成操作手册
上面的工作流涵盖了个别技术,但Nano Banana 2的真正力量在于将它们组合成生产流程时显现。以下是始终有效的模式。
第1步:锁定你的简报。 在开始之前选择宽高比和分辨率目标。API支持显式的imageConfig控制,没有规格就开始会导致浪费的迭代。
第2步:建立风格指南。 组装调色板参考、字体说明(如果嵌入文字)和2-4张情绪图像。使用风格、主体、场景、动作和构图检查清单作为你的标准。
第3步:用minimal thinking起草。 以thinkingLevel: minimal和imageSize: 1K生成快速草稿以廉价探索构图。在构图确定之前不要浪费时间在质量上。
第4步:用局部编辑迭代。 使用语义遮罩语言,比如"只改变背景雾气密度",以避免无意的漂移。每回合一个更改是最佳点。
第5步:为最终稿提升到high thinking。 对于复杂约束(文字加构图加多主体),切换到thinkingLevel: high并提升到你的目标分辨率级别。
第6步:后期制作。 统一各元素之间的颗粒和对比度,如果你是专业交付,用真实字体替换AI渲染的字体。Nano Banana 2在文字方面比大多数更好,但生产级字体仍然受益于手动控制。
22. Nano Banana 2如何与竞品对比
为了提供背景,以下是它与竞品的比较。
与OpenAI的图像API相比,两个生态系统都支持文本到图像和修复式编辑。Nano Banana 2领先的地方是原生搜索锚定和用于教程和信息图的"解释加渲染"交错输出。
与Midjourney相比,他们交互式的"Vary Region"修复对于艺术家驱动的迭代非常出色,而Gemini的优势在于更紧密地集成到程序化流程中,以及通过聊天或API进行多图像合成。
与Stable Diffusion 3相比,SD3通过其开放权重生态系统提供更深的可控性,但需要更多的流程工程。Nano Banana 2用更快的端到端迭代换取了底层旋钮。
与FLUX相比,开放权重工具方法强调可自托管的工作流,而Nano Banana 2强调集成的多模态推理、多轮编辑和网络锚定生成。
差异化在于工作流,而不仅仅是输出质量。你可以在一个对话中进行指令式、迭代的艺术指导,而不是每次都从头重新滚动提示词。
23. 结束语
你现在有20个可运行的工作流和一个可以适应几乎任何创意项目的合成流程。以下是如何将它们投入使用。
从工作流#1(电影级主视觉静帧)开始,校准你的提示词风格并了解模型如何响应相机语言。然后选择最接近你实际生产需求的工作流,并运行合成操作手册中描述的草稿到最终循环。
模型名称是gemini-3.1-flash-image-preview,你今天可以通过Gemini API、Vertex AI或直接使用Gemini访问它。从1K草稿开始,廉价迭代,只在最终渲染上消耗4K token。
如果你一直被困在其他图像工具的"生成并祈祷"模式中,Nano Banana 2的对话式编辑可能是最终让AI图像生成感觉像真正创意工作流的东西。
本周尝试一个工作流,让我知道你构建了什么。我特别好奇人们用搜索锚定渲染做什么,那是真正感觉新颖的功能。
原文链接:20 Creative Workflows That Make Nano Banana 2 the Most Versatile Image Model You're Not Using Yet
汇智网翻译整理,转载请标明出处