Nano Banana Pro 提示工程

AI 图像生成已经达到了一个重要的转折点。过去我们很难向算法表达视觉风格,现在像 Nano Banana Pro 这样的模型已经能够理解光的物理特性、设计运动的理念以及专业渲染引擎的技术规范——这一切都通过纯英文描述实现。

但问题是:知道一个工具强大并不意味着知道如何驾驭它。我上周深入研究如何设计提示词,将模糊的创意想法转化为生产就绪的 3D 视觉效果。我发现这不是魔法——这是一门技艺,就像任何技艺一样,它遵循可重复的模式。

本指南将概述基本的 3D 场景风格、它们的技术特征,以及使 Nano Banana Pro 持续产生出色结果的确切提示词公式。无论你是设计师、3D 艺术家还是创意技术专家,这些技术都会将你的迭代周期从数十次尝试减少到仅几次。

1、为什么 Nano Banana Pro 改变了一切

Nano Banana Pro 于 2025 年 11 月发布,代表了 AI 图像生成的根本性转变。与依赖 Gemini 2.5 Flash Image 的前代产品不同,Nano Banana Pro 利用 Gemini 3 Pro 的推理引擎配以高保真扩散头。这种"大脑和手"的拓扑结构意味着模型不仅匹配你的提示词模式,还理解空间关系、物理特性和上下文意图。

实际优势包括:原生 4K 分辨率可放大至近无损质量、10 秒内的生成速度、前所未有的角色一致性(跨多个图像最多 5 个人),以及工作室级编辑能力。但真正的突破在于它如何解释关于渲染风格、材质和灯光设置的复杂技术提示词。它真正在思考你要求什么,而不仅仅是执行模式回忆。

对于 3D 场景生成而言,这意味着你终于可以像专业人士那样描述你想要的——使用行业术语——并获得与该愿景匹配的结果。

2、基础:理解提示词架构

在深入研究特定风格之前,你需要了解如何构建提示词以实现最大效果。此框架适用于所有生成器,但在 Nano Banana Pro 上尤为强大。

每个有效的提示词都遵循此层次结构:

  • 主体:你在生成什么?要具体(不是"一个房间",而是"带有落地窗的野兽派混凝土阁楼内部")
  • 核心描述符:物理特性、材质、纹理和关键特征。这是你的渲染风格真正存在的地方。
  • 技术规格:分辨率、渲染引擎、灯光方法和质量基准。这告诉模型你追求的确切技术质量。
  • 氛围与构图元素:情绪、色调、构图、景深和情感意图。
  • 否定约束:明确不包括的内容。这可以防止常见的 AI 失败。

模式:[主体]、[材质/纹理]、[渲染风格]、[灯光]、[构图]、[质量/技术]、[情绪/氛围]

让我们将其应用于实际风格。

3、第一部分:高频必备风格

这些是你 80% 时间都会使用的风格,因为它们几乎适用于一切。

3.1 照片级真实感渲染(专业标准)

这是客户想要看某物实际样貌时的默认选择。想想产品摄影、建筑可视化或需要感觉真实的概念艺术。

核心特征:照片精度、自然光照(通常是工作室)、清晰对焦、微细节可见性、正确的材质属性、零风格化。

为什么重要:如果你在视觉上销售某些东西——产品、空间、概念——照片级真实感是不可商量的。

英文模板

[Subject], photorealistic 3D render, octane render, PBR materials, studio lighting with subtle key/fill setup, 8K resolution, ray-traced reflections, sharp focus, professional product photography, minimal background distraction, warm color temperature

实用示例:"Modern titanium coffee maker, photorealistic 3D render, octane engine, brushed metal surfaces with PBR detail, warm studio lighting at 45 degrees, white seamless background, 8K, professional product photography, sharp focus, minimal shadows."

专业提示:"octane render" 关键词告诉 Nano Banana Pro 你想要具有正确光行为的基于物理的渲染。"PBR materials" 规范确保表面对光的响应正确(金属反射、橡胶散射、玻璃折射)。

不应做:不要在没有指定 Octane 或 Unreal Engine 的情况下要求"realistic"——模型对此有不同的解释。不要忘记分辨率规格(8K 是行业标准)。不要跳过材质描述——这就是模型知道如何渲染金属、织物还是塑料的方式。

3.2 皮克斯/迪士尼 3D 动画风格

这是任何需要个性的事物的首选。与照片级真实感不同,皮克斯风格渲染优先考虑吸引力和表达而非准确性。角色和物体从根本上都是风格化的,具有夸张的比例、干净的表面和情感温暖。

核心特征:平滑着色、圆形形状、充满活力的饱和色彩、富有表现力的特征、赛璐珞着色色调、高对比度光照、零照片级真实感。

何时使用:角色设计、营销材料、儿童内容、任何需要魅力而非准确性的内容。

英文模板

[Character/Subject], Pixar animation style, 3D character render, rounded shapes, smooth surfaces, vibrant color palette, expressive features, soft studio lighting, cel-shading influence, 4K, polished finish, appealing proportions, clean white background

实用示例:"A mechanical robot assistant character, Pixar animation style, round cylinder body with expressive digital eyes, metallic silver finish with matte orange accents, smooth shading, vibrant colors, soft diffuse lighting, 4K render, appealing proportions, clean background."

专业提示:皮克斯风格在你描述情感意图时效果最好。不要只说"cute robot"——解释是什么让它可爱。"相对于身体过大的头部、大圆眼睛、短小的四肢"对模型的转化效果要好得多。

常见错误:将照片级真实感混合到皮克斯提示词中("photorealistic Pixar style")。这些是矛盾的——选择一个。如果你想要风格化但真实,请使用"Disney-inspired 3D"。

3.3 低多边形(几何极简主义)

低多边形是将约束转化为优雅的美学。刻面表面、平坦着色、几何纯净——这是优化游戏引擎、现代设计和数字艺术画廊的风格。

核心特征:平坦着色、可见的多边形边缘、几何抽象、刻面表面、极简色调、锋利边缘、数字优先美学。

何时使用:当代设计、科技产品、数字艺术作品、游戏、极简主义营销。

英文模板

[Subject], low poly 3D art, geometric faceted surfaces, flat shading, minimalist design, limited color palette with high contrast, isometric view, clean background, sharp polygon edges, 4K, digital illustration aesthetic, clean lines

实用示例:"A fox sitting, low poly 3D art style, geometric faceted body made of sharp polygons, orange and white color palette, flat shading, isometric perspective, gray minimalist background, 4K, digital art aesthetic."

专业提示:低多边形与等轴视角(2.5D 透视)配合得非常好。这种组合感觉自然且有意图。将你的色调限制为 3-4 种主要颜色——这对于低多边形美学至关重要。

失败的原因:颜色太多、曲面(它们违背了目的)和复杂的灯光。保持简单;这就是全部意义所在。

3.4 体素艺术(块状 3D 像素风格)

体素艺术介于 Minecraft 和严肃游戏引擎之间。它在独立游戏和复古灵感数字艺术中变得流行。块状美学矛盾地既感觉怀旧又感觉前沿。

核心特征:立方体素单元、像素化外观、Minecraft 美学、等轴渲染、充满活力的复古色彩、块状表面。

何时使用:游戏艺术、复古营销、像素艺术爱好者、数字艺术装置、独立游戏设计。

英文模板

[Subject], voxel art style, blocky 3D pixels, minecraft aesthetic, cubic voxel construction, pixelated textures, isometric view, vibrant retro color palette, volumetric lighting, 4K, digital game art

实用示例:"A fantasy castle on a hill, voxel art style, blocky cubic construction, vibrant retro colors — deep blue stone, bright green grass, warm orange torch light, isometric perspective, small scale feel, volumetric lighting, pixelated textures."

有效方法:等轴视角 + 小/亲密尺度 + 充满活力的颜色。当体素艺术看起来像你可以握在手里的东西时,它的感觉最好。

3.5 黏土/橡皮泥材质渲染

这种风格模仿手工制作的定格动画材料。它是温暖、触觉的、略有不完美——与数字精确性相反。想想 Aardman 动画和 PlayDough。

核心特征:哑光表面饰面、柔和色调、柔和边缘、指纹纹理可见性、类似黏土的材质属性、手工雕刻美学、业余精度。

何时使用:俏皮内容、儿童材料、工艺启发设计、定格动画、怀旧品牌推广。

英文模板

[Subject], clay render style, plasticine material, soft matte surface, pastel color palette, hand-sculpted aesthetic, fingerprint details visible, studio softbox lighting, warm atmosphere, 4K, handcraft feel, no glossiness

实用示例:"A cute snail character, clay render style, orange and brown plasticine body, soft rounded shapes, pastel color palette, visible fingerprint texture in material, warm studio lighting, handmade aesthetic, 4K, cozy atmosphere."

专业提示:柔和色调是必不可少的——它们发出柔软的信号。避免任何关于光泽、反射或闪光的提及。强调"手工制作"和"触觉"。

4、第二部分:商业和玩具设计风格

这些风格主导电子商务、收藏品和当代设计。它们针对视觉吸引力和适销性进行了优化。

4.1 盲盒/泡泡玛特风格

这是高端收藏玩具的美学——特别是泡泡玛特和类似品牌所完善的风格。视觉 DNA:大而明亮的眼睛、光滑的 PVC 表面、完美的比例、工作室级呈现。

核心特征:Q 版比例(过大的头部)、大而富有表现力的眼睛、光滑的 PVC 材质、零瑕疵、专业工作室灯光、居中构图、柔和背景。

何时使用:玩具设计、收藏品营销、角色商品、可爱的商业产品。

英文模板

[Character], blind box toy design, Pop Mart style, chibi proportions with oversized head, large luminous eyes, smooth PVC plastic material, perfect finish, studio softbox lighting, centered composition, clean white background, professional product photography, adorable appeal

实用示例:"A cat character, Pop Mart blind box style, chibi proportions, oversized head with large round eyes, smooth white PVC body with pink accents, perfect blemish-free finish, studio lighting setup with soft shadows, centered on white background, professional product shot."

关键细节:"Blemish-free"和"perfect finish"是必不可少的。没有这些,你得到的是手工玩具,而不是工厂完美的收藏品。

4.2 乐高积木构建风格

乐高提示词要求你思考积木如何物理组装。这不是关于渲染乐高场景——而是关于让某物看起来像它乐高积木制成。

核心特征:单独的塑料积木、可见的凸点、玩具建筑美学、明亮的主色调、微距摄影视角、景深、块状比例。

何时使用:玩具摄影、俏皮的产品设计、乐高营销内容、儿童教育材料。

英文模板

[Subject], constructed from LEGO bricks, macro photography perspective, colorful plastic brick texture with visible studs, bright primary color palette, shallow depth of field, close-up focus, soft natural lighting, toy photography aesthetic, 4K

实用示例:"A dragon toy, constructed entirely from LEGO bricks, bright blue and orange plastic pieces, visible studs and connectors, macro photography angle, shallow depth of field with blurred background, soft natural lighting, toy photography style."

专业提示:微距摄影视角至关重要——这使乐高比例感觉真实。你在用玩具建造的东西,而不是看玩具比例的风景。

4.3 充气/气泡 3D 风格

这是 2024-2025 年的趋势美学。蓬松、圆形、光泽的表面同时感觉柔软和反射。想想高级时尚编辑、潮流运动鞋广告和当代艺术装置。

核心特征:光泽乙烯基材质、蓬松圆形形状、强烈反射、充满活力的色块、柔和渐变背景、时尚编辑灯光。

何时使用:时尚营销、奢侈产品设计、潮流商业作品和当代数字艺术。

英文模板

[Subject], inflatable 3D art style, glossy vinyl material, puffy balloon-like surfaces, smooth rounded shapes, vibrant color palette, strong specular reflections, studio lighting with highlights, fashion editorial aesthetic, vibrant background, 4K

实用示例:"A pair of futuristic sneakers, inflatable bubble style, glossy vinyl material, puffy rounded volume, electric blue and hot pink color blocking, smooth reflective surfaces, strong light highlights, fashion photography lighting, vibrant gradient background."

重要因素:光泽反射是必不可少的——没有它们,它只是充气的,而不是编辑级充气。反射让它感觉昂贵。

5、第三部分:艺术运动和氛围风格

5.1 赛博朋克 3D

赛博朋克在 2023-2024 年占据主导地位。它已经超越了仅仅是"紫色和青色",演变为更复杂的东西——霓虹饱和、金属表面、高科技污垢、复古未来主义冲突。

核心特征:霓虹灯、紫色/青色主导、金属表面、未来主义但复古、情绪/黑暗氛围、高对比度、技术元素。

何时使用:科幻营销、科技产品、游戏内容、音乐视频、潮流商业作品。

英文模板

[Subject], cyberpunk 3D style, neon-lit atmosphere, purple and cyan color scheme, metallic surfaces, futuristic retro aesthetic, high contrast shadows, moody lighting, octane render, dark but vibrant, 4K, atmospheric depth

实用示例:"A cyberpunk motorcycle in an alley, neon-lit cyberpunk style, chrome metallic body, purple and cyan neon lights casting hard shadows, wet reflective surfaces, dark moody atmosphere but vibrant neon, octane render, 4K, atmospheric fog, high contrast."

2025 年 12 月更新:在提示词中添加"Gemini 3 understanding"——提及霓虹如何与材质相互作用。"Neon reflections on wet chrome"比单独使用"neon"更好。

5.2 超现实主义和梦境逻辑

3D 中的超现实主义是以美学上令人愉悦的方式违反物理定律。物体漂浮、融化、挑战尺度。它要求你既精确又不可能。

核心特征:不可能的几何、漂浮物体、融化形式、梦境逻辑、神秘氛围、沙漠/虚空背景、萨尔瓦多·达利影响。

何时使用:概念艺术、实验营销、专辑艺术、心理/哲学内容。

英文模板

[Subject], 3D surrealism, dreamlike impossibility, floating objects, melting forms, impossible geometry, mysterious desert landscape background, salvador dali influence, soft ethereal lighting, pastel surreal colors, 4K, narrative ambiguity

实用示例:"A grand piano melting like candle wax while floating above a desert, 3D surrealism, impossible geometry, soft ethereal lighting casting long shadows, mysterious atmosphere, pastel color palette with deep reds and blues, Salvador Dali aesthetic, infinite desert horizon."

关键元素:不可能的几何需要接地。你的概念越超现实,你的灯光和材质渲染应该越现实。这种对比使不可能感觉有意义,而不是偶然。

5.3 野兽派 3D

野兽派已经从建筑风格转变为无处不在的美学。它是关于巨大的混凝土形式、纪念性尺度、原始材料和几何力量。在 3D 渲染中,它变得更黑暗和更不祥。

核心特征:巨大的混凝土结构、单石几何、原始材质纹理、灰色单色调、戏剧性阴影、纪念性尺度、寒冷氛围。

何时使用:建筑可视化、哲学/反乌托邦内容、工业设计、严肃商业作品、纪录片美学。

英文模板

[Subject], brutalist 3D style, massive concrete structures, monolithic geometric forms, raw cement texture, dramatic shadow play, monochromatic gray palette, monumental scale, cold atmosphere, octane render, 4K, architectural precision

实用示例:"A brutalist government building, massive concrete brutalism, geometric monoliths, raw unfinished cement surfaces, dramatic deep shadows from hard directional light, gray monochromatic color scheme, inhuman scale, cold atmosphere, octane render, architectural precision."

5.4 蒸汽朋克 3D

蒸汽朋克将维多利亚美学与机械科幻连接起来。它需要平衡装饰与功能性、优雅与工业厚重感。

核心特征:复杂的齿轮和钟表、黄铜和铜纹理、皮革点缀、维多利亚时代设计、蒸汽动力元素、机械复杂性、温暖氛围灯光。

何时使用:奇幻/架空历史内容、机械产品设计、主题营销、复古未来主义品牌推广。

英文模板

[Subject], steampunk 3D style, intricate visible gears and clockwork, brass and copper metal textures, leather accents and worn details, Victorian era elegance, steam-powered mechanical elements, complex engineering, warm atmospheric lighting, octane render, 4K, richly detailed

实用示例:"A steampunk airship engine, brass and copper gears visible, intricate clockwork mechanisms, worn leather belts, Victorian brass fittings, steam vents, warm golden-orange atmospheric lighting, octane render, incredibly detailed engineering, 4K."

2025 年更新:Nano Banana Pro 擅长理解机械复杂性。你可以描述单个齿轮齿,它会渲染它们。利用这一点——在机械细节方面比旧模型更具体。

6、第四部分:高级技术渲染方法

6.1 线框和蓝图美学

线框渲染已经超越了纯技术可视化,进入了美学领域。它用于当代设计、UI/UX 演示和数字艺术。

核心特征:发光霓虹线、网格拓扑、蓝图风格、黑色虚空背景、技术美学、全息质量。

何时使用:科技产品发布、设计作品集、UI 演示、数字艺术、建筑概念传达。

英文模板

[Subject], 3D wireframe render, glowing neon lines in electric blue or white, blueprint aesthetic, black void background, grid topology visible, holographic quality, cybernetic precision, 4K, clean technical aesthetic

实用示例:"A sports car, wireframe 3D render, glowing cyan neon lines showing car geometry, blueprint style technical drawing, black space background, visible mesh topology, holographic light quality, cybernetic aesthetic, 4K, clean execution."

6.2 ZBrush 雕刻/数字黏土材质

这显示的是过程,而不是成品。它是纹理和完成之前的原材料——最大细节的灰度雕刻。

核心特征:灰色哑光材质、未纹理表面、高多边形细节、戏剧性轮廓光、角色概念艺术风格、雕刻形式焦点。

何时使用:角色设计作品集、概念艺术演示、设计文档和 3D 艺术教育。

英文模板

[Character], ZBrush digital sculpture style, gray matte clay material, untextured, intricate surface details, high polygon count visible, dramatic rim lighting from sides, character concept art aesthetic, 4K, sculptural focus

实用示例:"A fantasy warrior, ZBrush sculpture style, gray clay material, untextured surface, incredibly detailed skin texture and muscle definition, ornate armor details sculpted in high polygon, dramatic rim lighting highlighting form, character concept art, 4K."

7、融会贯通:生产使用的完整实用提示词

这是理论变成实践的地方。这些是你可以针对特定主题调整的即用型模板。

模板 1:专业产品可视化

[Product name and type], photorealistic 3D render, octane render engine, brushed [material] surfaces with accurate PBR properties, professional studio lighting with key light at 45 degrees and fill light from left, warm white background with subtle gradient, 8K resolution, ray-traced reflections, sharp focus on product, minimal depth of field, product photography aesthetic, clean minimalist composition

模板 2:角色概念艺术

[Character concept], character design 3D render, [reference style], [body proportions], [color palette], expressive facial features, dynamic pose, dramatic spotlighting from above-right, atmospheric background suggesting [environment], 4K, professional concept art, portfolio-ready quality

模板 3:建筑可视化

[Building/Space name], architectural 3D visualization, [architectural style], [primary material], natural daylight from [direction], realistic material textures including [specific elements], human scale reference, environmental context showing [surroundings], octane render, 4K, professional architectural presentation

模板 4:环境中的产品

[Product], [style] in [environment], product photography aesthetic, [lighting setup], [background aesthetic], lifestyle context showing [use case], 8K, commercial product photography, editorial quality

模板 5:角色动画帧

[Character], [animation style], dynamic action pose [describe action], [lighting approach], [environment], [color mood], 4K animation frame, professional studio quality, [emotional intent]

8、避免常见失败:否定提示词策略

Nano Banana Pro 很复杂,但即使是复杂的模型也可能误解。否定提示词——告诉模型不要生成什么——非常有效。

标准安全否定词

Avoid: blurry, low resolution, distorted, deformed proportions, floating limbs, extra fingers or hands, strange anatomy, AI artifacts, warped text, plastic skin texture, unnatural symmetry, motion blur, chromatic aberration

风格特定的否定词

对于照片级真实感:"Avoid unrealistic reflections, plastic appearance, watercolor blending, sketch marks, unnatural lighting."

对于风格化:"Avoid photorealism, harsh shadows, film grain, realistic skin texture, technical precision."

对于建筑:"Avoid empty spaces, featureless walls, unrealistic proportions, floating elements, poor perspective."

模式:想想什么会毁掉你的图像,并明确排除它。

9、实用工作流程:从概念到完成

这是 专业工作流程的实际运作方式:

第一阶段:概念和提示词工程

  • 从清晰的概念描述开始(还不是 AI 提示词格式)
  • 将其映射到本指南中的适当风格类别
  • 使用结构框架编写初始提示词
  • 确定需要渲染的文本(如果有)
  • 如果有参考图像,请选择
  • 编写特定于你风格的否定提示词

第二阶段:生成

  • 将提示词输入 Nano Banana Pro
  • 如果有图像参考,请使用它们(利用新的多图像融合功能)
  • 使用轻微的提示词调整生成 3-4 个变体
  • 根据原始概念进行评估

第三阶段:完善(现在可行!)

  • 选择最好的基础生成
  • 对问题区域使用局部编辑
  • 如果需要,调整灯光(白天/夜晚过渡、散景)
  • 应用调色
  • 如果构图不太正确,调整相机角度
  • 请求文本渲染或清晰度调整

第四阶段:质量控制

  • 检查分辨率(8K 应该可用)
  • 验证材质属性正确渲染
  • 确认灯光符合意图
  • 如果有多个主题,审查角色一致性
  • 如果包含文本,验证文本可读性

这个工作流程与 2024 年根本不同。你不是试图在一次生成中获得完美——你像专业设计师那样迭代。

10、思维转变:技术精确性作为创意工具

最重要的收获不是记住风格关键词。而是认识到技术描述中的精确性导致创意表达。

当你描述"octane render with PBR materials and ray-traced reflections"时,你不是过于技术化——你是在告诉模型哪些物理和视觉属性重要。这种精确性是解锁一致、专业结果的关键。

同样,当你指定"pastel color palette with high contrast"时,你给模型的美学方向既是描述性的又是技术上有意义的。

AI 图像生成的未来不是关于神奇的提示词。它是关于理解 AI 模型对专业 3D 艺术家使用的相同精确性响应最好。你在此指南中学到的术语——octane render、PBR、轮廓光、等轴视图——不是要避免的行话。它是产生结果的语言。

11、结束语

收藏本指南。随着 Nano Banana Pro 的发展(Gemini 4 可能在未来几个月内推出),这些基础知识不会改变——只会变得更精确。这里的风格类别、提示词结构和技术规格是你将构建的基础。

下一个前沿是多序列生成:想象创建整个故事板,其中角色、灯光和环境一致性在 10 多个图像中持续存在。Nano Banana Pro 的基础支持这一点。你已经有了准备它的框架。

现在:拿出一个你一直想要可视化的概念。从本指南中选择一种风格。使用模板编写提示词。生成。迭代。注意技术描述中的精确性如何产生与你的愿景匹配的创意结果。

这不仅仅是 AI 图像生成。这是与终于理解你的意思的智能工具进行设计思维。


原文链接: Mastering 3D Scene Styles: The Complete Prompt Engineering Guide for Nano Banana Pro in December…

汇智网翻译整理,转载请标明出处