用 Nano Banana创建信息图
坦白时刻。我是一个相当不错的作家,而且正在快速提高编码能力。但我是一个糟糕的平面设计师。
直到最近,我对待品牌推广的方式就是什么都不做。我会在最后一刻随机生成 AI 图像,没有风格指南,没有参考资料,也没有认真思考。结果……还不错?它们填充了缩略图的位置,但没有创造任何视觉一致性或品牌认知。
我也把同样的方法带到了 LinkedIn,在那里我偶尔会花数小时生成平庸的轮播图和信息幻灯片。而且毫不奇怪,这些努力中的大部分都石沉大海。(我的帖子通常获得约 200 次浏览,1-2 次收藏,以及偶尔来自我认识的人的好意评论。)
我唯一擅长设计的更好的是用户界面,那是因为它们是由代码组成的。 Tailwind 现在为所有内容预编程了样式也有所帮助。
1、为什么我决定关注视觉
一致的视觉传达着能力。当我看到一份具有可识别风格的通讯——每个缩略图中出现相同的插图头像、一致的调色板、感觉有目的性的排版——我立即更加信任它。这表明背后的人关心细节并且有条理。
我想要为自己做到这一点。我计划向我不认识的人进行外展,包括通过推荐和令人畏惧的冷邮件,推广 Future Scan,这是我希望很快与公司实验室和大学的研究人员分享的软件应用程序。
因此,我决定更加关注在 Substack 通讯、LinkedIn 个人资料和应用程序本身之间培养一致的视觉品牌。
2、新工具:Nano Banana Pro
Nano Banana Pro 是 Google DeepMind 最新的图像生成和编辑模型,基于 Gemini 3 Pro 构建。您可以通过打开 Gemini 应用程序或访问主屏幕,从工具菜单中选择香蕉图标,然后从模型菜单中选择"Thinking"来访问它。(标准的"Fast"选项为您提供原始 Nano Banana,由 Gemini 2.5 Flash 提供支持。)
使 Nano Banana Pro 对我的目的有趣的是 它能够生成带有可读、位置正确的文本的图像,这非常适合信息图、图表和海报。它还可以连接到 Google Search 的知识库,至少在理论上,可以基于现实世界信息创建"上下文丰富"的视觉。
根据 Google 的说法,该模型支持多种纵横比,最多可处理 14 个参考图像以保持风格一致性,输出高达 4K 分辨率。它还被集成到 Adobe Firefly、Photoshop 和各种企业工具中。
但是,我想知道,对于像我这样需要"足够好"图形而不雇用设计师的独立开发者来说,它真的有效吗?这就是我要测试的。
3、从基础品牌开始
我想要一个一致的调色板和一个一致的头像,用于我所有的 Substack 文章,类似于 Jenny Ouyang、Karo(Product with Attitude)和 Daria Cupareanu 处理他们的视觉效果的方式。他们有立即可识别的插图头像,出现在所有缩略图中,创造即时品牌认知。你看到头像,就知道你在看谁的通讯。
我选择了已经在 Future Scan 中用作强调色的青色,并让 Claude 根据我的应用程序的"风格"构建一个视觉风格指南。该指南指定了诸如简洁简约的美学、慷慨的留白、青色 (#0d9488) 作为灰度基础上的点缀色、Inter 字体、简单的几何插图,以及感觉科学但不至于冷冰冰的数据可视化美学。
然后我参考这个风格指南并提示 Nano Banana 创建一个简单的插图头像,我可以将其用作多个 Substack 缩略图的参考图像。经过几次迭代(调整风格、要求更简单的线条、改进调色板),我得到了可行的东西。
然后,我向 Nano Banana 提供了几个不同情况下头像的参考图像以及缩略图尺寸,并要求它为我的旧 Substack 文章创建"叙事缩略图"。虽然这个练习需要一些来回,但它效果出奇地好——而且很快。在 Canva 中可能需要一天或更长时间的摸索,现在只需大约两个小时的迭代提示。
我的 Substack 通讯现在都有一致的图像。效果这么好,我想知道 Nano Banana 还能做什么。
4、一次令人费解的 LinkedIn 小热门
我一直在努力在 LinkedIn 上获得浏览量。我大多数帖子获得约 200 次浏览和零收藏,这是向虚空中呼喊的参与度。但由于我可以通过 Future Scan 访问大量研究论文,我决定尝试一些不同的东西:基于一篇关于使用 AI 的人在扫描文本时能多好地检测 AI 生成文本的研究论文创建信息图。
客观地说,生成的信息图并不怎么样。设计有问题,很多颜色不太协调。没有任何内聚性或品牌感。但有些东西吸引了注意力:获得了 4,000 次浏览和 5 次收藏。对于我来说,这大约是我正常参与度的 20 倍。
这次意外的成功让我好奇。这是侥幸因为主题(AI 检测!)恰好引起共鸣?还是 Nano Banana Pro 实际上可以为社交媒体创建可用的信息图?是时候用受控变量进行适当测试了。
5、假设:Nano Banana Pro 创建可用的信息图。
我决定系统地测试 Nano Banana,尝试各种提示策略,从简单到复杂,有不同的背景信息和迭代次数。撰写 Slow AI 通讯的 Sam Illingworth 是一位教授和科学传播研究人员,他自愿提供他的一篇论文作为测试对象:"Rhyme and Reason—Using Poetry to Talk to Underserved Audiences About Environmental Change",发表在《气候风险管理》上。
该论文探讨了诗歌研讨会如何帮助服务不足的社区表达他们对环境变化的看法。通过对参与者创作的诗歌进行解释性现象学分析,研究人员发现,诗歌有助于在"专家"和"非专家"之间平衡等级制度,允许社区成员以传统科学传播方法经常无法捕捉的方式表达他们对气候变化的恐惧、 resignation 和希望。
这是一篇真正有趣的定性研究,而且重要的是,它有足够的内容来制作有意义的信息图。问题是 Nano Banana Pro 能否将该内容转化为视觉格式。
每个测试都在自己的独立聊天中进行,因此测试不会受到之前测试历史的影响。
测试 1:终极懒人方法
方法:一句话提示 + PDF 附件
我首先将 Sam 的论文 PDF 上传到 Gemini,并要求 Nano Banana"请根据这篇论文创建信息图"。
这立即导致其 Thinking Mode 崩溃;我尝试了六次以确保。很可能,完全缺乏方向导致它同时探索太多可能性,从而耗尽整个上下文窗口。
专业提示: 一定要在发送提示之前选择香蕉工具,否则您不会得到图像,只会得到文本。这让我多次绊倒。
测试 2:两步流程
方法:先生成文案,然后请求信息图
我给 Gemini 论文并要求它写一篇提取关键点的叙事信息图文案。
在我得到了我认为可以接受的文案之后——在这个过程中我也更多地了解了论文的方法论和发现——我提示 Nano Banana 创建信息图并根据需要编辑文本以适应设计。我没有指定纵横比;我想看看它的默认设置是什么。
提示:使用此文案构建一个简洁传达关键点的垂直滚动信息图。根据需要编辑文案以适应设计。包括钩子、主要见解和要点。
结果: 它产生了一个非常丰富多彩和繁忙的卡通,包含所有关键信息。文本很小且难以阅读,但……它在社交媒体上处于"足够好"的边缘。老实说,我可能会考虑在 LinkedIn 上发布。
它充满活力并讲述一个故事……但它真的很繁忙且难以阅读
额外实验: 我要求它将图形重制为 9:16(竖屏)信息图,效果……还行。布局很拥挤,"Lived experience"变成了"Liver experience"。这是经典的 AI 文本渲染错误,为什么您必须始终校对。
相同的概念,不同的纵横比。加上"Liver Experience"
纵横比注意: 请求信息图时,请务必指定纵横比,否则您将默认获得横向矩形。Nano Banana Pro 支持 1:1(方形,社交信息流理想)、9:16(竖屏,TikTok 和 Reels 完美)、16:9(横向/宽)、4:5(更高的 Instagram 格式)、3:2 和 2:3(经典照片比例)、21:9(超宽/电影)和 9:21(超高,用于横幅和滚动信息图)。
测试 3:带风格指南的三步流程
方法:文案 + 风格指南 + 带纵横比的详细提示
接下来,我简化了文案并在提示中添加了更多指导,例如:在顶部和底部包含足够的留白,使用完全按原样的文案(即兴创作),并将其设置为 9:21 纵横比以进行滚动。
我还添加了我详细的风格指南,即我在 Future Scan 中使用的简洁、简约的风格,带有青色点缀、灰色基础和强调简洁。
提示:使用以下文案创建垂直滚动信息图(9:21 纵横比)。严格遵循附带的风格指南。在顶部和底部包含慷慨的留白——每端至少占画布高度的 15%。完全按原样使用文案;不要添加或修改文本。保持布局简洁整洁。
结果: 现在我们取得了进展。输出越来越干净、更专业、更容易阅读。
但有一个问题。 阴影框不是单一均匀的颜色,似乎有奇怪的波纹。并且多少提示都无法消除它们。
持续存在斑驳的背景。我发现了致命的缺陷吗?
测试 4:相同方法,不同风格指南
方法:测试风格是否影响输出质量
为了看看我是否会在截然不同的美学中获得相同的质量结果,我要求 Claude"研究这个风格指南并构建一个与原始审美相反的风格指南。"
结果是温暖的照片风格:Nunito 和 Playfair Display 字体而不是 Inter,珊瑚色和赤陶色而不是冷青色,丰富的饱和色彩而不是简约灰度,强调生活方式摄影和有机的圆形形状而不是几何精度。
提示:使用以下文案创建垂直滚动信息图(9:21 纵横比)。严格遵循附带的风格指南:温暖的色彩、圆润的排版、丰富的摄影美学。在顶部和底部包含慷慨的留白。按原样使用文案。
结果: 质量与测试 3 相似。信息图看起来构建得很好,并忠实于其截然不同的风格。但我仍然得到了奇怪的不均匀色块,这是我所有测试中持续存在的问题,似乎与特定风格指南无关。该模型似乎难以在不同形状之间保持一致的填充颜色。
文案背后的填充颜色微妙地斑驳。
测试 5:精简单色
方法:短文案 + 指令性提示 + 单色风格 + 无实心色块
接下来,我追求完全精简的外观:非常简单和基本,只有轮廓形状 没有 AI 可能弄砸的实心颜色填充。这个想法是完全消除颜色一致性问题。**任何颜色都可以稍后在 Adobe Express 或 Canva 中根据需要添加,**作为干净的黑白底板上的简单叠加层。
提示:使用以下文案创建垂直滚动信息图(9:21 纵横比)。使用单色配色方案:仅黑色、白色和灰色。仅使用轮廓形状;不要使用任何实心颜色填充或阴影背景。保持设计简洁干净,留白充足。
结果: 这成功地解决了颜色块问题——没有奇怪的填充,没有不一致的阴影。它基本上是一个可用的信息图,是迄今为止最接近可以不经修改就发布的东西。
但存在文本不一致:有时"Insight"块后出现换行,有时没有。嵌入在图像中的文本一旦生成就很编辑困难,而 Nano Banana 无法在所有部分中完美保持这一点。
模型引入的文案问题包括引号外的句号。这可以通过提示修复。但是,不一致的换行符对特定指令有抵抗力。
此外,尽管我有明确指示,但留白仍然不够。该模型似乎想要填满可用空间。
我的提示方法 = 少即是多: LLM 是非确定性的;长提示让它们有更多不同的东西要执着,导致更不一致的结果。对于冗长的提示,上下文窗口也是问题,特别是如果您提供风格指南等额外背景。根据我的经验,有助于保持您的指令紧凑和优先排序。
测试 6:整合一切
方法:短文案 + 品牌特定风格指南 + 强调留白
对于最终测试,我让 Claude 再创建一个风格指南,这次基于 Sam 的 Slow AI 通讯的颜色和图像。
该指南强调:平静和简约的美学("视觉效果应该像深呼吸")、慷慨的留白(每端至少 15-20% 的画布高度)、仅有细干净轮廓的轮廓形状、柔和的中性色(暖白、浅灰、奶油色)配一个柔和点缀,以及手绘感。整体指示:"查看图形的人应该感到更平静,而不是更刺激。慢慢来。"
提示:使用下面缩短的文案创建垂直滚动信息图(9:21 纵横比)。严格遵循附带的 Slow AI 风格指南。优先慷慨留白——顶部和底部至少 15-20% 的画布高度。仅使用细轮廓的轮廓形状。保持冷静和简约。
结果: 乍一看,这看起来相当不错。它有合理的留白量,背景上的斑驳相对微妙。但文案陷入了无意义:Bristor、Fecilitators、neuse resiguation 等。
好的设计,但背景微妙地斑驳,文案陷入了 AI 胡言乱语。
你应该留下 Gemini 图标吗? 实际上,我认为是的——为了透明。虽然 Nano Banana Pro 生成的图像确实包含 SynthID 数字水印(就像某些早期版本生成的),但鉴于某些受众对 AI 生成图像的强烈感受,对 AI 生成内容保持坦诚似乎是正确的做法。
6、那么, verdict 是什么?
对于我的目的——LinkedIn 帖子、Substack 笔记,也许还有演示——我相信 Nano Banana Pro"足够好",可以让我快速创建可用图像,或者足够接近,我可以在后期处理中以最少的努力修复它们。
我还认为,如果我只是继续删除文案,我可能会在这次测试中获得更好的结果。冗长是最大的问题。内容和输出越简单越干净。 如果您发现自己塞进了很多文本,您可能是在自找麻烦。
而且,标准化信息图结构也可能有用。对于研究论文,它可能是:
- 我们在测试什么
- 测试设计
- 我们期望什么
- 我们发现了什么
- 最后想法
但是,输出不是像素完美的,可能有缺陷,如不一致的间距、偶尔的文本错误和不均匀的填充。其中一些可能来自我——一个在 LinkedIn 上发帖的独立创业者——是可以原谅的,但对于可以负担得起人类设计师的大公司来说,可能不会得到很好的反响。
您可以用 Nano Banana Pro 做什么
- 给出信息图文案并获得令人惊讶的不错的草稿
- 预先指定纵横比以获得大致需要的格式
- 通过清晰的风格指南指定首选图形处理和情绪
- 包括照片和插图作为参考图像以保持一致性
- 通过调整文案长度和提示不断改进
您不能做什么
- 获取特定社交格式所需的精确像素尺寸的图像
- 获取需要编辑的像素完美结果
- 一致地获取非常高分辨率的文件(尽管有 4K 承诺,结果各不相同)
- 保证文本每次都能正确渲染——始终校对
- 创建复杂、信息密集的信息图而不会出现至少一些故障
- 在实心形状上保持完美的颜色一致性
7、最后想法
Nano Banana Pro 不会取代平面设计师,也不会开箱即给您完美的品牌资产。但对于需要快速获得"足够好"视觉效果的创作者和独立创业者——尤其是对于生命周期很短的社交媒体内容——它是一个真正有用的工具,可以节省在 Canva 中摸索或乞求设计师朋友帮助的时间。
我从实验中学到的关键教训:保持文案简短(比您想象的更短)、提供具有具体方向的清晰风格指南、预先指定您的纵横比,并接受一些后期处理的需要。不要期望完美;期望一个让您达到 80% 目标的可靠草稿。那剩下的 20% 通常只是在 Adobe Express 或 Canva 中几分钟的时间。
并且始终、始终仔细校对。
原文链接: I tried using Nano Banana Pro to create complex infographics
汇智网翻译整理,转载请标明出处