FIBO - Nano Banana的开源对手

作为第一个原生支持JSON的图像生成模型,FIBO为每个渲染提供了可追溯性、可审计性和精确的可编辑性,专为代理、自动化和专业设计工作流程而构建。

FIBO - Nano Banana的开源对手

FIBO 将简单的文本提示转换为结构化的JSON模式,使创作者能够大规模地获得可预测、可控的视觉效果。它经过丰富细节描述(通常超过1,000个字)的训练,能够深入理解光线、构图、色彩、相机设置和景深

1、为什么FIBO很重要

大多数图像模型会解释开放式的文本提示,这会留下一些变化的空间。FIBO 则将提示转换为一个结构化的JSON模式,输出结果一致、可重复且可控。

作为第一个原生支持JSON的图像生成模型,FIBO为每个渲染提供了可追溯性、可审计性和精确的可编辑性,专为代理、自动化和专业设计工作流程而构建。

主要功能:

  • 结构化的JSON提示: 精确描述场景——光线、构图、景深、相机规格等——全部在一个长达1,000字的模式中。
  • 迭代受控生成: 从简短的提示开始,或从详细提示进行优化。每次编辑只更新您更改的部分。
  • 解耦控制: 调整一个变量(如“背光”或“85mm”),而不会影响其余部分。
  • 由LLM引导的创意: FIBO将简短的提示扩展为丰富的JSON,提供灵感和控制。
  • 版权清晰、生产就绪: 完全基于授权数据构建,并提供完整的企业赔偿。

2、图像生成

从一个快速的想法开始。FIBO的语言模型会将您的简短提示扩展为一个丰富、结构化的JSON提示,然后生成图像。您将获得图像和扩展后的提示。

3、图像优化

从详细的结构化提示继续,并添加一个小指令 - 例如,“背光”、“85毫米”或“更温暖的肤色”。FIBO仅更新所需的属性,重新生成图像,并返回优化后的提示以及图像。

4、使用图片提示

提供一张图片而不是文字。FIBO的视觉语言模型会提取描述该图片的详细提示,结合您的创意意图,生成新的相关图片——非常适合探索新方向而不改变原始图片。

5、开始使用FIBO

你可以在fal Playground 中尝试FIBO,或者通过API集成它,用于文本到图像图像到图像生成。


原文链接:Introducing FIBO: Structured Control for Text-to-Image Generation

汇智网翻译整理,转载请标明出处