FLUX.1 Kontext:用文字编辑图像

FLUX.1 Kontext 是来自 Black Forest Labs 的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一,并且是 FLUX.1 家族的最新成员。

FLUX.1 Kontext:用文字编辑图像

FLUX.1 Kontext 是来自 Black Forest Labs 的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一,并且是 FLUX.1 家族的最新成员。

在我们的测试中,我们发现 Kontext 能够提供准确而出色的结果。它比 OpenAI 的 4o/gpt-image-1 模型更好、更便宜(并且没有黄色调调)。

有三种模型,其中两种现在可用,第三种开源版本即将推出:

  • FLUX.1 Kontext [pro]:图像编辑领域的顶尖性能。高质量输出、优秀的提示遵循能力以及一致的结果。
  • FLUX.1 Kontext [max]:一款高端模型,带来最佳性能、改进的提示遵循能力和高质量的字体生成,速度不受影响。
  • 即将推出:FLUX.1 Kontext [dev]:Kontext 的开源权重、指导蒸馏版本。

我们对 Kontext 能做的事情感到非常兴奋,因此我们在 Replicate 上创建了一个 模型集合,为您提供灵感:

从单张图像,Kontext 可以生成一系列肖像。试试看

1、使用 API 运行 Kontext

就像 Replicate 上的所有模型一样,你只需几行代码就可以通过 API 运行 Kontext。

以下是如何使用 Replicate JavaScript 客户端 运行 Kontext Pro 的示例:

import Replicate from "replicate";
const replicate = new Replicate();

const model = "black-forest-labs/flux-kontext-pro";

const input = {
  prompt: "Make this a 90s cartoon",
  input_image: "https://replicate.delivery/pbxt/N55l5TWGh8mSlNzW8usReoaNhGbFwvLeZR3TX1NL4pd2Wtfv/replicate-prediction-f2d25rg6gnrma0cq257vdw2n4c.png",
};

const output = await replicate.run(model, { input });

console.log(output.url())

2、Kontext 可以做什么

图像编辑模型允许你引导图像如何变化。这意味着你可以使用文本提示进行小的调整或大的转换,同时以原始图像作为起点。改变汽车的颜色、替换背景或将肖像赋予全新的风格——只需告诉 Kontext 你想要什么即可。

Kontext 对快速图像编辑非常擅长。你会看到,在编辑人物图像时,无论变化大小,人物都能保持其身份。

原始 | “给她一条金项链” | “给她一个精灵发型”
我们尝试的大多数提示都成功了。

对于更复杂的更改,例如添加人物或改变场景,最好清楚地描述每个修改。只要您的每次编辑指令不是太复杂,具体说明通常会带来更好的结果。

在编辑图像中的人物时,措辞的选择会产生很大影响。“将这个人变成维京人”的提示可能会导致身份完全改变。如果您想保留同一个人,最好更具体一些。您可以专注于您想要更改的部分,比如服装、眼睛颜色或背景。

2.1 风格迁移

当你提示进行风格迁移时,具体性至关重要(你会注意到使用 FLUX Kontext 提示时的主题)。与其给出模糊的指示如“让它更有艺术感”,不如明确指出具体的风格,如“印象派绘画”或“水彩素描”。引用知名运动或艺术家有助于更清晰地引导模型:“文艺复兴”或“60年代流行艺术”。

Kontext 在重新想象不同艺术媒介的图像方面表现相当不错。

原始 | “转换为快速铅笔素描” | “转换为色彩丰富的丙烯酸画”

如果风格标签不起作用,可以描述定义该风格的关键特征,例如“可见的笔触、厚重的颜料质感和丰富的色彩深度”。如果您希望某些元素保持不变,请说出来(“保持原始构图”)。语言越精确,结果就越有意图。

2.2 文本编辑

Kontext 可以直接在图像中编辑文本,因此您无需从头开始重新创建标志、海报或标签。最清晰的方法通常是引用您要更改的确切文本。

原始 | “将太阳镜上的文字改为‘FLUX’和‘Kontrast’”(查看预测)

以下是处理文本时的一些通用提示:

  • 坚持可读的字体。高度风格化的文本可能效果不佳。
  • 明确说明需要保留的内容。如果保留字体样式很重要,请务必提及。
  • 尽量匹配文本长度。长度的巨大变化可能会以您不想要的方式改变布局。

2.3 角色一致性

Kontext 在保持角色一致性方面也非常出色,即使经过多次编辑也是如此。从一个清晰的参考开始(如“短发黑发的女人”),并说明正在改变的是场景、活动还是风格。如果您希望同一个人物继续存在,请说明需要保留的内容:脸、表情、服装或其他重要部分。

注意我们是如何通过一系列编辑保持角色一致性:

原始 | “将女人的蓝色头巾变成绿色头巾” | “将戴绿色头巾的女人放在丛林里”

偶尔,编辑背景和场景时,为了保持角色一致性,需要明确说明主体的位置、比例或姿势。

简短的提示有时会让事情过于开放供解释:

把他放到海滩上

为了更好地保留主体的位置,尝试更详细的提示,如下所示:

将背景改为海滩,同时保持人物处于完全相同的位置,保持相同的主体位置、相机角度、构图和视角。仅替换他们周围的环境。

3、商业用途

如果直接在 Replicate 上生成图像,你可以自由地将这些输出用于商业项目,包括应用程序、营销或其他业务用途。

很简单:在 Replicate 上运行 Kontext 或其衍生品,你可以使用所有生成的内容,无论是商业用途还是其他用途。

4、提示技巧和窍门

Kontext 非常灵活。无论是调整服装、将照片重绘为油画,还是更换标志文字,关键在于如何编写提示:清晰、具体,并在必要时分步进行。

很容易想象 FLUX Kontext 可以驱动一些非常有创意的应用程序。一个视觉故事构建器,可以在场景中逐步发展角色;一个海报生成器,可以秒速更新品牌内容;或者一个 AI 驱动的艺术画布,用于快速概念原型设计——潜力无限。如果您正在构建视觉内容,Kontext 值得一试。

这里有一个关于提示 FLUX Kontext 的简短总结:

  • 具体:使用清晰、详细的语言。命名确切的颜色,精确描述视觉元素,并选择直接的动作动词。避免模糊术语如“让它更好”。
  • 从简单开始:从基本的更改开始。先测试小的编辑,然后在此基础上构建。Kontext 支持迭代编辑,所以请充分利用这一点。
  • 有意保留:说明哪些应该保持不变。使用诸如“同时保持相同的面部特征”或“保持原始构图”之类的短语来保护关键元素。
  • 按需迭代:将复杂的编辑分解为较小的步骤。大变化更容易在顺序中管理。
  • 直接命名对象:使用描述性的短语如“短发黑发的女人”或“红色汽车”。避免代词——它们通常太模糊。
  • 用引号括住文字:编辑文字时要精确。写“将‘x’替换为‘y’”比一般指示效果更好。
  • 明确构图:编辑场景时,说明是否需要保持相机角度或构图等。这有助于避免意外的布局变化。
  • 仔细选择动词:像“transform”这样的词暗示全面重构。如果您需要更多控制,请使用特定的动作,如“改变衣服”或“替换背景”。

原文链接:Use FLUX.1 Kontext to edit images with words

汇智网翻译整理,转载请标明出处