Flux.2 Klein:毫秒出图

Black Forest Labs 刚刚发布了其最新、最快的图像模型 Flux 2 Klein,它可以快至约500毫秒的速度生成和编辑图像,使其比任何竞争模型快30%以上。

这个新模型背后的洞察很简单:将图像生成和编辑统一在一个紧凑模型中,并在不降低质量的情况下减少推理步骤。

除了在主要API提供商上的普遍可用性外,该模型还使用开放权重和量化变体在RTX 3090/4070级硬件消费级GPU上本地运行,需要约13GB显存。

在本文中,让我们来看看Flux 2 Klein的新功能,并向您展示我用它创建的示例图像。

让我们开始吧。

1、Flux 2 Klein新功能

"Klein"在德语中是"小"的意思,这既反映了模型的大小,也反映了最少的延迟。但Flux 2 Klein绝对不有限。它在文本到图像生成和图像编辑方面提供了出色的性能,这些性能通常是为更大的模型保留的。

以下是Flux 2 Klein模型新功能的总结:

  • 亚秒级推理:您可以在现代硬件上在0.5秒内生成或编辑图像。
  • 逼真输出:它提供高多样性和逼真质量,特别是在基础变体中。
  • 统一的生成和编辑:文本到图像、图像编辑和多参考支持都在一个模型中,同时提供前沿性能。
  • 在消费级GPU上运行:4B模型适用于约13GB显存。它在RTX 3090/4070及以上显卡上运行。
  • 开发者友好且可访问:4B模型采用Apache 2.0许可证,而9B模型具有开放权重。这允许完全定制和微调。

查看一些示例图像:

现在让我们更仔细地看看每个Flux 2 Klein模型的详细信息。

2、Flux 2 Klein变体

以下是9B和4B模型变体的详细比较:

9B模型是较大的模型,它们带有Flux非商业许可证。

  • Flux 2 Klein 9B是蒸馏模型,是他们营销的主要焦点。它在企业级硬件上以亚秒级速度提供卓越质量,但需要约19.6 GB显存。
  • Flux 2 Klein 9B Base是未蒸馏的基础模型。它为您提供微调的最大灵活性,但明显较慢,需要21.7 GB显存。

4B模型是较小的变体,这里的大胜利是它们采用Apache 2.0许可证。

  • Flux 2 Klein 4B是系列中最快的。它专为实时使用而构建,在RTX 5090上仅运行1.2秒,同时仅使用8.4 GB显存。
  • Flux 2 Klein 4B Base是一个具有良好质量大小比的较小基础模型。它非常适合在有限硬件上进行本地部署,使用约9.2 GB显存。

BFL团队认为Flux 2 Klein模型系列解锁了一种新的交互式视觉智能形式。它们启用了新的应用类别:实时设计工具、代理视觉推理和交互式内容创建。

3、如何访问Flux 2 Klein

我不仅对Flux 2 Klein速度快这一事实印象深刻。他们已经用一个名为Flux Schnell的旧模型做到了这一点,该模型可以在0.6到0.72秒内生成1024x1024图像。

我更印象深刻的是Flux 2 Klein能够在输出上以难以置信的细节和质量进行亚秒级推理这一事实。

要尝试模型,请前往Flux Labs AI并打开图像生成器工具。在图像模型下拉菜单中,选择"Flux 2 Klein 4B"模型。

有几个图像参数可以调整以影响输出。例如,您可以更改推理步骤以提高图像质量,但速度较慢。您还可以更改输出格式、宽高比或添加负面提示以进一步指导AI。

Flux Labs AI上的Flux 2 Klein模型高级设置

这是一个示例提示:

提示: 预备蹲伏姿势的猎豹,肌肉紧绷,瞪羚在远处可见,非洲热带草原金色草,空气中的尘埃颗粒,国家地理野生动物摄影
Flux Labs AI上的Flux 2 Klein 4B示例图像生成

就是这样。结果是一个1080p图像,文件大小约1MB。您可以选择将其下载到本地磁盘或重新生成。

让我们进入Flux 2 Klein模型每个变体的示例图像。

4、Flux 2 Klein模型的其他示例图像

查看我用其他Flux Klein模型创建的其他示例。下面的图像显示了使用Flux 2 Klein 4B Base模型创建的输出。

提示: 蜂鸟近距离飞行的特写图像,靠近花朵并吸食花蜜

这是我用Flux 2 Klein 9B模型创建的另一个。请随时在提示字段中描述任何图像并调整输出参数。

提示: 赛博朋克武士站在霓虹灯照亮的东京街道夜晚,湿滑的人行道反射着粉蓝色全息广告,蒸汽从街道通风口升起,穿着带有发光装饰的未来主义盔甲,电影构图,虚幻引擎5质量,光线追踪反射,浅景深,超精细

这里的细节要明显得多。主题在物理上是准确的,灯光在盔甲上的反射是如此精确。使用9B的唯一权衡是与4B版本相比图像生成较慢。

您也可以在BFL的Playground网站上尝试它们。

5、Flux 2 Klein API访问

有几种方法可以通过API访问Flux 2 Klein模型。您可以使用BFL的官方API端点,或使用第三方API服务提供商,如Fal或Replicate。

要使用BFL API端点,请从BFL仪表板获取您的API密钥。然后向您选择的模型的端点发送POST请求。

以下是Flux Klein 4B的示例cURL脚本:

curl -X POST https://api.bfl.ai/v1/flux-2-klein-4b \
  -H 'accept: application/json' \
  -H "x-key: $BFL_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "prompt": "A serene mountain landscape at golden hour, soft diffused light filtering through clouds, creating long shadows across the valley",
    "width": 1024,
    "height": 1024
  }'

轮询polling_url直到状态为Ready

# 轮询直到状态为'Ready'
curl -X GET "$POLLING_URL" \
  -H 'accept: application/json' \
  -H "x-key: $BFL_API_KEY"

要使用Fal的API端点,请从此页面获取API密钥。然后使用下面的示例请求使用Flux Klein 4B Base模型生成图像。

import { fal } from "@fal-ai/client";

const result = await fal.subscribe("fal-ai/flux-2/klein/4b/base", {
  input: {
    prompt: "Japanese zen garden at first light, perfect rake lines in gravel, koi pond with morning mist, temple bell in background, meditation ready"
  },
  logs: true,
  onQueueUpdate: (update) => {
    if (update.status === "IN_PROGRESS") {
      update.logs.map((log) => log.message).forEach(console.log);
    }
  },
});
console.log(result.data);
console.log(result.requestId);

它将处理请求状态更新,并在请求完成时返回结果。

{
  "images": [
    {
      "url": "https://v3b.fal.media/files/b/0a8a69c2/5IoN78I6tZ8ZH69SB3PhW.png"
    }
  ],
  "prompt": ""
}

结果是输出图像的URL,因此您可以检索它并按需使用,因为它可以免费用于商业用途。

6、结束语

我一直以来都是Black Forest Labs的粉丝。尽管在没有OpenAI或Google等巨头无限资金的情况下运营,BFL的工程师们始终在其重量级别之上发挥。

两个新模型都支持开箱即用的原生编辑,而4B版本采用Apache-2许可证这一事实对用户来说是个好消息。它为开发者和创作者在顶级模型上构建商业应用开辟了巨大机会,而没有限制性许可的麻烦。

在质量方面,我在大约50%到60%的时间内获得了非常好的结果。仍然有很多情况下结果不准确,特别是人类和动物的物理外观。它有时在提示连贯性方面也有困难。

由于我的机器能力不足,我还没有尝试在本地运行模型。但从我在论坛上读到的内容来看,4B和9B模型目前在各自类别中都是最好的。如果您在您的机器上尝试过,请告诉我您的想法。


原文链接:BFL Introduces Flux 2 Klein — Generate AI Images In 500 Milliseconds

汇智网翻译整理,转载请标明出处