mflux:Mac本地生图AI工具
mflux这是一个在 Mac 上使用 MLX 高效运行图片生成模型的框架。
微信 ezpoda免费咨询:AI编程 | AI模型微调| AI私有化部署
AI工具导航 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo
图片生成技术持续快速进步。目前,Google 的 Nano Banana(目前是第二版)通常被认为是领先的模型。当第一个 Nano Banana 模型发布时,它因出色的指令遵循能力和准确的文字生成能力而脱颖而出。这是因为文字一直是早期模型的长期弱点,而 Nano Banana 开辟了许多实际应用场景,比如从数据动态创建图表。
但 Google 并非这个领域的唯一玩家。Black Forest Labs 是一家德国公司,以更少的资源取得了出色的成绩。虽然他们确实有一些与 Google Nano Banana 竞争的前沿模型,但这不是本文的重点。
相反,我要介绍的是他们最新的开源模型:FLUX.2 [klein]。其中特别值得关注的是 4B 参数版本,采用宽松的 Apache 2.0 许可证。
Klein 的特别之处在于它足够小,可以在 Mac 上运行,而且生成的图片效果很好。通过量化 MLX(Apple Silicon 的神经网络框架),你可以在不到一分钟内在本地生成图片。
无需云服务,无需 API 密钥,无需费用。
以下是开始使用的步骤。
1、设置本地图片生成
要在 Mac 上开始使用,首先安装 mflux,这是一个在 Mac 上使用 MLX 高效运行图片生成模型的框架。
我在这些示例中使用 uv,这是一个 highly 推荐且非常快速的 Python 包管理器。
如果你还没有 uv,可以通过以下方式安装:
curl -LsSf https://astral.sh/uv/install.sh | sh
然后安装 mflux:
uv tool install --upgrade mflux
生成第一张图片很简单:
mflux-generate-flux2 \
--model flux2-klein-4b \
--prompt "A cozy cabin in the woods at sunset, warm light from windows, pine trees" \
--steps 4 \
--seed 42 \
--width 1024 \
--height 768 \
-q 8 \
--output cabin.png
-q 8 参数将模型量化为 8 位,显著降低内存使用。steps 这里设置为 --steps 4,但可以调整。更多步骤通常意味着更好的质量(到一定程度),但也需要更长时间。

对于可以在笔记本电脑上运行的模型来说,效果不错!
2、移除背景
一旦能够生成图片,下一步自然就是让图片可以实际使用,比如游戏资产、网页图形或可以干净地放在页面上的插图。这通常意味着移除背景。
幸运的是,有一个非常简单的工具叫做 rembg。首先安装它:
uv tool install "rembg[cpu,cli]"
然后可以与图片生成链式使用。让我们生成一张新图片:
mflux-generate-flux2 \
--model flux2-klein-4b \
--prompt "A beautiful bowl of assorted fruit on a wooden table, apples oranges grapes bananas, vibrant colors, detailed still life painting style, warm lighting" \
--steps 4 \
--seed 777 \
--width 768 \
--height 1024 \
-q 8 \
--output fruit.png
输出:

然后用一条命令去除背景:
rembg i fruit.png fruit_nobg.png
结果如下:

不错,而且我们仍然只是在本地运行。
3、编辑图片
Klein 模型的另一个酷炫功能是你可以输入一张参考图片,然后用它和提示词创建一张新图片。
例如,假设你要为电子游戏生成一张等距视图图片。从一个基础瓦片开始:
mflux-generate-flux2 \
--model flux2-klein-4b \
--prompt "Isometric medieval village tile, small houses with red roofs, cobblestone roads, green grass, game asset style, clean edges" \
--steps 4 \
--seed 123 \
--width 1024 \
--height 1024 \
-q 8 \
--output tile_base.png

然后让 Klein 在此基础上添加新内容。这里我要求把村庄变成一个带喷泉的市集,同时保持相同的视角和艺术风格:
mflux-generate-flux2-edit \
--model flux2-klein-4b \
--image-paths tile_base.png \
--prompt "Isometric medieval village with a marketplace and fountain, same art style and perspective as reference" \
--steps 4 \
--seed 456 \
--output tile_market.png

4、扩展图片
另一个想法是扩展图片。技术很简单:使用上述相同的编辑工具,我们可以通过向 Klein 提供相邻图片的边缘来生成继续场景的新图片。你将相关边框粘贴到黑色画布上,让模型填充其余部分:

使用瓦片扩展的水平示例
请注意,这种特殊方法实际上并不是在"填充"场景,即它并不是在做什么叫做"内补"的事情。它仍然是图生图,意味着它可能也会改变非空白部分。不幸的是,这也是它的弱点。例如,如果你看下面的图片,从多个步骤这样生成的,可以看到一些明显的伪影。此外,随着我们从原始图片在光照、颜色等方面进一步延伸,风格很容易漂移。
我尝试了不同的技术来改进这一点,例如在网格中散布"锚点",从同一基础瓦片继承参考风格,但最终做得很好非常困难。不过是个有趣的实验。

5、结束语
Black Forest Labs 新的开源模型 FLUX.2 [klein] 真正的改变了游戏规则,能够在单台笔记本电脑上运行。现在你可以进行图片生成、背景移除(使用 rembg)和图片编辑,全部本地运行,免费,在不到一分钟内完成。这是一个进行实验的好时机。
如果你喜欢这篇文章,欢迎在 Medium 上订阅我。
原文链接: Generate Images Free & Locally on Your Mac with AI
汇智网翻译整理,转载请标明出处