MODEL-ZOO Recraft V3 SVG徽标生成器 Recraft V3 SVG 是Replicate推出另一个值得尝试的 AI 图像模型——特别是如果你是平面设计师或想要制作徽标、图标和品牌资产,它与众不同之处在于能够创建 AI 矢量图像。
MODEL-ZOO Llama 3.3-70B简明教程 Meta 在其今年的最终版本中推出了 Llama3.3,这是一个 70B GenAI 模型,已经取得了一些出色的成果,并且已经在基准数据集上击败了一些 SOTA LLM。
MODEL-ZOO F5-TTS音频克隆和生成模型 在这篇博客中,我们将探讨为什么 F5-TTS 是一款必试工具,它与 E2-TTS 相比如何,以及是什么让它成为当今最易用、最强大的音频克隆解决方案之一。
MODEL-ZOO Qwen2-VL 本地运行教程 Qwen2-VL 是阿里巴巴于 2024 年 10 月发布的视觉语言模型。它提供三种模型大小:2B、7B 和 72B,并允许用户使用文本询问有关图像的问题,类似于 GPT-4 视觉 API。
MODEL-ZOO 视觉语言模型LoRA微调指南 在本文中,我们将探讨如何使用Unsloth、WandB等强大的工具组合来微调 Meta AI 的 Llama-3.2–11B-Vision 模型,并使用vLLM进行模型服务和推理。
MODEL-ZOO FLUX.1 Tools 图像工具包 FLUX 背后的团队 Black Forest Labs 刚刚发布了 FLUX.1 Tools — 一套由四个强大的工具组成的套件,可增强 FLUX 的图像生成能力和可控性。
MODEL-ZOO LLaMa-Mesh:文本生成3D网格 NVIDIA 发表了一篇引人入胜的论文 LLaMA-Mesh:使用语言模型统一 3D 网格生成 ,该论文允许使用自然语言生成 3D 网格对象。