Software 2.0

基于Agent的图生视频自动化

基于Agent的图生视频自动化

本文介绍如何使用LangGraph的AI代理实现从单张图像到视频的自动化处理。

用TextGrad优化LLM提示

用TextGrad优化LLM提示

TextGrad 是一个 Python 包，它提供了一个简单的接口来实现用于文本优化的 LLM梯度，可以用来优化提示。

OOTDiffusion虚拟试穿模型

OOTDiffusion虚拟试穿模型

虚拟试穿技术是电子商务和时尚领域的一项前沿创新，它允许客户在不实际穿着的情况下尝试虚拟服装、配饰、化妆品或其他时尚元素。OTDiffusion是一种基于 LDM 的新方法。

图像数据集自动标注指南

本文介绍如何使用 Grounding DINO、SAM 和 AutoDistill 等模型/工具自动生成图像数据集的标注数据。

打造自己的AI搜索引擎

你可能听说过 Perplexity，这是一个引起轰动的 AI 搜索引擎，但它是收费的。本文介绍使用开源 AI工具创建本地 Perplexity 的替代方案。

ResumeGPT 简历问答机器人

ResumeGPT 简历问答机器人

本文介绍如何使用检索增强技术实现一个通过自然语言和PDF格式的简历文档对话的应用。

Idefics-2微调实现视觉问答

Idefics-2微调实现视觉问答

本文介绍如何使用Transformers库微调Idefics-2视觉大模型，来应对视觉问答任务。

PuLID极速身份定制模型

PuLID是一种创新的非调整身份定制方法，提供对面部特征和身份特征的前所未有的控制。

医学文本处理多智能体系统

本文探讨了用于处理医学文本的多智能体人工智能应用程序的架构、工作流程、代码实现和未来范围。

高效构建多模态数据集

本文介绍一个生成多模态数据集的管道。该管道的主要目标是无需人工标注即可工作。

MiniCPM-V端侧多模态大模型

MiniCPM-V端侧多模态大模型

MiniCPM-V 是一系列高效的 MLLM，旨在在手机和个人电脑等端侧设备上运行，使其成为各种 AI 应用程序的强大工具。

Mesop：AI应用快速开发框架

Mesop：AI应用快速开发框架

Mesop是一个Google新发布的基于 Python 的 Web 应用框架，适合用于快速开发包含Web界面的AI应用。

Ultravox实时语音多模态大模型

Ultravox实时语音多模态大模型

Ultravox 是一种新型多模态 LLM，可以理解文本和人类语音，而无需单独的音频语音识别 (ASR) 阶段。

用语音命令管理数据库

该项目使用 Whisper 进行语音转文本，并使用 Llama 3 将转录转换为 SQL 查询，从而实现通过语音命令自动更新数据库。

LlamaIndex构建AI实时交易系统

LlamaIndex构建AI实时交易系统

本教程演示了如何使用 Kafka 流式传输 EUR/USD 数据、使用 LlamaIndex 工作流进行无缝逻辑处理以及使用 GPT-4o 进行图像分析来构建实时交易机器人。

18个视频创作必备AI工具

我们总结了 18个最佳人工智能视频编辑工具。使用它们让你的客户惊叹于视频内容，并大幅提高你的工作效率。

提示工程速查手册

我们的提示工程速查手册是一本精简版 (PDF) 咒语书，适用于这个有点神秘且通常很棘手的机器学习学科。

低端PC运行LLM的5个方法

本文介绍在低配置设备上运行大模型的技术方案，包括量化、半精度、SafeTensors、GGUF 文件格式、设备映射、注意力切片、CPU 卸载等。

7个电商必备ComfyUI工作流

7个电商必备ComfyUI工作流

本文介绍的7个 ComfyUI工作流，可以轻松删除产品背景、替换背景并将产品与全新背景无缝集成。

OmniVision-968M 世界最小VLM

OmniVision-968M 世界最小VLM

Omnivision 是一个紧凑的、不到1B (968M)参数的多模态模型，用于处理视觉和文本输入，针对边缘设备进行了优化。

AI代理聚焦工具利用

AI代理的重点正在从简单地开发自主AI代理转向增强可用的工具，这直接影响它们的功能和灵活性。

影视场景中的演员识别

在观看电视剧时，我注意到会自动显示演员姓名。受此启发，我使用 AI 技术开发了自己的解决方案。

为网站自动生成智能客服

你是否曾希望将整个网站变成一个可以准确回答访客问题的智能聊天机器人？利用CustomGPT，只需3行 Python 代码就可以实现！

ComfyUI风格迁移指南

在ComfyUI中，使用IPAdapter Plus插件，只需输入参考图片，就能生成类似风格的图片了。

11个值得尝试的AI搜索引擎

在过去的几个月里，我的团队一直在测试AI 搜索工具，现在让我们来看看其中11 个最佳的你值得尝试的AI 搜索引擎。