LLM - Software 2.0 (Page 3) - 汇智网

Tagged

LLM

A collection of 100 posts

ComfyUI AnyNode

ComfyUI AnyNode

ComfyUI的AnyNode可以利用LLM大模型，实时为任何类型的计算或基于功能的任务创建自定义节点。

基于Schema的LLM结构化输出

基于Schema的LLM结构化输出

记者们通过文档转储和白皮书获得 PDF 作为对 FOIA 请求的回应。要使用 PDF，这些记者需要从文档中获取数据并将其转换为易于分析的格式，例如电子表格。该过程可能涉及费力的手动转录或将数据从一种格式复制并粘贴到另一种格式。从理论上讲，大型语言模型可以协助文档处理，但幻觉等风险和 LLM 输出固有的不确定性使这种方法变得棘手。记者需要确保输出确实包含所需的数据、遵循所需的数据类型并采用可用的格式。结构化输出为这些挑战提供了解决方案。像 Anthropic 和 OpenAI 这样的提供商以及像 Outlines 这样的开源库允许开发人员定义严格的模式，将 LLM 响应限制在特定字段、数据类型和格式。结构化输出将原始的 LLM 功能转换为可靠的数据处理管道。例如，从多页 PDF 中提取表格时，模式可确保跨页面的列名和数据类型一致。虽然这种方法不能保证完全准确，但它降低了解析和验证 LLM 响应的工程复杂性，使文档处理工作流更加可靠和易于维护。模式本质上是一个蓝图，它告诉模型要查找哪些信息以及如何组织这些信息。可以将其想象成一个标准化表格：记者不是让模型以任何格式返回数据，而是提供特定的字段来填写——这是一个日期，这是一个美元金额，另一个应该是是/

Apryse文档提取JS开发包

Apryse文档提取JS开发包

Apryse 是一款用于文档管理的一体化原生工具包，它提供了用于 Web、移动、客户端和服务器使用的库，涵盖 PDF 查看、注释、编辑、创建、生成，以及与我的需求最相关的：通过其服务器 SDK 提取数据，以 JSON、XML 甚至 XLSX 格式提供数据。

5个最佳多代理AI开发框架

本文探讨了用于构建和向应用程序添加 AI 代理的前五大平台。我们将探讨这些框架的主要功能和优势，并演示使用其中一些构建代理的代码示例。

大模型推理加速与服务优化

使用 Triton Inference Server 部署 TensorRT-LLM 并设置与 OpenAI 兼容的 API 可实现高效、高性能的推理大型语言模型。

打造人工智能忏悔室

本文分享我们如何构建我们的 LLM 语音应用程序并将其集成到忏悔室的交互式展台中。

基于Milvus的多模态RAG实践

基于Milvus的多模态RAG实践

如何使用 Milvus 构建自己的多模态 RAG 系统，并利用GPT-4o语言模型来优化输出。

AISuite：GenAI平台统一API

AISuite：GenAI平台统一API

aisuite为AI应用开发者提供简单、统一的多个生成式 AI 提供商接口。

AI驱动的自动表单填写

填写表格是一项枯燥且耗时的任务。如果我们可以创建一个可以为我们填写表格的 AI 助手，让我们将时间投入到更有建设性的任务中，那会怎样？

AI Agents：你的虚拟员工

AI Agents：你的虚拟员工

人工智能代理（AI Agent）的兴起正在重塑我们构建和思考软件的方式。我们现在不只是编写代码并指导计算机做什么，而是教它们如何思考。

用GenAI构建数据可视化系统

用GenAI构建数据可视化系统

本文演示了如何构建一个数据可视化系统，该系统使用 LangChain 和 LLM 将查询转换为交互式可视化见解。

用AI生成可靠的报告

在这篇文章中，我想分享我对 AI 生成的报告的了解，以及如何使这些报告更可靠、更实用。

Instructor-Marvin-Guardrails

Instructor-Marvin-Guardrails

本文对比3使用 LLM 进行数据提取的开发库Instructor、Marvin 和 Guardrails的使用方法并通过对比介绍如何选择最适合你的库。

ExtractThinker 文档智能处理库

ExtractThinker 文档智能处理库

ExtractThinker是一个灵活的文档智能库，可帮助你从各种文档中提取和分类结构化数据，就像文档处理工作流的 ORM 一样。

LLaMa-Mesh：文本生成3D网格

LLaMa-Mesh：文本生成3D网格

NVIDIA 发表了一篇引人入胜的论文 LLaMA-Mesh：使用语言模型统一 3D 网格生成，该论文允许使用自然语言生成 3D 网格对象。

PROMPT ENGINEERING

提示工程简明教程

在本文中，我们将探讨提示工程中的几种技术，这些技术可以帮助优化 LLM 在不同任务中的性能。

小规模CV任务如何利用基础模型

小规模CV任务如何利用基础模型

自2023年以来，人工智能领域将受到来自生成式AI的新成功的冲击，我们将探索是否可以利用这些基础模型来构建数据集、利用新的架构和新的预训练权重，或者从中提取知识。

LlamaIndex工作流生成幻灯片

LlamaIndex工作流生成幻灯片

本文介绍如何使用 LlamaIndex 工作流简化我研究某个主题的最新进展的过程，然后将该研究转化为 PowerPoint 演示文稿。

服装搭配AI应用

利用 Gemini 先进的生成式AI，你现在可以穿着 T 恤自拍，并立即从自己的衣柜中获得搭配的下装推荐！

基于Agent的图生视频自动化

基于Agent的图生视频自动化

本文介绍如何使用LangGraph的AI代理实现从单张图像到视频的自动化处理。

Ultravox实时语音多模态大模型

Ultravox实时语音多模态大模型

Ultravox 是一种新型多模态 LLM，可以理解文本和人类语音，而无需单独的音频语音识别 (ASR) 阶段。

低端PC运行LLM的5个方法

本文介绍在低配置设备上运行大模型的技术方案，包括量化、半精度、SafeTensors、GGUF 文件格式、设备映射、注意力切片、CPU 卸载等。

LitGPT 微调简明教程

LitGPT 是一个简化高性能 LLM 预训练、微调和可扩展部署的平台，提供 20 多种高性能 LLM，并提供预训练、微调和大规模部署的方案。

AutoGen多代理AI编程框架

AutoGen多代理AI编程框架

AutoGen 是 Microsoft 的一个开创性项目，它使用户能够根据需要创建任意数量的自主 ChatGPT 类代理。

用MLX微调医学诊断大模型

本文探讨微调LLM用于医疗诊断预测，硬件为配备 M2 芯片的 Apple Silicon Mac ，使用 LoRA 和 Apple MLX 框架微调，Ollama 运行推理服务。