DATASET 基于OpenUSD的合成数据生成 本文介绍了如何使用 NVIDIA NIM 微服务 和NVIDIA Omniverse Replicator为 USD 构建自定义合成数据生成 (SDG) 管道。
MODEL-ZOO Qwen2-VL 本地运行教程 Qwen2-VL 是阿里巴巴于 2024 年 10 月发布的视觉语言模型。它提供三种模型大小:2B、7B 和 72B,并允许用户使用文本询问有关图像的问题,类似于 GPT-4 视觉 API。
LIBRARY Ollama函数即工具 Ollama的新版本现在可以将 Python 函数直接作为 Ollama 库中的工具传递。此功能允许无缝集成 Python 库、SDK 等中的现有函数,从而使你的开发过程更加高效
MODEL-ZOO 视觉语言模型LoRA微调指南 在本文中,我们将探讨如何使用Unsloth、WandB等强大的工具组合来微调 Meta AI 的 Llama-3.2–11B-Vision 模型,并使用vLLM进行模型服务和推理。
DEVOPS 大模型推理加速与服务优化 使用 Triton Inference Server 部署 TensorRT-LLM 并设置与 OpenAI 兼容的 API 可实现高效、高性能的推理大型语言模型。
APPLICATION RAG管道PDF图文处理 本文提出了一种利用 Gemini 1.5 Flash 的方法,通过标记包含非文本元素的页面、嵌入文本和图像,并将整个 PDF 页面存储在矢量数据库中,可以为文档摘要、问答和数据提取等任务提供更准确的响应。