Software 2.0

Codeium Windsurf 实测

Codeium Windsurf 实测

我的目标是创建一个最小的无头 DBOS 应用程序作为示例，以开始使用 Codeium 的 AI IDE Windsurf 。

Chrome内置AI的扩展开发实验

Chrome内置AI的扩展开发实验

本文介绍如何构建一个基于 Chrome 内置AI的扩展程序，它使用 Summarization API 来总结你在网页上选择的任何文本。

ComfyUI-3D-Pack单图转3D

ComfyUI-3D-Pack单图转3D

本文介绍如何使用 ComfyUI 3D Pack 扩展和 Stable Fast 3D 模型将你的 3D 内容创作提升到一个新的水平

打造自己的实时语音助理

将指导你构建一个复杂的语音聊天应用程序，该应用程序结合了实时音频处理、语音识别、自然语言处理和文本转语音合成。

会员制网站的AI新收入

本周发生了两个“啊哈”时刻，强化了我的信念：“人工智能是新的用户界面”

企业利用生成式AI的正确方法

我构建的生成式AI应用已投入生产并为数千名用户提供服务，它们塑造了我对构建有影响力的企业内部生成式AI解决方案的思考。

Bolt.new全栈Nuxt开发实测

Bolt.new全栈Nuxt开发实测

Bolt.new 是一款出色的新 AI 工具，可用于生成和运行代码。本文对其进行测试，创建一个全栈Nuxt应用程序。

10个市场研究必备AI工具

人工智能 (AI) 和机器学习可以帮助你以前所未有的速度开展市场研究并了解你的数据。本文介绍的10个AI 市场研究工具，可以帮助你更好地了解行业和客户。

Ragish：RAG轻量级替代品

Ragish：RAG轻量级替代品

Ragish 是 RAG 的轻量级替代品，表现超出预期！

AI驱动的Discord聊天机器人

AI驱动的Discord聊天机器人

我决定用Amazon Bedrock创建一个由人工智能驱动的 Discord 机器人，它可以实时回答小组成员的问题。

ComfyUI FLUX LoRA微调工作流

ComfyUI FLUX LoRA微调工作流

本文介绍的 ComfyUI FLUX LoRA 训练工作流使你能够使用自己的数据集微调预先存在的 FLUX 模型。

基于OpenUSD的合成数据生成

基于OpenUSD的合成数据生成

本文介绍了如何使用 NVIDIA NIM 微服务和NVIDIA Omniverse Replicator为 USD 构建自定义合成数据生成 (SDG) 管道。

8个股票交易必备AI工具

AI工具在市场过去趋势的大量数据集上进行训练，可以帮助交易者和投资者做出更好的市场预测、研究市场、分析数据并提供风险管理策略以减少损失。

Whisper本地推理的4种方法

Whisper本地推理的4种方法

本文总结l了4种在本地CPU上进行推理的方法：HuggingFace管道、ONN运行时、OpenVino运行时和PyTorch。

11个有效利用GenAI的最佳提示

11个有效利用GenAI的最佳提示

要充分利用生成式AI模型，必须使用有效的提示技术。本文介绍了有效利用生成式人工智能的11个关键实践和示例。

Qwen2-VL 本地运行教程

Qwen2-VL 本地运行教程

Qwen2-VL 是阿里巴巴于 2024 年 10 月发布的视觉语言模型。它提供三种模型大小：2B、7B 和 72B，并允许用户使用文本询问有关图像的问题，类似于 GPT-4 视觉 API。

Ollama函数即工具

Ollama的新版本现在可以将 Python 函数直接作为 Ollama 库中的工具传递。此功能允许无缝集成 Python 库、SDK 等中的现有函数，从而使你的开发过程更加高效

8个值得学习的SD 3.5提示

8个值得学习的SD 3.5提示

本文介绍的8个示例展示了 SD3.5 真正能做什么。你可以随意使用这些模板来创作自己的作品。

TimesLM时间序列预测基础模型

TimesLM时间序列预测基础模型

TimesLM 是一款用于时间序列预测的开创性大型语言模型 (LLM)，其灵感来自基于 NLP 的基础模型的进步。

SmolVLM 小型视觉语言模型

SmolVLM 小型视觉语言模型

本文介绍 SmolVLM，这是一款 2B VLM，内存占用率最低。SmolVLM 体积小、速度快、内存效率高，并且完全开源。

视觉语言模型LoRA微调指南

在本文中，我们将探讨如何使用Unsloth、WandB等强大的工具组合来微调 Meta AI 的 Llama-3.2–11B-Vision 模型，并使用vLLM进行模型服务和推理。

10个RAG开发必备PDF解析库

10个RAG开发必备PDF解析库

本文介绍用于开发RAG系统所需的解析带有图像、表格和表单的 PDF 文档的10个顶级开发库。

大模型推理加速与服务优化

使用 Triton Inference Server 部署 TensorRT-LLM 并设置与 OpenAI 兼容的 API 可实现高效、高性能的推理大型语言模型。

RAG管道PDF图文处理

本文提出了一种利用 Gemini 1.5 Flash 的方法，通过标记包含非文本元素的页面、嵌入文本和图像，并将整个 PDF 页面存储在矢量数据库中，可以为文档摘要、问答和数据提取等任务提供更准确的响应。