LLM - Software 2.0 - 汇智网

Tagged

LLM

A collection of 115 posts

Aura：我用Rust重写的LLM网关

Aura：我用Rust重写的LLM网关

我是一个Python开发者。我用Claude Code构建了一个Rust LLM网关。

皇帝的新装：别用LLM运营公司

皇帝的新装：别用LLM运营公司

魔法是真的。结论是错的。

用小模型分流 AI 请求

在2026年，大多数生产代理是混合架构，由一个小语言模型（SLM）处理大多数无聊的请求，而大模型留给困难的问题。

LLM上下文压缩的3个策略

每次 LLM 调用都是一场与硬限制的谈判。GPT-4o 给你 128K token。Claude 3.7 给你 200K。Gemini 1.5 Pro 扩展到 1M……

LLM对齐技术快速指南

RLHF 让模型学习人类在多种输出中更偏好哪些——这是一种更微妙但更强大的训练信号。

用专有数据训练小型语言模型

我们如何微调一个4B参数模型达到95%准确率。

LLM训练数据调试指南

训练LLM时人人都应使用的数据驱动技术和工具...

LLM 参数速查表

每个参数、每个提供商、每个用例——全部汇集在一处，你再也不用去搜索 "top_p vs top_k" 了。

用AI审合同要避免的3个陷阱

为什么法律语言制造清晰的幻觉，以及NotebookLM如何帮助你测试是否真正理解你将要签署的内容

LLM微调不太实用

我从2023年到现在进行了几次实验，最新的是使用Gemma 4。在所有这些之后，我得出了一个许多人也达成的结论：微调LLM以注入知识通常不值得努力。

从RAG到自更新知识库

在本文中，你将学习到什么是LLM Wiki模式、它与传统RAG有何不同并构建它的实际工作流程。

30秒估算LLM显存需求

别再谷歌搜索"这个模型能装进我的 GPU 吗？"，这个公式每次都能让你一目了然

大语言模型维基模式

如果你一直对 RAG 感到沮丧，如果你觉得你的人工智能工具在对话结束的那一刻就忘记了一切，如果你因为维护太繁重而放弃了 Notion 数据库和 Obsidian 保险库；Karpathy 刚刚给了你让大语言模型做维护的蓝图。

LLM中的情感机制深度解析

通过深入研究 Claude Sonnet 4.5 的"大脑"，Anthropic的研究人员发现这些模型不仅仅是模仿情感，而是使用内部情感概念来指导其行为。

LLM遵循本福特定律吗？

本福特定律，也称为首位数字定律，描述了许多现实数据集中首位数字的频率分布。该定律指出，在许多自然产生的数字集合中，首位有效数字很可能是较小的数字。

LLM可观测性：AI系统缺失的环节

LLM可观测性：AI系统缺失的环节

为已部署LLM应用的开发者而设，希望了解其内部实际运行情况。

向LLM提供数据的最佳方式

你有没有想过，你格式化数据的方式会影响LLM对它的理解程度吗?

没有语言的思想

一个实体直到在没有语言的情况下证明推理时才拥有理解能力。

用LLM定制压缩算法

使用 LLM 帮助为我们的温湿度时间序列数据制作了定制压缩算法，将其压缩了约 x53.6。

11个生产级LLM服务引擎

本文是对你会实际遇到的 11 个LLM服务引擎的实用、以生产为重点的巡礼——加上如何选择而不被困住。

如何有效降低LLM的推理成本

在本文中，我们将探讨业内人士采用的一些技术，以在不产生过高成本的情况下实现尖端模型。

2025：大语言模型的一年

Simon Willson关于过去12个月大预言模型领域发生的重要事件的总结。

上下文工程的圣诞解读

这不仅仅是一场圣诞节灾难——这正是人工智能行业过去两年一直停滞不前的现状。我们一直痴迷于提示工程，把它当作解决一切问题的灵丹妙药。

LLM护栏综合指南

护栏是结构化的安全机制——规则、过滤器和检查，它们限制LLM的行为并保持其输出在可接受的范围内。实际上，护栏验证输入，过滤或修改输出，甚至重塑生成的响应以防止政策违规。

基于LLM的检索和推荐

在过去的一年里，我一直探索如何将LLM用作检索和推荐代理，并整理了这篇博客文章作为该主题的简单介绍。