ALGORITHM - Software 2.0

向量索引和近似最近邻算法

暴力搜索的隐藏成本，以及ANN、IVF和HNSW如何将查询时间从100秒降低到10毫秒。

通过SFT、RKD和DPO将你的专业形象提炼到小型语言模型（SLM）中。

SFT、RLHF、DPO、GRPO、LoRA、PPO、QLoRA、RLVR。这些不是独立的技术。它们是一个单一的进步序列。每个都是因为前一个碰到了瓶颈而被发明出来的。本文完整介绍这个链条，帮助你做出正确选择。

一篇通俗易懂的解读，带你了解这项可能：如何在保持精度的同时将 LLM 内存占用降低 6 倍。

当我说 "逆向SynthID"时，我指的是这个想法：检测内容中的SynthID水印，以及从内容中消除SynthID水印。

来自纽约大学和其他顶级机构专家的最新研究提出了一种受人类生物学启发的解决方案，称为时序正则化。通过强制AI的内部轨迹变得更加平直，从而使机器人和自主系统更容易规划到达目标的路径。

是时候探索为什么CPU和GPU在处理量化数据方面有着根本不同的特性，以及byteshape.com的研究团队如何揭露了量化世界中的一个静默丑闻：某些格式偷偷地为GPU优化，它们会悄悄地破坏你的CPU性能。

在这篇博客中，我们将学习和理解GRPO算法与AI智能体的关系，然后创建一个多智能体系统并使用GRPO训练它。

彩票假设（LTH）指出，大多数神经网络可以剪枝高达 90% 的参数而不会损失性能。这意味着，与其训练一个庞大而复杂的模型，不如训练一个更小、更高效且性能同样出色的模型。

Transformer 架构最初是为解决自然语言处理领域的复杂任务而提出的。然而，我们不能简单地套用标准的Transformer架构，就指望它在所有模态下都能达到最先进的水平。

在本文中，我将向你展示最常用的经典计算机视觉方法，给出示例，并向你展示如何使用这些算法以及何时你应该和不应该使用这些算法。

使用Python估计未知数据生成过程的观测数据的概率密度。

我们可以让标准的、非前沿的LLM比推理模型更好，而无需任何额外的训练。

当今人工智能领域最大的谎言是“自我修正”证明了大型语言模型（LLM）能够推理。但事实并非如此。

在这篇文章中，我们将深入探讨十个最怪异、最聪明的算法——这些算法帮助在几毫秒内搜索数十亿行代码，从无到有生成无限地图，并将量子怪异转化为实用逻辑。