LEANN:微型矢量索引器
LEANN是一款开源工具——矢量数据库,它能让你以极快的速度搜索海量数据,而且几乎不占用任何空间。

我们每个人都有太多数据了。电子邮件、PDF、随机笔记、浏览器历史记录、代码……它们无处不在。搜索它们?真是痛苦。
要么你使用了一些侵犯隐私的云工具,要么你设置了一个占用大量空间的庞大矢量数据库。
来认识一下 LEANN!
LEANN 可以像一位天才图书管理员一样,挖掘你的电子邮件、笔记或代码,从不忘记任何事。
这是一款开源工具——矢量数据库,它能让你以极快的速度搜索海量数据,而且几乎不占用任何空间。
它比普通的数据库节省了 97% 的存储空间,还能直接在你的设备上保护你的数据隐私。
快来看看吧!
1、那么,LEANN 是什么?
LEANN 能把你的笔记本电脑变成搜索神器。
它专为处理数百万个文件(例如电子邮件、PDF 或杂乱的笔记)而设计,而且不会占用太多硬盘空间。
例如,它只需 6 GB 就能存储 6000 万个文本片段,而其他工具完成同样的工作则需要 200 GB。
而且它不是那种监视你数据的云服务;所有内容都保留在你的设备上。

2、为什么大多数搜索工具不适合笔记本电脑?
普通的矢量数据库会存储所有内容的嵌入。这意味着巨大的存储空间需求。比如,索引 6000 万个文本块?那大约需要 201GB。
LEANN 只需 6GB 即可完成。没错,就是 6GB。这意味着存储空间减少了 97%。更棒的是——准确率丝毫没有下降。搜索体验依然出色。
因此,你的笔记本电脑突然感觉可以处理通常需要服务器集群才能完成的工作。
3、它有什么优点?
LEANN 值得一看的原因如下:
- 保护你的数据隐私——无需云存储。
- 占用空间小——其他设备需要 200GB,而 6GB 却足够。
- 易于移动——轻松复制你的设置到其他设备。
- 处理混乱——杂乱的笔记或搜索历史记录不会让它感到困扰。
- 快速准确地查找内容,轻松匹配重要内容。
4、开始运行吧
想试试吗?我将逐步指导你设置 LEANN 并使用它做一些很酷的事情。
步骤 1:设置
您需要 uv 来安装 LEANN。它是一个 Python 包管理器。打开终端并输入:
curl -LsSf https://astral.sh/uv/install.sh | sh
然后获取 LEANN 并进行准备:
git clone https://github.com/yichuan-w/LEANN.git leann
cd leann
uv venv
source .venv/bin/activate
uv pip install leann
完成。是不是很简单?
步骤 2:尝试快速搜索
让我们创建一个小索引并试用一下。以下是一个可供参考的 Python 脚本:
from leann import LeannBuilder, LeannSearcher, LeannChat
from pathlib import Path
# Pick a spot to save your index
INDEX_PATH = str(Path("./").resolve() / "demo.leann")
# Make an index
builder = LeannBuilder(backend_name="hnsw") # HNSW makes searches quick
builder.add_text("LEANN saves 97% storage compared to other databases.")
builder.add_text("Tung Tung Tung Sahur wants their banana-crocodile thing back!")
builder.build_index(INDEX_PATH)
# Search it
searcher = LeannSearcher(INDEX_PATH)
results = searcher.search("crazy AI animals", top_k=1)
print(results) # Should pull up that banana-crocodile line
# Chat with it
chat = LeannChat(INDEX_PATH, llm_config={"type": "hf", "model": "Qwen/Qwen3-0.6B"})
response = chat.ask("How much space does LEANN save?", top_k=1)
print(response) # Should say something like "97% storage saved"
这是什么意思?我们正在创建一个包含两段文本的索引,搜索一些奇怪的内容,并提出一个问题。HNSW 部分只是一种快速搜索的方式,而聊天部分则使用本地模型 (Qwen3-0.6B) 来提供答案。
步骤 3:使用 CLI 进行操作
LEANN 有一个非常方便的命令行工具。全局安装后:
uv tool install leann-core --with leann
您可以执行以下操作:
# Index a folder
leann build my-files --docs ./documents
# Search for something
leann search my-files "AI basics"
# Chat with your files
leann ask my-files --interactive
这就像拥有一个搜索引擎,可以搜索您的资料,无需连接互联网。
5、LEANN 的趣味使用方法
LEANN 不仅仅适合极客。您可以:
- 搜索您的电子邮件,找到关于“预算削减”的邮件。
- 深入研究您的代码,了解函数,而不仅仅是关键字。
- 整理您使用 Notion 或 Obsidian 的笔记。
- 私下筛选您的浏览器历史记录或微信聊天记录。
对于电子邮件,请尝试:
leann build email_index --mail-path ~/Library/Mail/V10/PRIMARY
leann search email_index "meetings in 2025" --sender "boss@work.com"
它就像一个个人版的谷歌,但一切都属于你。
6、为什么 LEANN 感觉很棒
LEANN 并非试图成为另一个臃肿的工具。它是开源的,因此你可以随意探索并打造自己的专属工具。它足够小巧,可以安装在任何笔记本电脑上,并且可以保证你的数据安全。无论你是在构建一个酷炫的 AI 项目,还是只是想更快地找到旧笔记,LEA 都能帮你搞定。NN 让一切变得简单。
它的数据非常惊人:6GB 空间内包含 6000 万个文档,而且性能不逊于其他大型数据集。它还可以与 HuggingFace 或 Ollama 等工具兼容,因此您可以根据自己的喜好进行调整。
原文链接:LEANN: A Tiny Vector Index That Turns Your Laptop Into a RAG Machine
汇智网翻译整理,转载请标明出处
