RAG神器:Gemini文件搜索工具
如果您曾经尝试构建自己的 RAG 设置,您可能了解其中的挑战——管理词嵌入、矢量数据库、正确分块文本,并确保所有内容都能与您的模型交互,同时又不超出预算。
现在,谷歌彻底解决了这个问题。
他们在 Gemini API 中悄然推出了一款全新的文件搜索工具,它可以帮您处理所有繁重的 RAG 工作。您只需上传文件,提出问题,剩下的就交给它来搞定。
1、这是什么?
文件搜索的核心在于让 Gemini 能够“理解”您的数据。您可以上传 PDF、DOCX 文件、文本、JSON 甚至代码文件。当您向 Gemini 提出问题时,它不会随意猜测,而是会检查您上传的文件,找到相关部分,并利用这些部分来回答问题。
这就像将您的大脑直接连接到 Gemini。无需单独的向量数据库,无需检索管道,也无需任何管理。
只需输入文件,即可获得答案。
它非常便宜。真的非常便宜。
这一点让我很惊喜。您无需为查询或存储付费;只需在索引文件时支付一次费用。
使用 gemini-embedding-001 模型,创建嵌入的成本为每百万个 token 0.15 美元。与使用 Pinecone 或 Weaviate 等工具构建自己的管道相比,这简直是九牛一毛。
之后,您可以随意查询这些文件。
2、工作原理
文件搜索通过自动分块来简化 RAG 算法。文件搜索、生成嵌入、存储和检索嵌入,并将上下文信息注入到 Gemini 提示中。
所有这些都在您已使用的 generateContent API 调用中完成。
当您发出查询时,它会在后台使用最新的 Gemini 嵌入模型执行向量搜索。因此,它理解的是含义,而不仅仅是关键词。
更棒的是:Gemini 的答案包含引用——它会明确指出引用的文件和章节。您可以点击查看并验证。再也不用猜测模型是否产生了错误信息。
3、用例:Beam 的超快游戏生成
早期测试者之一 Phaser Studio 正在其 AI 驱动的游戏平台 Beam 上使用文件搜索功能。
他们拥有一个包含 3000 多个文件的库——包括模板、代码片段、设计文档和其他内部数据。文件搜索功能使他们能够在不到 2 秒的时间内查询所有文件。以前,手动查找相同的信息需要花费数小时。
他们的首席技术官 Richard Davey总结得非常到位:
“过去需要几天才能完成原型设计的想法,现在只需几分钟就能实现。”
这真是太不可思议了。
4、一个简单的 Python 示例
你不需要编写太多代码就能上手。这里有一个简单的示例:
from google import genai
from google.genai import types
import time
client = genai.Client()
store = client.file_search_stores.create()
upload_op = client.file_search_stores.upload_to_file_search_store(
file_search_store_name=store.name,
file='path/to/your/document.pdf'
)
while not upload_op.done:
time.sleep(5)
upload_op = client.operations.get(upload_op)
response = client.models.generate_content(
model='gemini-2.5-flash',
contents='Summarize the research on sustainable AI.',
config=types.GenerateContentConfig(
tools=[types.Tool(
file_search=types.FileSearch(
file_search_store_names=[store.name]
)
)]
)
)
print(response.text)
grounding = response.candidates[0].grounding_metadata
sources = {c.retrieved_context.title for c in grounding.grounding_chunks}
print('Sources:', *sources)就是这样。上传文件,提出问题,即可获得带有来源信息的答案。完成。
5、为什么这很重要
每个 AI 开发人员都会遇到同样的问题——模型听起来很棒,但却无法访问公司内部数据。
文件搜索改变了这一切,它使 Gemini 能够在无需复杂的检索设置的情况下分析您的内容。
如果您正在创建任何需要当前或特定领域信息的内容——例如支持机器人、内部工具、文档问答——这将带来颠覆性的改变。
6、亲自尝试一下
您现在就可以在 Google AI Studio 中试用文件搜索功能了。它提供了一个名为“Ask the Manual”(询问手册)的演示——上传一些文件,提出问题,看看它的答案是否合理。
一旦你掌握了它的用法,就可以对演示进行修改,或者直接将其集成到你的应用中。
原文链接:Google Just Made RAG Ridiculously Easy with the New File Search Tool
汇智网翻译整理,转载请标明出处