LlamaIndex推出Legal‑KB演示四大文件工具实现Agent化检索

背景介绍

LlamaIndex 最近在 GitHub 开源了名为 legal‑kb 的参考应用。该项目定位为法律文档知识库，底层使用 LlamaIndex 的 Index v2（即 LlamaParse 平台），旨在让 AI Agent 具备类似文件系统的操作能力，从而在大规模、持续演进的文档集合中完成复杂任务。

核心功能

retrieve：混合语义搜索，支持可选重排、分数阈值以及按文件名/版本过滤。
findFiles：按文件名或子串快速定位文档，自动分页。
readFile：读取指定文件的原始内容，可指定偏移与长度窗口。
grepFile：在单文件内部执行正则匹配，返回字符位置与上下文。

这些工具的调用顺序被系统提示硬性规定：先 findFiles 建立文档清单 → retrieve 缩小搜索范围 → 通过 readFile 或 grepFile 确认原文并生成 可视化引用（cite:xxxx）。

技术实现

数据管线：用户上传文件后，字节流写入 LlamaCloud 项目目录；随后通过 Prisma 将文件元数据写入 PostgreSQL，并触发后台索引同步。每次重新上传同名文件会产生 v1、v2、v3 版本，检索时可依据 file_version 过滤，实现细粒度的版本控制。
Agent 架构：使用 Vercel AI SDK 6 的 ToolLoopAgent，模型可选 OpenAI 或 Anthropic，工具通过 tool 高阶函数包装 Index v2 的四个检索 API。Agent 的推理过程被流式输出，Claude 系列模型倾向深度思考，OpenAI 系列则保持中等推理力度。
可视化引用：每个检索块在返回时附带短 ID（如 c7f2qa），前端 UI 会在答案中以 cite:c7f2qa 形式展示，并在点击后弹出对应页面的截图与高亮框，提升答案可信度。

与传统单轮 RAG 的区别

维度	传统单轮 RAG	Agentic Retrieval（Index v2）
检索流程	单次向量搜索	多步工具链：find → retrieve → read/grep
检索模式	仅向量相似度	语义 + 关键字 + 正则混合
上下文	固定 top‑k 结果	可随时读取完整文件或窗口
数据新鲜度	静态索引	持续同步、支持版本控制
可控性	参数少	通过 `top_k、score_threshold、rerank_top_n` 等细粒度调节
引用方式	文本或 URL	页面截图 + 坐标框的视觉引用

典型应用场景

合同条款查询：用户询问“终止 MSA 需要提前多久通知”，Agent 先列出所有合同文件，检索相关段落，再通过 grepFile 定位精确条款并返回带引用的答案。
尽职调查：在数据室中快速筛选目标文件，逐一 readFile 核对关键信息，省去人工打开每个 PDF 的时间成本。
政策版本追溯：通过 file_version 过滤，可查询特定版本的合规政策，帮助审计团队追踪条款变更历史。

业界意义

Legal‑KB 展示了 Agentic Retrieval Harness 的完整闭环：从数据摄取、持续索引、工具化检索到可视化引用，全部在同一平台完成。相较于传统 RAG，它在处理大规模、频繁更新的企业文档时提供了更高的准确性、可解释性和操作灵活性。随着企业对合规、合同审查等高风险场景的自动化需求提升，此类 Agent‑first 检索框架有望成为下一代企业知识工作流的核心组件。

LlamaIndex推出Legal‑KB演示 四大文件工具实现Agent化检索