PageIndex:告别向量数据库,用推理重构 RAG

传统 RAG 的困境 如果你用过 RAG(检索增强生成),应该熟悉这套流程: 文档切片(chunking) 向量化(embedding) 存入向量数据库 查询时检索 Top-K 相似片段 喂给 LLM 生成答案 这套方案有个致命问题:切片粒度很难把握。 切太小,语义不完整;切太大,噪音太多。更麻烦的是,向量相似度检索本质上是模糊匹配——它能找到相关的内容,但不一定能找到精确的内容。 比如你问项目预算在第几章?,向量检索可能返回一堆提到预算的片段,却无法告诉你精确的章节位置。 PageIndex 的思路:给 AI 一张地图 PageIndex 的核心理念很简单:不用向量,用结构。 它把文档解析成一棵层级树: 文档 ├── 第一章 概述 │ ├── 1.1 项目背景 │ └── 1.2 目标与范围 ├── 第二章 技术方案 │ ├── 2.1 架构设计 │ └── 2.2 技术选型 └── 第三章 实施计划 这棵树直接放在 LLM 的上下文窗口里。检索时,LLM 像人一样读目录找答案: 问题:架构设计在哪? → LLM 定位到 第二章 > 2.1 架构设计 问题:项目总体目标是什么? → LLM 定位到 第一章 > 1.2 目标与范围 这就是 推理即检索(Reasoning-based Retrieval)。 ...

2026年3月1日 · 2 分钟