向量检索 | 赵岩的技术笔记

传统 RAG 的困境如果你用过 RAG（检索增强生成），应该熟悉这套流程：文档切片（chunking）向量化（embedding）存入向量数据库查询时检索 Top-K 相似片段喂给 LLM 生成答案这套方案有个致命问题：切片粒度很难把握。切太小，语义不完整；切太大，噪音太多。更麻烦的是，向量相似度检索本质上是模糊匹配——它能找到相关的内容，但不一定能找到精确的内容。比如你问项目预算在第几章？，向量检索可能返回一堆提到预算的片段，却无法告诉你精确的章节位置。 PageIndex 的思路：给 AI 一张地图 PageIndex 的核心理念很简单：不用向量，用结构。它把文档解析成一棵层级树：文档 ├── 第一章概述 │ ├── 1.1 项目背景 │ └── 1.2 目标与范围 ├── 第二章技术方案 │ ├── 2.1 架构设计 │ └── 2.2 技术选型 └── 第三章实施计划这棵树直接放在 LLM 的上下文窗口里。检索时，LLM 像人一样读目录找答案：问题：架构设计在哪？ → LLM 定位到第二章 > 2.1 架构设计问题：项目总体目标是什么？ → LLM 定位到第一章 > 1.2 目标与范围这就是推理即检索（Reasoning-based Retrieval）。 ...