RAG 检索

体验检索增强生成(Retrieval-Augmented Generation)的完整流程: 文档切片、向量化、相似度检索、Rerank 排序。对应第五章 Multi-Agent 系统。

01文档切片
02Embedding
03向量检索
04Rerank
6 个片段502 tokenschunk 大小约 120 字符

流程说明

文档切片将长文档拆分为固定大小的片段(Chunk),保留语义连续性
Embedding用向量模型将每个 Chunk 转换为高维向量,捕获语义信息
向量检索计算查询向量与所有 Chunk 向量的余弦相似度,找出最相关片段
Rerank用更强的模型对候选片段重新排序,提升检索精度

* 此工具为教学演示,相似度使用关键词匹配模拟,非真实向量计算。