27 对话历史:让多轮 RAG 正确理解追问
对话历史:让多轮 RAG 正确理解追问 对话历史的核心不是把所有聊天记录不断塞给模型,而是保存完&#
26 权限隔离:让无权内容无法进入 RAG 上下文
权限隔离:让无权内容无法进入 RAG 上下文 RAG 权限隔离的底线不是“最终答案不展示秘密”,而
25 引用来源:让 RAG 答案可以核对和追溯
引用来源:让 RAG 答案可以核对和追溯 引用来源的核心是让答案中的事实能够回到具体文档、页码&#
24 基础 RAG 问答
基础 RAG 问答 基础 RAG 问答的核心是先检索与问题相关的文档片段,再把这些片段作为受控上下文交给大模型回答。模型负责ń
23 向量检索
向量检索 向量检索的核心是把用户问题也转换成向量,再到向量库里找语义最接近的 chunks,作为大模型回答前的上下文。
21 Embedding 向量化
向量入库:把 Embedding 稳定写入 PostgreSQL + pgvector 向量入库的核心不是简单执行一次 UPDATE,而是保证 chunk、向量、模型&
20 文档切片
文档切片 文档切片的核心是把清洗后的长文本切成大小合适、语义完整、带来源信息的 chunk,为后面的 Embedding 和向量检索做准备
19 文本清洗
文本清洗 文本清洗的核心是在不破坏原文结构的前提下,去掉明显噪声,保留标题、段落、页码和来源信息,让后面的切
18 文档解析
文档解析 文档解析的核心是把 PDF、Word、Markdown、TXT 等不同格式统一转换成可处理的文本,同时尽量保留页码、标题、来源等元数据
17 文档上传
文档上传 文档上传的核心不是把文件收到就完事,而是完成文件校验、安全存储、元数据入库和后续解析任务的入口。