avatar

一条在知识海洋的咸鱼

这个家伙很懒,啥也没有留下😋

  • Linux
  • OCJP
  • Java核心技术卷
  • J2EE相关标准
  • 深入理解Java虚拟机
  • NIO与SOcket编程技术指南
  • Java多线程编程核心技术
  • Redis开发与运维
  • Spring Cloud Alibaba 微服务原理与实践
  • DevOps
  • Docker
  • MySQL必知必会
  • AI自学路线
  • Spring Boot 编程思想(核心篇)
  • 首页
主页
一条在知识海洋的咸鱼

27 对话历史:让多轮 RAG 正确理解追问

对话历史:让多轮 RAG 正确理解追问 对话历史的核心不是把所有聊天记录不断塞给模型,而是保存完&#

昨天 AI自学路线

26 权限隔离:让无权内容无法进入 RAG 上下文

权限隔离:让无权内容无法进入 RAG 上下文 RAG 权限隔离的底线不是“最终答案不展示秘密”,而

昨天 AI自学路线

25 引用来源:让 RAG 答案可以核对和追溯

引用来源:让 RAG 答案可以核对和追溯 引用来源的核心是让答案中的事实能够回到具体文档、页码&#

昨天 AI自学路线

24 基础 RAG 问答

基础 RAG 问答 基础 RAG 问答的核心是先检索与问题相关的文档片段,再把这些片段作为受控上下文交给大模型回答。模型负责ń

昨天 AI自学路线

23 向量检索

向量检索 向量检索的核心是把用户问题也转换成向量,再到向量库里找语义最接近的 chunks,作为大模型回答前的上下文。

2天前 AI自学路线

21 Embedding 向量化

向量入库:把 Embedding 稳定写入 PostgreSQL + pgvector 向量入库的核心不是简单执行一次 UPDATE,而是保证 chunk、向量、模型&

3天前 AI自学路线

20 文档切片

文档切片 文档切片的核心是把清洗后的长文本切成大小合适、语义完整、带来源信息的 chunk,为后面的 Embedding 和向量检索做准备

4天前 AI自学路线

19 文本清洗

文本清洗 文本清洗的核心是在不破坏原文结构的前提下,去掉明显噪声,保留标题、段落、页码和来源信息,让后面的切

4天前 AI自学路线

18 文档解析

文档解析 文档解析的核心是把 PDF、Word、Markdown、TXT 等不同格式统一转换成可处理的文本,同时尽量保留页码、标题、来源等元数据

4天前 AI自学路线

17 文档上传

文档上传 文档上传的核心不是把文件收到就完事,而是完成文件校验、安全存储、元数据入库和后续解析任务的入口。

5天前 AI自学路线
  • 1
  • 2
  • 3
  • …
  • 22

最近更新

  • 27 对话历史:让多轮 RAG 正确理解追问
  • 26 权限隔离:让无权内容无法进入 RAG 上下文
  • 25 引用来源:让 RAG 答案可以核对和追溯
  • 24 基础 RAG 问答
  • 23 向量检索

热门标签

java基础 微服务 maven Spring Tomcat DDD Linux Linux基础 SQL基础 数据结构算法

©2026 一条在知识海洋的咸鱼. 保留部分权利。

使用 Halo 主题 Chirpy