avatar

一条在知识海洋的咸鱼

这个家伙很懒,啥也没有留下😋

  • Linux
  • OCJP
  • Java核心技术卷
  • J2EE相关标准
  • 深入理解Java虚拟机
  • NIO与SOcket编程技术指南
  • Java多线程编程核心技术
  • Redis开发与运维
  • Spring Cloud Alibaba 微服务原理与实践
  • DevOps
  • Docker
  • MySQL必知必会
  • AI自学路线
  • Spring Boot 编程思想(核心篇)
  • 首页
主页
一条在知识海洋的咸鱼

28 RAG 第一版交付:从功能拼接到可演示系统

RAG 第一版交付:从功能拼接到可演示系统 RAG 第一版交付的目标不是加入所有高级能力,而是把

最近 AI自学路线

27 对话历史:让多轮 RAG 正确理解追问

对话历史:让多轮 RAG 正确理解追问 对话历史的核心不是把所有聊天记录不断塞给模型,而是保存完&#

昨天 AI自学路线

26 权限隔离:让无权内容无法进入 RAG 上下文

权限隔离:让无权内容无法进入 RAG 上下文 RAG 权限隔离的底线不是“最终答案不展示秘密”,而

昨天 AI自学路线

25 引用来源:让 RAG 答案可以核对和追溯

引用来源:让 RAG 答案可以核对和追溯 引用来源的核心是让答案中的事实能够回到具体文档、页码&#

昨天 AI自学路线

24 基础 RAG 问答

基础 RAG 问答 基础 RAG 问答的核心是先检索与问题相关的文档片段,再把这些片段作为受控上下文交给大模型回答。模型负责ń

昨天 AI自学路线

23 向量检索

向量检索 向量检索的核心是把用户问题也转换成向量,再到向量库里找语义最接近的 chunks,作为大模型回答前的上下文。

2天前 AI自学路线

21 Embedding 向量化

向量入库:把 Embedding 稳定写入 PostgreSQL + pgvector 向量入库的核心不是简单执行一次 UPDATE,而是保证 chunk、向量、模型&

4天前 AI自学路线

20 文档切片

文档切片 文档切片的核心是把清洗后的长文本切成大小合适、语义完整、带来源信息的 chunk,为后面的 Embedding 和向量检索做准备

4天前 AI自学路线

19 文本清洗

文本清洗 文本清洗的核心是在不破坏原文结构的前提下,去掉明显噪声,保留标题、段落、页码和来源信息,让后面的切

4天前 AI自学路线

18 文档解析

文档解析 文档解析的核心是把 PDF、Word、Markdown、TXT 等不同格式统一转换成可处理的文本,同时尽量保留页码、标题、来源等元数据

5天前 AI自学路线
  • 1
  • 2
  • 3
  • …
  • 22

最近更新

  • 28 RAG 第一版交付:从功能拼接到可演示系统
  • 27 对话历史:让多轮 RAG 正确理解追问
  • 26 权限隔离:让无权内容无法进入 RAG 上下文
  • 25 引用来源:让 RAG 答案可以核对和追溯
  • 24 基础 RAG 问答

热门标签

java基础 微服务 maven Spring Tomcat DDD Linux Linux基础 SQL基础 数据结构算法

©2026 一条在知识海洋的咸鱼. 保留部分权利。

使用 Halo 主题 Chirpy