avatar

一条在知识海洋的咸鱼

这个家伙很懒,啥也没有留下😋

  • Linux
  • OCJP
  • Java核心技术卷
  • J2EE相关标准
  • 深入理解Java虚拟机
  • NIO与SOcket编程技术指南
  • Java多线程编程核心技术
  • Redis开发与运维
  • Spring Cloud Alibaba 微服务原理与实践
  • DevOps
  • Docker
  • MySQL必知必会
  • AI自学路线
  • Spring Boot 编程思想(核心篇)
  • 首页
主页
一条在知识海洋的咸鱼

21 Embedding 向量化

向量入库:把 Embedding 稳定写入 PostgreSQL + pgvector 向量入库的核心不是简单执行一次 UPDATE,而是保证 chunk、向量、模型&

2天前 AI自学路线

20 文档切片

文档切片 文档切片的核心是把清洗后的长文本切成大小合适、语义完整、带来源信息的 chunk,为后面的 Embedding 和向量检索做准备

2天前 AI自学路线

19 文本清洗

文本清洗 文本清洗的核心是在不破坏原文结构的前提下,去掉明显噪声,保留标题、段落、页码和来源信息,让后面的切

2天前 AI自学路线

18 文档解析

文档解析 文档解析的核心是把 PDF、Word、Markdown、TXT 等不同格式统一转换成可处理的文本,同时尽量保留页码、标题、来源等元数据

3天前 AI自学路线

17 文档上传

文档上传 文档上传的核心不是把文件收到就完事,而是完成文件校验、安全存储、元数据入库和后续解析任务的入口。

3天前 AI自学路线

16_01PostgreSQL 介绍

从 MySQL 到 PostgreSQL:面向 AI / RAG 开发的完整入门 适合已经知道 MySQL 基本增删改查,但没有系统使用过 PostgreSQL 的 Java 后

4天前 AI自学路线

16 数据库准备

数据库准备 RAG 数据库准备的核心是把原始文档、文档片段、向量和任务状态分开存,让后面的上传、解析、切片、Embedding 和੹

5天前 AI自学路线

15 RAG 原理

RAG 原理RAG 的核心是先从知识库检索相关内容,再把检索结果作为上下文交给大模型回答,从而减少模型胡编,并让模型能回答私有文档里的问题。RAG 原理RAG 是什么为什么需要 RAGRAG 和普通 Chat 的区别RAG 基本流程核心组件Document 和 ChunkEmbedding 是什么V

6天前 AI自学路线

14 阶段交付

阶段交付 阶段交付的核心不是继续加新功能,而是把前面做过的聊天、流式输出、Tool Calling、FastAPI 和 Java/Python 联调整理成一个能启动、

6天前 AI自学路线

13 Java + Python 联调

Java + Python 联调Java + Python 联调的核心是让 Spring Boot 负责业务入口,让 FastAPI 负责 AI 能力,并用统一协议、超时、重试和日志把两边稳定连接起来。Java + Python 联调为什么要 Java 调 Python联调目标Python 侧接口统

6天前 AI自学路线
  • 1
  • 2
  • 3
  • …
  • 22

最近更新

  • 21 Embedding 向量化
  • 20 文档切片
  • 19 文本清洗
  • 18 文档解析
  • 17 文档上传

热门标签

java基础 微服务 maven Spring Tomcat DDD Linux Linux基础 SQL基础 数据结构算法

©2026 一条在知识海洋的咸鱼. 保留部分权利。

使用 Halo 主题 Chirpy