20 文档切片
文档切片 文档切片的核心是把清洗后的长文本切成大小合适、语义完整、带来源信息的 chunk,为后面的 Embedding 和向量检索做准备
19 文本清洗
文本清洗 文本清洗的核心是在不破坏原文结构的前提下,去掉明显噪声,保留标题、段落、页码和来源信息,让后面的切
18 文档解析
文档解析 文档解析的核心是把 PDF、Word、Markdown、TXT 等不同格式统一转换成可处理的文本,同时尽量保留页码、标题、来源等元数据
17 文档上传
文档上传 文档上传的核心不是把文件收到就完事,而是完成文件校验、安全存储、元数据入库和后续解析任务的入口。
16_01PostgreSQL 介绍
从 MySQL 到 PostgreSQL:面向 AI / RAG 开发的完整入门 适合已经知道 MySQL 基本增删改查,但没有系统使用过 PostgreSQL 的 Java 后
16 数据库准备
数据库准备 RAG 数据库准备的核心是把原始文档、文档片段、向量和任务状态分开存,让后面的上传、解析、切片、Embedding 和
15 RAG 原理
RAG 原理RAG 的核心是先从知识库检索相关内容,再把检索结果作为上下文交给大模型回答,从而减少模型胡编,并让模型能回答私有文档里的问题。RAG 原理RAG 是什么为什么需要 RAGRAG 和普通 Chat 的区别RAG 基本流程核心组件Document 和 ChunkEmbedding 是什么V
14 阶段交付
阶段交付 阶段交付的核心不是继续加新功能,而是把前面做过的聊天、流式输出、Tool Calling、FastAPI 和 Java/Python 联调整理成一个能启动、
13 Java + Python 联调
Java + Python 联调Java + Python 联调的核心是让 Spring Boot 负责业务入口,让 FastAPI 负责 AI 能力,并用统一协议、超时、重试和日志把两边稳定连接起来。Java + Python 联调为什么要 Java 调 Python联调目标Python 侧接口统
12 LangGraph 基础
LangGraph 基础LangGraph 的核心是把 AI 应用拆成状态、节点和边,让复杂流程不再只是一串函数调用,而是一张可以控制、观察和扩展的工作流图。LangGraph 基础LangGraph 是什么为什么需要 LangGraph安装依赖StateNodeEdge最小工作流加入模型调用条件边