AI 全栈开发实战(6):向量检索与 RAG 问答 —— Qdrant 检索、Re-rank、流式输出

实现基于知识库的智能问答:Qdrant 向量检索与 Cross-Encoder 重排序、流式 SSE 问答 API、对话管理、前端流式渲染 Hook 与对话界面,让上传的文档真正可问答。

Zyentor 原创 1天前 373 RAG 向量检索

AI 全栈开发实战(5):文档处理 Pipeline —— 解析、切分、Embedding、存入 Qdrant

实现文档处理完整 Pipeline:PDF/文本解析、递归字符切分、BGE Embedding 向量化、Qdrant 向量存储、Celery 异步任务、前端状态轮询,上传即自动处理。

Zyentor 原创 2天前 292 文档处理 Pipeline

AI 全栈开发实战(4):知识库与文档管理 —— CRUD API、文件上传、MinIO 集成

实现知识库和文档管理模块:知识库 CRUD 与权限隔离、文档上传与类型验证、MinIO 文件存储、文档列表与删除、前端知识库仪表盘和文件管理页面。

Zyentor 原创 3天前 134 知识库 文档管理

AI 全栈开发实战(3):用户系统 —— 注册、登录、JWT 认证与前端集成

实现完整的用户系统:bcrypt 密码加密与验证、JWT Token 签发与验证、注册/登录 API、认证中间件、前端登录/注册页面、Auth Context 全局状态管理。

Zyentor 原创 4天前 160 用户系统 JWT

AI 全栈开发实战(2):技术选型与项目初始化 —— 搭建 KNow 项目骨架与 Docker 环境

从零初始化 KNow 知识库助手项目:Docker Compose 编排 6 个服务(PostgreSQL/Redis/Qdrant/MinIO/后端/前端)、FastAPI 后端骨架搭建、React 前端项目初始化、开发工作流配置。

Zyentor 原创 5天前 261 全栈开发 项目初始化

AI 全栈开发实战(1):产品定义与架构设计 —— 做一个真正的 AI 知识库产品

开启 AI 全栈开发实战系列,从产品定义开始到部署上线。本文完成 KNow 知识库助手的定位、功能规划、技术选型、数据库设计、API 设计和架构决策。

Zyentor 原创 6天前 351 AI全栈开发 产品设计

AI 应用开发实战(5):AI Agent —— 工具调用、自主决策、多步循环完整实现

从零构建一个完整的 AI Agent 系统:工具定义与注册机制、Function Calling 实现、Think-Act-Observe 多步循环、错误处理与容错,以及 Agent 与 Chat/RAG 模式的融合。

Zyentor 原创 7天前 199 AI Agent Function Calling

AI 应用开发实战(4):从零实现 RAG 系统 —— 文档解析、向量检索、知识库问答

从零构建一个完整的 RAG 系统:文档解析与 Chunk 切分策略、Embedding 与向量存储、Query 改写与混合检索、Re-rank 重排序、完整 Pipeline 集成,附可运行的全套代码。

Zyentor 原创 8天前 297 RAG 检索增强生成

AI 应用开发实战(3):多轮对话进阶 —— 清除历史、注入 System Prompt、上下文截断策略

深入讲解 AI 应用多轮对话的核心技术:对话上下文管理与记忆机制、System Prompt 动态注入策略、Token 窗口截断算法、多轮对话状态保持,以及生产环境中的长对话优化方案。

Zyentor 原创 9天前 260 多轮对话 对话管理

AI 应用开发实战(2):Prompt 工程实战 —— 从零构建可靠的 Prompt 系统

深入讲解生产级 Prompt 工程的方法论:Prompt 原子组件设计、结构化模板模式、Few-shot 与 CoT 的最佳实践、Prompt 版本管理与 A/B 测试,以及基于 LangChain 的 Prompt Template 实现。

Zyentor 原创 10天前 202 Prompt工程 提示词设计

AI 应用开发实战(1):从零搭建你的第一个 AI 应用 —— FastAPI + LLM API 调用完整教程

从项目初始化开始,一步步搭建一个完整的 AI 应用:FastAPI 项目骨架、LLM API 封装、流式响应、前端对话界面,以及生产部署的最佳实践。

Zyentor 原创 11天前 274 AI应用开发 FastAPI

Prompt Engineering 系统化指南 —— 从写单条提示词到构建完整 Prompt 系统

系统化讲解 Prompt Engineering 的核心方法论:Prompt 原子组件(角色/指令/上下文/格式)、结构化 Prompt 设计模式、思维链与 Few-shot 的高级用法、Prompt 管理系统架构。

Zyentor 原创 14天前 439 Prompt Engineering 提示词工程

AI 模型部署从入门到生产 —— ONNX 转换、TensorRT 加速、推理服务搭建

完整讲解 AI 模型从训练完成到生产部署的全流程:模型导出与格式转换(ONNX/TensorRT)、推理优化(FP16/INT8 量化)、推理服务框架选型(Triton/vLLM/SGLang)、性能压测与监控。

Zyentor 原创 15天前 335 模型部署 ONNX

大模型微调实战指南 —— 从 LoRA 到全参微调,一文搞懂 Fine-tuning

深入讲解大模型微调(Fine-tuning)的完整流程:数据准备与清洗、LoRA/QLoRA 原理与配置、训练参数调优、评估与部署,以及全参微调 vs PEFT 的选型决策。

Zyentor 原创 16天前 353 大模型微调 Fine-tuning

2026 年 AI Agent 开发踩坑实录 —— 从入门到放弃再到真香

半年 AI Agent 开发实战中遇到的 7 个真实坑,从 Tool Call 循环到上下文爆炸,每一个都是代码换来的教训。

Zyentor 原创 14天前 350 AI Agent AI开发

小白也能懂的 RAG 原理 —— 从检索到生成的完整指南

本文用通俗的语言和实例,带你理解 RAG(检索增强生成)的核心原理、主流架构和落地实践,适合 AI 初学者和想要快速了解 RAG 的开发者。

Zyentor 原创 14天前 404 RAG 检索增强生成