AI 全栈开发实战(6):向量检索与 RAG 问答 —— Qdrant 检索、Re-rank、流式输出
实现基于知识库的智能问答:Qdrant 向量检索与 Cross-Encoder 重排序、流式 SSE 问答 API、对话管理、前端流式渲染 Hook 与对话界面,让上传的文档真正可问答。
AI 全栈开发实战(5):文档处理 Pipeline —— 解析、切分、Embedding、存入 Qdrant
实现文档处理完整 Pipeline:PDF/文本解析、递归字符切分、BGE Embedding 向量化、Qdrant 向量存储、Celery 异步任务、前端状态轮询,上传即自动处理。
AI 全栈开发实战(4):知识库与文档管理 —— CRUD API、文件上传、MinIO 集成
实现知识库和文档管理模块:知识库 CRUD 与权限隔离、文档上传与类型验证、MinIO 文件存储、文档列表与删除、前端知识库仪表盘和文件管理页面。
AI 全栈开发实战(3):用户系统 —— 注册、登录、JWT 认证与前端集成
实现完整的用户系统:bcrypt 密码加密与验证、JWT Token 签发与验证、注册/登录 API、认证中间件、前端登录/注册页面、Auth Context 全局状态管理。
AI 全栈开发实战(2):技术选型与项目初始化 —— 搭建 KNow 项目骨架与 Docker 环境
从零初始化 KNow 知识库助手项目:Docker Compose 编排 6 个服务(PostgreSQL/Redis/Qdrant/MinIO/后端/前端)、FastAPI 后端骨架搭建、React 前端项目初始化、开发工作流配置。
AI 全栈开发实战(1):产品定义与架构设计 —— 做一个真正的 AI 知识库产品
开启 AI 全栈开发实战系列,从产品定义开始到部署上线。本文完成 KNow 知识库助手的定位、功能规划、技术选型、数据库设计、API 设计和架构决策。
AI 应用开发实战(5):AI Agent —— 工具调用、自主决策、多步循环完整实现
从零构建一个完整的 AI Agent 系统:工具定义与注册机制、Function Calling 实现、Think-Act-Observe 多步循环、错误处理与容错,以及 Agent 与 Chat/RAG 模式的融合。
AI 应用开发实战(4):从零实现 RAG 系统 —— 文档解析、向量检索、知识库问答
从零构建一个完整的 RAG 系统:文档解析与 Chunk 切分策略、Embedding 与向量存储、Query 改写与混合检索、Re-rank 重排序、完整 Pipeline 集成,附可运行的全套代码。
AI 应用开发实战(3):多轮对话进阶 —— 清除历史、注入 System Prompt、上下文截断策略
深入讲解 AI 应用多轮对话的核心技术:对话上下文管理与记忆机制、System Prompt 动态注入策略、Token 窗口截断算法、多轮对话状态保持,以及生产环境中的长对话优化方案。
AI 应用开发实战(2):Prompt 工程实战 —— 从零构建可靠的 Prompt 系统
深入讲解生产级 Prompt 工程的方法论:Prompt 原子组件设计、结构化模板模式、Few-shot 与 CoT 的最佳实践、Prompt 版本管理与 A/B 测试,以及基于 LangChain 的 Prompt Template 实现。
AI 应用开发实战(1):从零搭建你的第一个 AI 应用 —— FastAPI + LLM API 调用完整教程
从项目初始化开始,一步步搭建一个完整的 AI 应用:FastAPI 项目骨架、LLM API 封装、流式响应、前端对话界面,以及生产部署的最佳实践。
Prompt Engineering 系统化指南 —— 从写单条提示词到构建完整 Prompt 系统
系统化讲解 Prompt Engineering 的核心方法论:Prompt 原子组件(角色/指令/上下文/格式)、结构化 Prompt 设计模式、思维链与 Few-shot 的高级用法、Prompt 管理系统架构。
AI 模型部署从入门到生产 —— ONNX 转换、TensorRT 加速、推理服务搭建
完整讲解 AI 模型从训练完成到生产部署的全流程:模型导出与格式转换(ONNX/TensorRT)、推理优化(FP16/INT8 量化)、推理服务框架选型(Triton/vLLM/SGLang)、性能压测与监控。
大模型微调实战指南 —— 从 LoRA 到全参微调,一文搞懂 Fine-tuning
深入讲解大模型微调(Fine-tuning)的完整流程:数据准备与清洗、LoRA/QLoRA 原理与配置、训练参数调优、评估与部署,以及全参微调 vs PEFT 的选型决策。
2026 年 AI Agent 开发踩坑实录 —— 从入门到放弃再到真香
半年 AI Agent 开发实战中遇到的 7 个真实坑,从 Tool Call 循环到上下文爆炸,每一个都是代码换来的教训。
小白也能懂的 RAG 原理 —— 从检索到生成的完整指南
本文用通俗的语言和实例,带你理解 RAG(检索增强生成)的核心原理、主流架构和落地实践,适合 AI 初学者和想要快速了解 RAG 的开发者。