RAG:让模型先查资料再回答(工作流程)

发布时间:2026/7/2 2:17:57
RAG:让模型先查资料再回答(工作流程) 本篇将对RAG的工作流程进行更详细的介绍。离线索引考前整理笔记Step1文档切块—把厚书拆成一页页笔记将长文档切成相互独立又语义完整的短文本块。就像考试前把厚厚的课本拆成一页页便签每张便签只记一个知识点为什么不直接带课本因为太厚了翻起来太慢而且很多内容跟考试无关关键在于平衡切分粒度块太大会引入噪声块太小会丢失上下文实际操作中会结合多种切块方法。Step2文本向量化—给每页笔记贴语义标签切好块之后每一段文本会被转换成一串数字——专业术语叫向量Vector或嵌入Embedding。这串数字可以理解成这段文本的语义标签意思相近的文本标签也相近意思不同的文本标签离很远。Step3建立索引—按标签归档进资料夹所有文本块及对应向量都会存进一个向量数据库并建立索引目录以供后续查询。就像把所有笔记按标签归档进资料夹下次查找时能快速定位。在线查询开卷答题Step4问题向量化—划出题目关键词用户的问题也要用同样的方式转成向量和Step2用的是同一个嵌入模型、同一套标签系统。就像考试时先划出题目的关键词才能拿着关键词去翻笔记并且问题和笔记用的是同一套标签语言才能对上号。Step5语义检索—翻笔记找相关的那几页拿着问题的向量去向量数据库里找语义最接近的文本块最基础的是使用近似最近邻检索ANN核心思想是以牺牲少量精度为代价换取检索速度的指数级提升。检索后返回排名前K个最相似的文本块需要权衡K值的大小K值太小可能遗漏相关块K太大会引入噪声且增加后续重排和模型上下文压力这Top_K个文本块就是要给Ai看的参考资料。就像拿到考题的关键点后翻笔记找到和题目最相关的那几页。Step6回答生成—照着笔记写出答案最后把问题和检索到的资料拼在一起组成一个完整的Prompt发给大模型让Ai依据这些参考资料来回答就像开卷考试时照着笔记写答案比凭空编造靠谱多了。RAG的进阶玩法上面介绍的是最基础的RAG流程实际应用中还有很多优化方向混合检索Hybrid Search不仅用语义向量检索还结合传统的关键词检索两者取长补短。语义检索擅长理解意思关键词检索擅长精确匹配。重排序Reranking在初始召回之后使用一个更强大但计算开销更高的模型对所有候选文档进行一一评分和排序把最相关的排到前面。查询改写Query Rewriting用户的问题有时候表述不清晰利用LLM对用户原始问题进行改写例如补全省略、纠错与规范化、假设性改写等使其更清晰完整。Self-RAG自我反思的RAG让模型自己决定什么时候需要检索、检索回来的内容有没有用、最终回答有没有问题。GraphRAG知识图谱增强检索把资料之间的关系用知识图谱组织起来用图的结构来理解和检索而不是只靠向量相似度。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】