当前位置：首页 > news >正文

网站建设项目文档想找人做网站和app

news 2025/12/19 9:00:57

网站建设项目文档,想找人做网站和app,怎么接游戏推广的业务,国内特效比漂亮的网站目录一、技术演进图谱说明二、RAG 技术概述 #xff08;一#xff09;核心思想说明 #xff08;二#xff09;RAG 发展路径与研究范式三、Naive RAG#xff1a;最基础的检索增强生成范式 #xff08;一#xff09;Naive RAG 的标准流程 1. 索引#xff08;In…目录一、技术演进图谱说明二、RAG 技术概述一核心思想说明二RAG 发展路径与研究范式三、Naive RAG最基础的检索增强生成范式一Naive RAG 的标准流程 1. 索引Indexing 2. 检索Retrieval 3. 生成Generation 二Naive RAG 的问题与挑战 1. 检索阶段的问题 2. 生成阶段的问题 3. 增强整合的难点三思考四、Advanced RAG应对基础范式局限的智能增强一概念与特征二Advanced RAG 定位三典型优势与改进方向五、Modular RAG从“方法”向“平台”级演进一核心理念与特点二Modular RAG 结构布局三实际优势与应用价值四三阶段 RAG 模型对比表六、 RAG vs Fine-tuning两种提升 LLM 能力的对比分析一方法概述二举例说明 1. 适合 RAG 的场景 2. 适合微调的场景三⚖️ 组合使用互为补充的策略四✅ 总结建议七、总结与趋势展望干货分享感谢您的阅读随着大语言模型LLM在自然语言处理任务中表现出惊人的能力基于 LLM 构建的智能问答系统、对话机器人、搜索引擎等应用迅速兴起。然而在实际场景中用户提出的问题往往涉及最新知识、专业文档或个性化上下文这些信息可能并未出现在模型的预训练语料中从而导致模型生成结果出现“幻觉”或过时内容严重影响可用性与可信度。面对这一关键痛点Retrieval-Augmented GenerationRAG 被提出试图将信息检索与语言生成相结合先基于用户查询检索相关文档再将其与原始问题一同输入语言模型生成答案。RAG 不仅显著降低了幻觉率还具备知识可更新、输出可追溯等优势成为行业探索 LLM 实用化路径的重要方向。随着技术演进RAG 从最初的 Naive RAG朴素式检索增强逐步演变出更复杂的架构如 Advanced RAG增强模块协同与 Modular RAG平台化组件解耦。每一阶段的演进都是对模型幻觉、检索能力、上下文融合质量等问题的深度回应也体现了从原型验证向工业级落地架构的转变。本文将系统梳理 RAG 的三大演进阶段剖析其核心思想、技术架构与实践挑战并通过图示与对比帮助读者全面理解 RAG 技术的发展脉络与未来趋势。一、技术演进图谱说明如下 RAG 技术树Technology Tree图其概括了 RAG 的发展路径初期阶段以 Transformer 结构为基础主要是在预训练模型PTM中尝试引入外部知识但手段较为简单。中期阶段ChatGPT 出现后RAG 技术开始强调如何在推理过程中为 LLM 提供更有效的外部信息支持开始大规模应用。近期趋势研究逐渐扩展至在语言模型的微调阶段fine-tuning和预训练阶段pre-training引入检索机制追求更高程度的知识融合和生成效果提升。这张技术树不仅展示了 RAG 的发展历程还从三个关键阶段预训练、微调、推理展现了技术的演进轨迹。二、RAG 技术概述一核心思想说明 RAGRetrieval-Augmented Generation技术的核心思想是通过引入外部知识库的信息帮助大语言模型LLM回答其训练数据中未涉及的问题尤其是在处理实时性强或专业性高的查询时弥补其知识盲区。我们可以用一个具体例子来说明 RAG 的作用假设用户向 ChatGPT 询问某条最近的新闻由于 ChatGPT 本身的知识仅限于其训练数据它无法获知最新进展。这时RAG 机制就介入通过检索当前的相关新闻文章将相关内容作为上下文和用户的问题一起输入给大模型从而使其生成出更全面、更准确的回答。二RAG 发展路径与研究范式 RAG 研究的发展经历了三个主要阶段 Naive RAG初代 RAG最基础的实现方式通常只在模型推理阶段加入检索模块直接将检索到的文档拼接到输入中。这种方式实现简单、成本较低但在效果和稳定性方面存在明显短板。 Advanced RAG增强型 RAG为克服初代 RAG 的局限性研究者开始在多个方面进行改进比如更智能的检索策略、更高质量的文本选择机制甚至对生成阶段进行适配优化提升整体效果。 Modular RAG模块化 RAG发展到这一阶段RAG 被设计为更加可组合、可配置的系统各个模块如检索器、过滤器、重排序器、生成器之间协同工作允许更灵活地适配不同任务需求并提升系统的可解释性和扩展性。尽管 RAG 技术相较于单纯的 LLM 能力有显著提升也更加高效但每种范式在实际应用中也面临不同的挑战。因此后续的发展不断在追求更强性能的同时也在探索更优架构与使用方式。三、Naive RAG最基础的检索增强生成范式 Naive RAG 是最早期、最直接的一种 RAG 实现方式它随着 ChatGPT 等大语言模型的大规模应用而迅速流行起来。该范式的核心流程可以用“检索—阅读Retrieve-Read”框架来概括整个过程分为三个主要阶段索引、检索、生成其代表性流程如图 2所示一Naive RAG 的标准流程图中展示了 RAG 在问答场景中的典型应用流程主要包括以下三个步骤 1. 索引Indexing 首先对原始资料如 PDF、HTML、Word、Markdown 等进行解析和清洗。将内容统一转为纯文本后根据语言模型的上下文长度限制进行切分chunking形成若干段落块。每个段落块被转化为向量embedding并存储到向量数据库中为后续的语义检索做准备。 2. 检索Retrieval 用户输入查询问题后系统使用与索引阶段相同的向量编码器将问题转换为向量表示。通过计算问题向量与数据库中段落块向量之间的语义相似度选出前 K 个最相关的文本块。这些检索结果将作为扩展上下文用于辅助回答问题。 3. 生成Generation 将用户问题与检索到的段落内容拼接成一个完整提示词prompt输入大语言模型进行回答生成。生成阶段的表现会因具体任务设定而异有些情况下模型会综合使用自身知识与检索信息有时则会限制只使用提供的文本。若是多轮对话还可将历史对话上下文一并加入以保持交互的连贯性。二Naive RAG 的问题与挑战尽管 Naive RAG 实现简单、成本较低并能在一定程度上提升大模型的回答准确性但在实际应用中也暴露出不少问题 1. 检索阶段的问题召回不足可能遗漏关键信息导致生成阶段缺乏有效依据。误召回检索到不相关或干扰性段落影响回答质量。向量表示过于粗糙不能充分捕捉上下文语义影响精度。 2. 生成阶段的问题幻觉现象Hallucination模型可能生成与检索内容不符的信息产生虚假回答。回答偏离主题当上下文不够相关时输出容易跑题或失焦。内容不当或偏见可能带有不合适的表达降低可信度。 3. 增强整合的难点冗余不同来源段落含义重复生成内容出现重复表达。风格不一致不同片段之间写作风格、语气差异大生成结果不够连贯。信息整合困难模型难以有效判断哪些段落更重要或如何将多个片段有效融合。简单拼接缺乏加工生成模型有时过度依赖检索内容结果变成对原文的“复制粘贴”缺少进一步加工和总结。此外在复杂任务中一次基于原始问题的检索可能无法覆盖所有关键信息需要多轮迭代才能获取足够上下文。这也暴露出 Naive RAG 在应对复杂场景时的局限性。三思考 Naive RAG 是构建 RAG 系统的基础形态其“索引-检索-生成”三步流程为后续的高级和模块化 RAG 提供了原型框架。然而随着对生成质量、稳定性和适配性的要求提升它的诸多不足也促使研究者进一步探索更智能的改进方案。接下来的 Advanced RAG 和 Modular RAG正是在解决 Naive RAG 局限性的基础上演化而来的。四、Advanced RAG应对基础范式局限的智能增强 Advanced RAG 是在 Naive RAG 的基础上发展而来的一种更智能、结构更优化的检索增强生成方式。其提出的初衷就是为了解决 Naive RAG 在检索精度、生成质量以及信息整合等方面存在的多项不足。相比于简单的“Retrieve-Read”框架Advanced RAG 更注重提升系统对查询意图的理解、多轮检索策略的设计以及上下文融合的能力目标是构建更稳健、更准确、更具实用性的 RAG 流程。一概念与特征 Advanced RAG 引入了多个关键增强机制使得模型能够更主动地适配复杂任务场景。相较于传统的“Retrieve-Read”流程它在以下方面实现了进化查询重写Query Reformulation用户初始问题可能存在歧义或信息不足Advanced RAG 会利用语言模型对原始查询进行优化重写提升检索精度。多轮检索Multi-stage Retrieval不再满足于单次 Top-K 相似度匹配系统支持级联检索、重排序、跨步补全等方式多角度提取相关信息。上下文融合Context Fusion在生成阶段引入信息整合模块对多个检索片段进行聚合、去重、权重评估等处理保障生成内容结构清晰、内容不冗余。动态控制生成行为Response Control根据不同任务目标模型可设定只依赖检索信息、结合模型内知识或引入对话上下文进行多轮响应。二Advanced RAG 定位从图中可以看出Advanced RAG 相较 Naive RAG 拓展出了更多模块交互路径体现其处理流程的复杂度与灵活性多个模块如 Query Reformulator、Retriever、Context Selector之间建立了非线性连接与反馈路径图中清晰标示了从单轮检索向多阶段协同增强结构的演化趋势Advanced RAG 模块密度增多代表功能能力增强推动整体问答效果从“依赖检索结果”向“融合多源上下文与语言模型知识”过渡。该阶段的核心目标是通过结构增强与控制能力提升信息检索与生成过程的精度、稳定性与适应性。三典型优势与改进方向类别Naive RAGAdvanced RAG 的改进检索精度单轮粗粒度匹配引入查询重写多轮检索机制上下文结构简单拼接融合聚合、去重、重要性排序响应内容易产生幻觉与冗余强化事实对齐与生成控制能力多轮对话支持弱可整合历史上下文支持多轮通过上述优化Advanced RAG 在搜索增强问答系统中显著提升了可用性与实用性逐渐成为企业级落地的首选方案。五、Modular RAG从“方法”向“平台”级演进随着 RAG 技术在真实应用场景中的逐渐落地系统对可扩展性、可维护性、任务适配能力等提出了更高要求。这一背景下Modular RAG模块化 RAG 作为 RAG 研究范式的最新阶段应运而生。它不仅延续了 Advanced RAG 的多轮增强思路还进一步将各个组件进行解耦与模块化实现更高的灵活性、可控性与可组合性。一核心理念与特点 Modular RAG 的主要思想是将传统 RAG 系统中紧耦合的流程重构为若干独立、可插拔的模块Module每个模块专注完成特定任务如查询生成、检索排序、文档聚合、响应风格控制等。模块之间通过统一的接口协议协同工作从而形成高度可配置与适配的生成系统。其显著特点包括结构解耦各环节如 Query Reformulation、Retriever、Ranker、Fusion、Response Generator均可独立部署、训练、优化适配不同需求。任务定制化能力强开发者可以按需组合模块打造适用于摘要生成、问答、对话等不同任务的专属 RAG 流程。可观测与可调试性好每个模块输入输出清晰、便于可视化追踪有利于调优与问题定位。支持多模型协同不同模块可调用不同类型的语言模型、检索器或评估器实现多模型融合、增强系统鲁棒性。这种模块化架构类似于搭建“乐高式”生成系统让开发者能够灵活构建和调度最适合当前场景的 RAG 流程。二Modular RAG 结构布局 Modular RAG 作为演化终点展现了最复杂、最灵活的结构布局图中体现了各模块之间的高度并行、交错连接打破了原有串行线性流程除了基础的 Indexer、Retriever、Generator 外还引入了 Query Optimizer、Selector、Fusion、Evaluator 等多个中间环节整体呈现出一个可扩展的 DAG有向无环图结构表明模块之间既有主流程连接也支持分支协同与并行优化模块之间的边界清晰可实现动态路由与任务切换体现了系统的可组合性与智能调度能力。图示反映出 Modular RAG 不再是单一流程上的“增强”而是具备全局架构设计与调度能力的“生成框架”。三实际优势与应用价值维度Advanced RAGModular RAG 的提升系统结构增强但仍是串行结构完全模块化解耦支持 DAG 式组合任务泛化能力适配部分场景适用于任意复杂问答 / 对话 / 摘要训练与调试部分模块可单独训练支持模块级迭代、快速调优多模态支持初步探索模块级扩展支持图文多模态任务商业部署中等复杂度高灵活性易部署易维护 Modular RAG 的提出标志着 RAG 从“方法”向“平台”级演进。它不仅提升了信息检索增强生成系统的性能更为构建通用智能助理、企业级问答引擎、多模态 AI 系统打下了坚实的架构基础。四三阶段 RAG 模型对比表对比维度Naive RAGAdvanced RAGModular RAG架构形式简单线性流程检索 → 生成增强型流水线多轮检索 rerank 融合模块解耦结构DAG 式自由组合关键模块Indexer、Retriever、Generator加入 Query Reformulation、Reranker、Fusion 等增强组件每个子任务独立模块化如 Selector、Evaluator、Prompt Optimizer 等查询处理能力原始 Query 单轮检索多轮 Query 优化与重写支持多路径、多策略并行检索与融合检索增强方式Top-k 相似度排序语义优化、重排序、动态融合自定义检索策略与模块组合灵活调度多模检索器生成效果控制靠 LLM 内部机制提供更多上下文辅助生成可引入控制模块限制风格、格式、可信度优势简洁、高效、易部署性能显著提升、适配复杂任务灵活可控、高扩展性、便于调试和演进局限性易检索错漏、幻觉严重多组件协同复杂调优成本上升架构设计复杂、初始投入高适用场景简单问答、静态文档检索多轮问答、企业搜索引擎需要强适配性和可维护性的复杂应用如多语言、多模态问答系统图示特征图3三步直线流程多组件串联增强流程模块化分支结构模块间连接灵活六、 RAG vs Fine-tuning两种提升 LLM 能力的对比分析在增强大型语言模型LLMs知识覆盖与任务适应性的实践中Retrieval-Augmented GenerationRAG 和 Fine-tuning微调是两种主流手段。它们虽然目标相似但方法截然不同各有优势和适配场景。一方法概述对比维度RAG检索增强生成Fine-tuning微调核心思路在生成前动态检索外部知识实时构造上下文输入在训练阶段通过监督学习调整模型内部参数数据来源外部知识库、数据库、网页、文档等精选标注数据集需涵盖目标任务知识模型调整方式模型结构不变知识更新靠检索数据更新模型结构内部权重调整知识更新快速、灵活更新数据即可缓慢需重新训练和部署适配任务类型长尾知识、时效性强、变化频繁的任务高精度、重复性强的特定任务成本与效率成本低迭代快成本高需GPU资源训练周期长可解释性高可追踪检索内容低参数黑箱难以定位生成依据偏差风险取决于检索数据质量容易继承训练数据的偏差或标注误差二举例说明 1. 适合 RAG 的场景问答系统需实时访问最新新闻资讯企业内部知识库接入如员工手册、合规文档多模态/多源数据集成如图文、网页、PDF 混合输入。 2. 适合微调的场景客服机器人固定应答风格法律合同自动分析器医疗诊断报告生成器。三⚖️ 组合使用互为补充的策略 RAG 和微调并非非此即彼。许多系统采用先微调后 RAG 或 RAGLoRA 微调融合方案实现效果和效率的双赢。例如对 LLM 做轻量微调如 LoRA强化任务能力再通过 RAG 动态接入更新文档或异构数据源输出结果既有上下文精度又具备最新知识支持。四✅ 总结建议应用场景优先策略快速接入、频繁更新、实时回答✅ 使用 RAG特定格式要求、精准分类、风格控制✅ 使用 Fine-tuning有一定模板但内容依赖实时数据✅ 结合两者使用七、总结与趋势展望回顾 RAG 技术的发展路径我们可以看到其从早期的 Naive RAG 到 Advanced RAG再到 Modular RAG经历了从轻量集成到智能增强、再到模块平台化的逐步演进。 Naive RAG 适合中小型项目快速试验优势是实现简单缺点是检索与生成能力有限Advanced RAG 更适合对生成质量和用户交互要求较高的场景通过增强结构提高生成效果Modular RAG 则为大规模、长期维护的系统提供了解耦架构具备更强的适配性与工业可用性。未来随着多模态信息融合、Agent 规划与知识图谱集成等方向的发展RAG 有望成为通用智能系统中不可或缺的组件。八、参考文献与延伸阅读References Further Reading Lewis, P. et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems (NeurIPS), vol. 33, pp. 9459–9474. 原始论文链接 Borgeaud, S. et al. (2022). Improving Language Models by Retrieving from Trillions of Tokens. International Conference on Machine Learning (ICML), PMLR. 论文地址 Arora, D. et al. (2023). GAR-Meets-RAG: A Paradigm for Zero-Shot Information Retrieval. arXiv preprint arXiv:2310.20158. arXiv 链接 Gao, Y. et al. (2023). Retrieval-Augmented Generation for Large Language Models: A Survey. Shanghai Research Institute for Intelligent Autonomous Systems Fudan University. 论文概览 Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback (InstructGPT). NeurIPS, vol. 35, pp. 27730–27744. arXiv 链接 Ma, X. et al. (2023). Query Rewriting for Retrieval-Augmented Large Language Models. arXiv preprint arXiv:2305.14283. arXiv 链接 Ilin, I. (2023). Advanced RAG Techniques: An Illustrated Overview. 在线文章 Izacard, G. Grave, E. (2021). Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering. arXiv preprint arXiv:2007.01282. 论文链接 Shi, P. et al. (2023). RAGAS: Evaluation of RAG Systems Using Factuality and Groundedness. GitHub arXiv Ram, O. et al. (2023). Modular RAG: Flexible and Interpretable Retrieval-Augmented Generation Systems. arXiv

查看全文

http://www.w-s-a.com/news/922446/