项目负责人质量建设厅官方网站,网站模板 帝国 phpcms,如何建立单页网站,小程序商城开发方案前言
书生浦语大模型应用实战营 第二期正在开营#xff0c;欢迎大家来学习。#xff08;参与链接#xff1a;https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg
第三堂课的视频链接#xff1a;https://www.bilibili.com/video/BV1QA4m1F7t4/
本次笔记是学习完第三堂课…前言
书生·浦语大模型应用实战营 第二期正在开营欢迎大家来学习。参与链接https://mp.weixin.qq.com/s/YYSr3re6IduLJCAh-jgZqg
第三堂课的视频链接https://www.bilibili.com/video/BV1QA4m1F7t4/
本次笔记是学习完第三堂课结合自己关心内容而创作更偏向个人。尽管有很多细节丢失但组织出来的内容仍反映本节课的关键知识、也是我的收获与大家分享。
论述
引出RAG
RAG中文名叫检索生成技术它是怎样一个技术呢 市面上有很多通用大模型
它们神通广大、无所不知有着惊人的能力。但是事情总有我们不如意的时候这些通用大模型可能会在某些垂直领域回答还是不尽人意无法满足我们的业务需求。怎么办
我们可以微调大模型去更新它的网络参数。但面对闭源模型你没办法了。还能怎么办RAG技术就可以解决这样的困境在不改变大模型本身能力的同时能提升它回答的表现这是一种神奇的方法一种外挂知识库的方法。
RAG到底是怎么做到的简单点说就是从直接prompt到给大模型做阅读理解将用户的提问去知识库里匹配相关的信息然后组合在一起再prompt给大模型。实践验证这种方法很好大大提升了相关领域的回答表现。
我们来看RAG技术加持下大模型问答的运行机制是怎样的
RAG技术加持的大模型的运行机制 以上就是大模型问答实质的运行机制。接下来我以开发者的视角来讲解这张图
前面我们已经知道RAG实际是怎么提升回答表现的。作为开发者呢我们首先得去搭建知识库整个开发的过程我们都是再Langchain框架下的在该框架下让我们的开发更容易。
我们收集了大量的文件材料它们有word、有excel、pdf、markdown等等等等。我们首先做的就是对这些文件材料去除格式这里我们就要用到去除文本结构器就是个工具不必焦虑在哪里找它们Langchain为你们提供了。去除了文件的格式我们得到了纯字符串的文本信息。
这一个字符串可能10万个字符我们要对它切割用Langchain提供的文本分割器来实现。
我们得到了文本片段集合然后对这一个个片段进行编码成一个个向量这种形式的信息方便进行相关度比较。于是我们构建起了向量数据库也可以叫做知识库里面都是知识嘛。
这都是开发阶段做的工作。在实际用户提出一个提问/prompt后是怎样个运行机制呢
首先用户的提问也要进行编码成向量为了可以与向量数据库的信息检索匹配嘛。
然后从向量数据库里检索出了相关的向量信息。直接将向量输入到大模型我们做不了。那是要解码吗也不是实际上无论是prompt向量还是知识库里的向量在编码的时候都是建立了与自然语言文本一一对应的关系的。我们直接凭借着这个对应关系找到对应的自然语言文本拼接在一起就行了。
然后就是喂给大模型图中展示的是Internlm大模型。最后我们就得到了回答了。以上就是理论上RAG下的大模型问答的运行机制。 ———————— 以上就是我本篇想讲的所有内容了如果这篇文章对你有价值的话还请点个赞你的支持对我非常重要
我是阿航一位胆大包天、梦想成为大牛的学生~
我们下篇文章接着聊