当前位置: 首页 > news >正文

网站制作报价维持地建网络手工品外贸出口网站建设方案

网站制作报价维持地建网络,手工品外贸出口网站建设方案,网站诊断博客,周口网站建设多少钱目录 prompt 工程是什么#xff1f; 案例 vllm 推理加速框架 prompt 工程是什么#xff1f; prompt#xff1a;提示词#xff0c;也就是我们使用网页版输入给大模型的内容就叫 prompt#xff0c;那什么是 prompt 工程呢#xff1f; 简单理解其实就是利用编写的 prom…目录 prompt 工程是什么 案例 vllm 推理加速框架 prompt 工程是什么 prompt提示词也就是我们使用网页版输入给大模型的内容就叫 prompt那什么是 prompt 工程呢 简单理解其实就是利用编写的 prompt 去让大模型完成我们想要完成的任务一般网页版本的都是多轮对话通过多轮对话完成想要实现的事情也是一种 prompt 的使用 另外一种是在实际业务中的使用实际业务中到底怎么使用 prompt 呢 prompt 工程 prompt 算法这里的算法并不是指什么高升算法是指通过编程解析大模型的输出以及结合一些工具预处理文本这方面的编程代码。 prompt 入门门槛我觉得比较低网上随便找资料大概都知道编写模版套路但效果得结合实际业务情况调优好几天有些还得通过编程进行辅助比如预处理工具提取地名啥的匹配标签啥的再去输入给大模型。 总结来说入门低但要想在业务中用好也没那么容易。 案例 我找了一个案例来说明下完整的 prompt 工程到底是在干啥 模型qwen-7b-chat 显存24G 数据专业描述的文本还有对应的 label 任务通过编写 prompt 传入专业列表让大模型去判断是哪个专业 评判标准其实就是文本分类任务已经有数据标注了让大模型预测出来后计算准确率就可以评判效果好不好 数据链接https://pan.baidu.com/s/1EvvNSWb9RXQm4TqHeg52fA  提取码2jh3  链接https://pan.baidu.com/s/1fdNsI35eiQAPsiIDeaTsAQ  提取码6mem  直接给代码 import pandas as pd from transformers import AutoModelForCausalLM, AutoTokenizer from transformers.generation import GenerationConfig import time# 加载词表模型配置 tokenizer AutoTokenizer.from_pretrained(/root/autodl-tmp,trust_remote_codeTrue) model AutoModelForCausalLM.from_pretrained(/root/autodl-tmp,device_mapauto,trust_remote_codeTrue).eval() model.generation_config GenerationConfig.from_pretrained(/root/autodl-tmp,trust_remote_codeTrue,temperature0.6) # 可指定不同的生成长度、top_p等相关超参def prompt_predit(content, labels):prompt 预测 content 属于哪个类别prompt f【学科分类解析】 角色设定 作为一名资深学者对各个专业有着深入的了解擅长通过描述精准判断出是哪一个专业你的任务是从给定的专业列表中找出与描述最相关的10个专业。已知条件 [描述]: {content} [专业列表]: {labels} 决策规则 1. 专业必须来源于[专业列表]列表 2. 描述中的专业名词是否指向特定的专业例如“数据库》计算机科学与技术”; 3. 从描述中抽取出关键专业术语对比[专业列表]内的专业名称及其涵盖范围寻找紧密相关的匹配项。要求 - 请直接输出专业无需解释说明 - 不得拒绝回答 - 当描述中明确指向某个特定专业时优先选择该专业 - 若描述较为模糊或包含多个专业元素需根据专业知识和经验作出最佳推断。输出格式严格按照列表格式输出 [专业1, 专业2, 专业3......] response, history model.chat(tokenizer, prompt, historyNone)return response.replace(\n, ).replace( , )if __name__ __main__:data pd.read_csv(../output/classfield_data.csv)data data.head(100)with open(../data/分类提取/labels_all.txt, r, encodingutf8) as f:labels f.readlines()res []start_time time.time()for index, row in data.iterrows():content row[content]label row[label]print(f---------- {index 1} / {len(data)} -----------)print(f当前 content{content} 正确 label{label})try:response prompt_predit(content, labels)except Exception as e:response str(e)print(f解析错误, response)print(f预测结果, , response)res.append(response)data[llm_res] res# data[correct] (data[llm_res] data[label])data[correct] data.apply(lambda row: True if row[label] in row[llm_res] else False, axis1)print(f预测正确率, round(sum(data[correct]) / len(data) * 100, 2))data.to_excel(../output/classfield_data_predit.xlsx, indexFalse)end_time time.time()print(f用时{end_time - start_time})这是最简单可以说明什么是 prompt 工程的案例下面来讲一下思路。 1、加载模型 2、读入要处理的数据 3、把要传递给大模型的数据拿出来contentlabels 4、调用大模型prompt 编写好再去调用 5、如果需要需要单独编写解析大模型返回的解析结果 6、最后保存所有结果 以上就是 prompt 工程整体流程可以看出流程还是挺简单的但想要想过真的没那么容易有几方面 1、不同模型想通 prompt 效果不一样 2、不同词语描述效果也不一样 3、哪怕改一个字效果也会不一样 所以 prompt 要说什么技巧套路我觉得有点扯淡基本模版的技巧大家看了都会但想要效果好得不停地调。 而且评判的数据挺重要的就像我这个需求应该是分类任务对吧那结果应该有一个对就对不对就不对我调了几版 prompt 最好的准确率是 39%就去数据及理由有些数据光是人去判断都不太好判断或是有歧义的更别说模型了例如 content20012014年对青海省主要水体中外来鱼类组成、分布和生态习性进行了系统调查。野外调查采集到外来鱼类30种隶属6目12科25属已建群外来鱼类16种。其中黄河水系拥有的外来鱼类最多共26种长江上游有4种为该河段首次记录可鲁克湖12种是内陆水体中外来鱼类最多的水域。结合历史文献记录截至2013年全省记录外来鱼类7目13科31属36种已远超土著鱼类物种数(50种和亚种)的一半。调查分析发现外来鱼类呈现数量持续增多、分布范围向高海拔扩张的趋势。已建群外来鱼类主要是分布于我国东部平原地区的广布型物种。虹鳟( Oncorhynchus myskiss)是代表性外来种现已在黄河上游干流部分河段形成自然繁殖群体其食物组成包括水生无脊椎动物和高原鳅等土著鱼类。建立水产种质资源保护区和开展外来鱼类影响研究是防控高原地区外来鱼类的必要措施。 正确 label地理学 这段文本大家可以看看觉得他是在描述什么专业我看了后觉得跟水产有关大模型预测结果也是水产 预测结果 [水产|根据描述中提到的“外来鱼类”、“黄河水系拥有最多外来鱼类”、“已在黄河上游干流部分河段形成自然繁殖群体”等内容可以推断出描述涉及的是水产专业。] 再去看数据标注的答案摸不着头脑可能从描述看最相关的水产其次再是地理学之类的 所以我改了 prompt 选出10 个专业只要 label 再里面就算对准确率直接就 67 了。 所以标注的数据也挺重要的。 vllm 推理加速框架 上面我们通过一个最基本的案例明白了什么是 prompt 工程现在来看一个框架 vllm 是推理加速用的意思就是说加速模型生成的速度。 把上面的代码改为 vllm 框架改用批次最大化利用 gpu 效率利用 1000 条来测试一下速度有多少提升 from vllm import LLM, SamplingParams import os import time import pandas as pdos.environ[CUDA_VISIBLE_DEVICES] 0 model_path /root/autodl-tmp llm LLM(modelmodel_path, trust_remote_codeTrue, tokenizermodel_path, tokenizer_modeslow, tensor_parallel_size1) sampling_params SamplingParams(temperature0.8, top_p0.95)def batch_prompt(cur_batch_data):prompts []for index, row in cur_batch_data.iterrows():content row[content]prompt f【学科分类解析】 角色设定 作为一名资深学者对各个专业有着深入的了解擅长通过描述精准判断出是哪一个专业你的任务是从给定的专业列表中找出与描述最相关的个专业。已知条件 [描述]: {content} [专业列表]: {labels} 决策规则 1. 专业必须来源于[专业列表]列表 2. 描述中的专业名词是否指向特定的专业例如“数据库》计算机科学与技术”; 3. 从描述中抽取出关键专业术语对比[专业列表]内的专业名称及其涵盖范围寻找紧密相关的匹配项。要求 - 请直接输出专业无需解释说明 - 不得拒绝回答 - 当描述中明确指向某个特定专业时优先选择该专业 - 若描述较为模糊或包含多个专业元素需根据专业知识和经验作出最佳推断。输出 [专业] prompts.append(prompt)return promptsif __name__ __main__:data pd.read_csv(../output/classfield_data.csv)data data.head(1000)with open(../data/分类提取/labels_all.txt, r, encodingutf8) as f:labels f.readlines()global_time 0batch_size 32res []for i in range(0, len(data), batch_size):cur_start_time time.time()cur_batch_data data[i:i batch_size]cur_batch_prompt batch_prompt(cur_batch_data)outputs llm.generate(cur_batch_prompt, sampling_params)for output in outputs:prompt output.promptgenerated_text output.outputs[0].textres.append(generated_text)cur_end_time time.time()global_time cur_end_time - cur_start_timeprint(f当前批次用时 {cur_end_time - cur_start_time} 目前已使用使用时间 {global_time} 进度 {i batch_size})data[llm_res] res# data[correct] (data[llm_res] data[label])data[correct] data.apply(lambda row: True if row[label] in row[llm_res] else False, axis1)print(f预测正确率, round(sum(data[correct]) / len(data) * 100, 2))data.to_excel(../output/classfield_data_predit.xlsx, indexFalse)print(f总用时{global_time})vllm 用时 之前的代码用时 可以看出真的能像网上说的那样提速 2 倍左右但准确率下降了我把输出打印出来看发现是输出内容没有按照之前的来了说明 vllm 会对输出有影响。
http://www.w-s-a.com/news/456432/

相关文章:

  • 工信部网站备案文件好网站建设公司地址
  • 怎么做app和网站购物网站单页面怎么做的
  • 西宁专业做网站教育网站建设策划书
  • 个人网站域名怎么起网站建设业务好跑吗
  • 网页设计的网网页设计的网站企业网站怎样做优化
  • 论文中小企业的网站建设域名网站空间
  • 宿迁网站建设联系电话现在出入邯郸最新规定
  • 男女做羞羞的事情网站30岁转行做网站编辑
  • 做企业网站的轻量级cmswordpress 越来越慢
  • 无锡中英文网站建设莱芜网络公司
  • ps软件下载官方网站相关搜索优化软件
  • 世界杯网站源码下载做网站推广代理
  • 用股票代码做网站的wordpress通过标签调用文章
  • iis添加网站ip地址树莓派运行wordpress
  • 网站空间域名多少钱宿迁做网站公司
  • 福州建设企业网站网站交互主要做什么的
  • 英文网站建设方法门户网站特点
  • 腾讯云备案 网站名称萧山城市建设网站
  • 漳浦网站建设网络营销推广策略
  • 龙岗商城网站建设教程百度关键词排名突然没了
  • 深圳网站建设服务哪家有织梦网站模板安装
  • 网站设计与网页制作代码大全网站开发还找到工作吗
  • 给设计网站做图会字体侵权吗站长工具seo综合查询张家界新娘
  • 网站的建设与颜色搭配win7在iis中新建一个网站
  • 单位做网站有哪些功能型类的网站
  • 网站怎样做优惠卷移动互联网开发培训
  • 重庆网站建设帝维科技网站做定向的作用
  • 网站建设工作室wp主题模板做污事网站
  • 网站建设 深圳 凡科重庆家居网站制作公司
  • 自己也可以免费轻松创建一个网站企业收录网站有什么用