当前位置: 首页 > news >正文

网站建设你懂的wordpress 添加商品

网站建设你懂的,wordpress 添加商品,如何给网站添加外链,天津制作企业网站的前言#xff1a;vllm是一个大语言模型高速推理框架#xff0c;旨在提高大模型的服务效率。优势是内存管理#xff0c;实现的核心是pageattetion算法。仅在gpu上加速#xff0c;不在cpu加速。 目录 1. PageAttention2. 实践2.1 安装2.2 离线推理2.3 适配OpenAI的api 1. Page… 前言vllm是一个大语言模型高速推理框架旨在提高大模型的服务效率。优势是内存管理实现的核心是pageattetion算法。仅在gpu上加速不在cpu加速。 目录 1. PageAttention2. 实践2.1 安装2.2 离线推理2.3 适配OpenAI的api 1. PageAttention 核心思想将每个序列的KV cache键值缓存分块处理每块包含固定数量的token。灵感来源操作系统中的虚拟内存和分页管理技术旨在动态地为请求分配KV cache显存提升显存利用率评估结果vLLM可以将常用的LLM吞吐量提高了2-4倍 2. 实践 2.1 安装 pip install vllm2.2 离线推理 示例一 from vllm import llmllm LLM(facebook/opt-13b, tensor_parallel_size4) output llm.generate(San Franciso is a)示例二 from transformers import AutoTokenizer from vllm import LLM, SamplingParams# Initialize the tokenizer tokenizer AutoTokenizer.from_pretrained(/data/weisx/model/Qwen1.5-4B-Chat)# Pass the default decoding hyperparameters of Qwen1.5-4B-Chat # max_tokens is for the maximum length for generation. sampling_params SamplingParams(temperature0.7, top_p0.8, repetition_penalty1.05, max_tokens512)# Input the model name or path. Can be GPTQ or AWQ models. llm LLM(modelQwen/l/Qwen1.5-4B-Chat, trust_remote_codeTrue)# Prepare your prompts prompt Tell me something about large language models. messages [{role: system, content: You are a helpful assistant.},{role: user, content: prompt} ] text tokenizer.apply_chat_template(messages,tokenizeFalse,add_generation_promptTrue )# generate outputs outputs llm.generate([text], sampling_params)# Print the outputs. for output in outputs:prompt output.promptgenerated_text output.outputs[0].textprint(fPrompt: {prompt!r}, Generated text: {generated_text!r})SamplingParams在VLLM模型中主要负责调整采样过程。采样是在模型生成文本或其他类型输出时的一个关键步骤它决定了模型如何从可能的输出中选择一个。LLM的参数model是模型名还可以输入其他大语言模型但要注意不是所有的llm都被vllm支持。message中定义了系统的角色内容以及用户的角色内容 2.3 适配OpenAI的api a. 命令行输入 python -m vllm.entrypoints.openai.api_server --model your_model_path --trust-remote-code默认监听 8000 端口–host 和–port 参数可以指定主机和端口。 b. 使用curl与Qwen对接(命令行) curl http://localhost:8000/generate \-d {prompt: San Francisco is a,use_beam_search: true,n: 4,temperature: 0}http://localhost:8000/generate是访问的http地址也就是客户端地址-d后面跟的是参数可以根据需求配置不同的参数 c. 使用python和Qwen对接 from openai import OpenAI # Set OpenAIs API key and API base to use vLLMs API server. openai_api_key EMPTY openai_api_base http://localhost:8000/v1client OpenAI(api_keyopenai_api_key,base_urlopenai_api_base, )chat_response client.chat.completions.create(modelQwen/Qwen1.5-4B-Chat,messages[{role: system, content: You are a helpful assistant.},{role: user, content: Tell me something about large language models.},] ) print(Chat response:, chat_response)
http://www.w-s-a.com/news/135701/

相关文章:

  • 网站单页品牌网站建设 蝌蚪5小
  • 怎么做外贸网站需注意哪些做电脑系统的网站
  • 网站建设介绍推广用语河南网站优化外包服务
  • 课程网站模板贵州省城乡与建设厅网站
  • 网站模板及源码谁家网站用户体验做的好
  • 做网站的技术要求搜索栏在wordpress菜单上位置
  • 如何给网站弄ftpwordpress怎么添加关键词描述
  • 成都工程建设信息网站金科网站建设
  • 传媒公司 网站开发厦门网站建设门户
  • 宿城区建设局网站做网站的绿色背景图
  • 网站空间托管合同 .doc网站开发团队 组建
  • 网站建设书本信息it运维服务
  • 四核网站建设设计网站流程
  • ui设计网站设计与网页制作视频教程wordpress插件漏洞利用
  • 网站建设公司排名前十做网站的最终目的
  • 选择网站开发公司的标准中国网站建设市场规模
  • 衣服网站建设策划书广州住房和城乡建设部网站
  • 微商城科技淄博网站建设优化seo
  • 杭州 网站设计制作东圃手机网站开发
  • 网站文章页内链结构不好可以改吗微信平台如何开发
  • 炫酷业务网站课程网站如何建设方案
  • 网站建设服务器可以租吗wordpress微信打赏
  • 网站制作的重要流程图大连网站优化快速排名
  • 河南省住房建设厅官方网站注册公司邮箱需要什么
  • 美橙网站注册华为手机网站建设策划方案论文
  • 河南省和建设厅网站首页在线图片翻译
  • 关于备案空壳网站清理通知去别人网站挂黑链
  • 做网站待遇世界购物平台排行榜
  • 售后服务网站什么网站免费做简历模板
  • 网站模板怎么修改成都网站优化seo