当前位置: 首页 > news >正文

长沙高端网站建设服务器wordpress文章管理模板

长沙高端网站建设服务器,wordpress文章管理模板,二级建造师证件查询,做散客机票的网站如何推广大模型-ChatGLM2-6B模型部署与微调记录 模型权重下载#xff1a; 登录魔塔社区#xff1a;https://modelscope.cn/models/ZhipuAI/chatglm2-6b 拷贝以下代码执行后#xff0c;便可快速权重下载到本地 # 备注#xff1a;最新模型版本要求modelscope 1.9.0 # pip insta… 大模型-ChatGLM2-6B模型部署与微调记录 模型权重下载 登录魔塔社区https://modelscope.cn/models/ZhipuAI/chatglm2-6b 拷贝以下代码执行后便可快速权重下载到本地 # 备注最新模型版本要求modelscope 1.9.0 # pip install modelscope -U from modelscope.utils.constant import Tasks from modelscope import Model from modelscope.pipelines import pipeline model Model.from_pretrained(ZhipuAI/chatglm2-6b, device_mapauto, revisionv1.0.12) pipe pipeline(taskTasks.chat, modelmodel) inputs {text:你好, history: []} result pipe(inputs) inputs {text:介绍下清华大学, history: result[history]} result pipe(inputs) print(result) 运行微调除 ChatGLM2-6B 的依赖之外还需要安装以下依赖 pip install rouge_chinese nltk jieba datasets 下载数据集 ADGEN 数据集任务为根据输入content生成一段广告词summary。 {content: 类型#上衣*版型#宽松*版型#显瘦*图案#线条*衣样式#衬衫*衣袖型#泡泡袖*衣款式#抽绳,summary: 这件衬衫的款式非常的宽松利落的线条可以很好的隐藏身材上的小缺点穿在身上有着很好的显瘦效果。领口装饰了一个可爱的抽绳漂亮的绳结展现出了十足的个性配合时尚的泡泡袖型尽显女性甜美可爱的气息。 } 参数解释 PRE_SEQ_LEN128 LR2e-2 NUM_GPUS2 torchrun --standalone --nnodes1 --nproc-per-node$NUM_GPUS main.py \--do_train \--train_file /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/AdvertiseGen/train.json \--validation_file /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/AdvertiseGen/dev.json \--preprocessing_num_workers 10 \--prompt_column content \--response_column summary \--overwrite_cache \--model_name_or_path /home/data/project/GOOGOSOFT/LLM/ChatGLM2-6B-main/ZhipuAI/chatglm2-6b \--output_dir output/adgen-chatglm2-6b-pt-$PRE_SEQ_LEN-$LR \--overwrite_output_dir \--max_source_length 128 \--max_target_length 256 \--per_device_train_batch_size 25 \--per_device_eval_batch_size 25 \--gradient_accumulation_steps 16 \--predict_with_generate \--max_steps 6000 \--logging_steps 10 \--save_steps 1000 \--learning_rate $LR \--pre_seq_len $PRE_SEQ_LEN \--quantization_bit 4以下是一个 Python 脚本用于计算 AdvertiseGen 数据集中 content 列的最大长度。此脚本假设数据集是 JSON 格式文件路径为 AdvertiseGen/train.json。 脚本计算最大 max_source_length import json# 数据集文件路径 train_file AdvertiseGen/train.json# 加载数据集 def load_data(file_path):with open(file_path, r, encodingutf-8) as f:data json.load(f)return data# 计算最大输入长度 def calculate_max_source_length(data, column_namecontent):lengths [len(item[column_name]) for item in data if column_name in item]max_length max(lengths)print(f最大输入长度 (max_source_length): {max_length})return max_length# 主函数 if __name__ __main__:# 加载数据data load_data(train_file)# 计算最大长度max_source_length calculate_max_source_length(data, column_namecontent) 训练
http://www.w-s-a.com/news/475610/

相关文章:

  • site之后网站在首页说明说明网络舆情分析师怎么考
  • 本溪网站建设兼职wordpress lapa
  • 官网网站设计费用vue大型网站怎么做路由
  • 青海省安建设管理部门网站厦门网站快照优化公司
  • 张家港建网站公司网站开发 认证
  • 网站建设方式优化兰州医院网站制作
  • 怎么创造网站wordpress伪静态规则怎么写
  • 自己怎么做一元购物网站信誉好的合肥网站推广
  • 做网站的骗术有什么好的网站设计思想的博客
  • 网站建设工作 方案企查查企业信息查询在线
  • 上海外贸建站商城定制软件安卓
  • 成都网站建设_创新互联wordpress 相邻文章
  • 电子商务网站制作步骤免费建网站知乎
  • 龙岩有什么招聘本地网站团购网站 方案
  • 服务器运行一段时间网站打不开注册公司名字核名查询系统
  • 企业网站改版的意义响应式网站建设新闻
  • 大连金州新区规划建设局网站金坛市建设局网站
  • 有哪些做排球比赛视频网站wordpress 教师工作坊
  • 深圳好点的网站建设公司互联网企业信息服务平台
  • 下载空间大的网站建设哈尔滨网站制作软件
  • 南城网站仿做无锡网站制作哪家价格便宜
  • c做的网站营销策划课程
  • 免费网站404免费进入重庆的公需科目在哪个网站做
  • 网站空间租用费用网站建设公司怎么宣传
  • 镇江网站建设优化案例分析dw2018网页制作步骤图文
  • 网站开发一个多少钱为什么前端都不用dw
  • 网站降权的原因北京中小企业网站建设公司
  • 个人域名能做网站吗wordpress
  • 手机网站设计只找亿企邦工业设计公司简介
  • 腾讯云主机做网站免费网站怎么做啊