当前位置: 首页 > news >正文

营销型网站建设费用企业网站的建设哪个好

营销型网站建设费用,企业网站的建设哪个好,手机网站开发工具,sap和国家网站做接口基于MindNLP的Roberta模型Prompt Tuning 本文档介绍了如何基于MindNLP进行Roberta模型的Prompt Tuning#xff0c;主要用于GLUE基准数据集的微调。本文提供了完整的代码示例以及详细的步骤说明#xff0c;便于理解和复现实验。 环境配置 在运行此代码前#xff0c;请确保…基于MindNLP的Roberta模型Prompt Tuning 本文档介绍了如何基于MindNLP进行Roberta模型的Prompt Tuning主要用于GLUE基准数据集的微调。本文提供了完整的代码示例以及详细的步骤说明便于理解和复现实验。 环境配置 在运行此代码前请确保MindNLP库已经安装。本文档基于大模型平台运行因此需要进行适当的环境配置确保代码可以在相应的平台上运行。 模型与数据集加载 在本案例中我们使用 roberta-large 模型并基于GLUE基准数据集进行Prompt Tuning。GLUE (General Language Understanding Evaluation) 是自然语言处理中的标准评估基准包括多个子任务如句子相似性匹配、自然语言推理等。Prompt Tuning是一种新的微调技术通过插入虚拟的“提示”Token在模型的输入中以微调较少的参数达到较好的性能。 import mindspore from tqdm import tqdm from mindnlp import evaluate from mindnlp.dataset import load_dataset from mindnlp.transformers import AutoModelForSequenceClassification, AutoTokenizer from mindnlp.core.optim import AdamW from mindnlp.transformers.optimization import get_linear_schedule_with_warmup from mindnlp.peft import (get_peft_model,PeftType,PromptTuningConfig, )1. 定义训练参数 首先定义模型名称、数据集任务名称、Prompt Tuning类型、训练轮数等基本参数。 batch_size 32 model_name_or_path roberta-large task mrpc peft_type PeftType.PROMPT_TUNING num_epochs 202. 配置Prompt Tuning 在Prompt Tuning的配置中选择任务类型为SEQ_CLS序列分类任务并定义虚拟Token的数量。虚拟Token即为插入模型输入中的“提示”Token通过这些Token的微调使得模型能够更好地完成下游任务。 peft_config PromptTuningConfig(task_typeSEQ_CLS, num_virtual_tokens10) lr 1e-33. 加载Tokenizer 根据模型类型选择padding的侧边如果模型为GPT、OPT或BLOOM类模型则从序列左侧填充padding否则从序列右侧填充。 if any(k in model_name_or_path for k in (gpt, opt, bloom)):padding_side left else:padding_side righttokenizer AutoTokenizer.from_pretrained(model_name_or_path, padding_sidepadding_side) if getattr(tokenizer, pad_token_id) is None:tokenizer.pad_token_id tokenizer.eos_token_id4. 加载数据集 通过MindNLP加载GLUE数据集并打印样本以便确认数据格式。在此示例中我们使用GLUE的MRPCMicrosoft Research Paraphrase Corpus任务该任务用于句子匹配即判断两个句子是否表达相同的意思。 datasets load_dataset(glue, task) print(next(datasets[train].create_dict_iterator()))5. 数据预处理 为了适配MindNLP的数据处理流程我们定义了一个映射函数 MapFunc用于将句子转换为 input_ids 和 attention_mask并对数据进行padding处理。 from mindnlp.dataset import BaseMapFunctionclass MapFunc(BaseMapFunction):def __call__(self, sentence1, sentence2, label, idx):outputs tokenizer(sentence1, sentence2, truncationTrue, max_lengthNone)return outputs[input_ids], outputs[attention_mask], labeldef get_dataset(dataset, tokenizer):input_colums[sentence1, sentence2, label, idx]output_columns[input_ids, attention_mask, labels]dataset dataset.map(MapFunc(input_colums, output_columns),input_colums, output_columns)dataset dataset.padded_batch(batch_size, pad_info{input_ids: (None, tokenizer.pad_token_id),attention_mask: (None, 0)})return datasettrain_dataset get_dataset(datasets[train], tokenizer) eval_dataset get_dataset(datasets[validation], tokenizer)6. 设置评估指标 我们使用 evaluate 模块加载评估指标accuracy 和 F1-score来评估模型的性能。 metric evaluate.load(./glue.py, task)7. 加载模型并配置Prompt Tuning 加载 roberta-large 模型并根据配置进行Prompt Tuning。可以看到微调的参数量仅为总参数量的0.3%左右节省了大量计算资源。 model AutoModelForSequenceClassification.from_pretrained(model_name_or_path, return_dictTrue) model get_peft_model(model, peft_config) model.print_trainable_parameters()模型微调Prompt Tuning 在Prompt Tuning中训练过程中仅微调部分参数主要是虚拟Token相关的参数相比于传统微调而言大大减少了需要调整的参数量使得模型能够高效适应下游任务。 1. 优化器与学习率调整 使用 AdamW 优化器并设置线性学习率调整策略。 optimizer AdamW(paramsmodel.parameters(), lrlr)# Instantiate scheduler lr_scheduler get_linear_schedule_with_warmup(optimizeroptimizer,num_warmup_steps0.06 * (len(train_dataset) * num_epochs),num_training_steps(len(train_dataset) * num_epochs), )2. 训练逻辑定义 训练步骤如下 构建正向计算函数 forward_fn。定义梯度计算函数 grad_fn。定义每一步的训练逻辑 train_step。遍历数据集进行训练和评估在每个 epoch 结束时计算评估指标。 def forward_fn(**batch):outputs model(**batch)loss outputs.lossreturn lossgrad_fn mindspore.value_and_grad(forward_fn, None, tuple(model.parameters()))def train_step(**batch):loss, grads grad_fn(**batch)optimizer.step(grads)return lossfor epoch in range(num_epochs):model.set_train()train_total_size train_dataset.get_dataset_size()for step, batch in enumerate(tqdm(train_dataset.create_dict_iterator(), totaltrain_total_size)):loss train_step(**batch)lr_scheduler.step()model.set_train(False)eval_total_size eval_dataset.get_dataset_size()for step, batch in enumerate(tqdm(eval_dataset.create_dict_iterator(), totaleval_total_size)):outputs model(**batch)predictions outputs.logits.argmax(axis-1)predictions, references predictions, batch[labels]metric.add_batch(predictionspredictions,referencesreferences,)eval_metric metric.compute()print(fepoch {epoch}:, eval_metric)在每个 epoch 后程序输出当前模型的评估指标accuracy 和 F1-score。从结果中可以看到模型的准确率和 F1-score 会随着训练的进展逐渐提升。 总结 本案例通过Prompt Tuning技术在Roberta模型上进行了微调以适应GLUE数据集任务。通过控制微调参数量Prompt Tuning展示了较强的高效性。
http://www.w-s-a.com/news/966181/

相关文章:

  • 电子商城网站开发怎么wordpress用的什么主题
  • 榆林电商网站建设网上做试卷的网站
  • 文山网站建设代理中公教育培训机构官网
  • 郑州it培训机构有哪些上海外贸网站seo
  • dw做网站的实用特效广东住房与城乡建设厅网站
  • 模板网站 动易哪方面的网站
  • 怎么给网站做外链邵连虎郑州做网页的公司
  • 重庆网站开发哪家好宁波网站建设caiyiduo
  • 手机网站建设价格手机网站模版更换技巧
  • 哈尔滨松北区建设局网站美妆网站建设
  • 不需要网站备案的空间网站推广的基本方法是哪四个
  • 如何检查网站死链劳动仲裁院内部网站建设
  • 江西省住房和城乡建设网站合同管理系统
  • 网站建设质量保证福州网络推广
  • 高唐网站建设公司广州南站在哪个区
  • 广西柳州网站制作公司郴州网红打卡景点
  • 做网站要固定ip拍摄公司宣传片制作
  • 专业微网站电话号码做软件难吗
  • 邢台网站制作哪家强上海做网站设计
  • 大连网站建设外贸wordpress添加文章属性
  • 商城网站建设合同范本网上哪里可以免费学编程
  • 服务器公司网站博客wordpress怎么编辑
  • 网站建设网络推广柯西乡塘网站建设
  • 企业做网站需要多少钱企业资质查询系统官网
  • 网站建设需要知识百度统计数据
  • 自已如何做网站建设通网站会员共享密码
  • 做网站学习什么wordpress 文件夹
  • 前端移动网站开发wordpress图文混排
  • 企业网站建站那种好商城类网站怎么优化
  • 手机微网站怎么制作的网上找设计师