当前位置: 首页 > news >正文

大芬地铁站附近做网站工业设计公司报价

大芬地铁站附近做网站,工业设计公司报价,利用帝国cms网站建设,山东企业网站建设公司一、get_scheduler实现warmup 1、warmup基本思想 Warmup#xff08;预热#xff09;是深度学习训练中的一种技巧#xff0c;旨在逐步增加学习率以稳定训练过程#xff0c;特别是在训练的早期阶段。它主要用于防止在训练初期因学习率过大导致的模型参数剧烈波动或不稳定。…一、get_scheduler实现warmup 1、warmup基本思想 Warmup预热是深度学习训练中的一种技巧旨在逐步增加学习率以稳定训练过程特别是在训练的早期阶段。它主要用于防止在训练初期因学习率过大导致的模型参数剧烈波动或不稳定。预热阶段通常是指在训练开始时通过多个步长逐步将学习率从一个较低的值增加到目标值通常是预定义的最大学习率。 2、warmup基本实现 from transformers import get_schedulerscheduler get_scheduler(namecosine, # 可以选择 linear, cosine, polynomial, constant, constant_with_warmupoptimizeroptimizer,num_warmup_steps100, # 预热步数num_training_stepsnum_training_steps # 总的训练步数 )#linear线性学习率下降 #cosine余弦退火 #polynomial多项式衰减 #constant常数学习率 #constant_with_warmup预热后保持常数# 上述代码等价于 from transformers import get_cosine_scheduler_with_warmupscheduler get_cosine_scheduler_with_warmup(optimizeroptimizer,num_warmup_steps100, # 预热步数num_training_stepsnum_training_steps # 总的训练步数 )# 同理等价于linear, polynomial, constant分别等价于 from transformers import (get_constant_schedule, get_polynomial_decay_schedule_with_warmup, get_linear_schedule_with_warmup) 二、各种warmup策略学习率变化规律 1、get_constant_schedule学习率变化规律 2、get_cosine_schedule_with_warmup学习率变化规律 3、get_cosine_with_hard_restarts_schedule_with_warmup学习率变化规律 4、get_linear_schedule_with_warmup学习率变化规律 5、get_polynomial_decay_schedule_with_warmup学习率变化规律power2, power1类似于linear 6、注意事项 如果网络中不同框架采用不同的学习率上述的warmup策略仍然有效如图二、5中所示 给schduler设置的number_training_steps一定要和训练过程相匹配如下所示。 7、可视化学习率过程 import matplotlib.pyplot as plt from transformers import get_scheduler from torch.optim import AdamW import torch import math# 定义一些超参数learning_rate 1e-3 # 初始学习率# 假设有一个模型 model torch.nn.Linear(10, 2)# 获得训练总的步数 epochs 50 batch_size 32 #train_loader *** #num_train_loader len(train_loader) num_train_loader 1235num_training_steps epochs * math.ceil(num_train_loader/batch_size) # 总的训练步数# 定义优化器 optimizer AdamW(model.parameters(), lrlearning_rate)# 创建学习率调度器 scheduler get_scheduler(namecosine, # 可以选择 linear, cosine, polynomial, constant, constant_with_warmupoptimizeroptimizer,num_warmup_steps100, # 预热步数num_training_stepsnum_training_steps # 总的训练步数 )# 存储每一步的学习率 learning_rates []# for step in range(num_training_steps): # optimizer.step() # scheduler.step() # learning_rates.append(optimizer.param_groups[0][lr])for epoch in range(epochs):# for batch in train_loader:for step in range(0, num_train_loader, batch_size):optimizer.zero_grad()# loss.backward()optimizer.step()scheduler.step()learning_rates.append(optimizer.param_groups[0][lr])# 绘制学习率曲线 plt.plot(learning_rates) plt.xlabel(Training Steps) plt.ylabel(Learning Rate) plt.title(Learning Rate Schedule) plt.show()实验结果
http://www.w-s-a.com/news/592403/

相关文章:

  • 建设网站最强永年网站建设
  • 网站分站代理加盟wordpress国内工作室主题
  • 东营远见网站建设公司服装网站建设内容
  • 互助平台网站建设费用百度seo优化怎么做
  • lol英雄介绍网站模板工商局网上注册
  • 电商网站运营策划什么样的网站容易做seo
  • 网站备案需要什么流程怎么创建小程序卖东西
  • 陇西网站建设 室内设计持啊传媒企业推广
  • 连云港做网站制作首选公司如何让单位网站做防护
  • wordpress企业网站源码开发网站用什么工具做设计
  • 网站负责人不是法人seo神马网站推广器
  • 网站建设绩效考核方案wordpress支付宝付款
  • 高要区住房和城乡建设局网站如何网上注销自己的公司
  • 哪种技术做网站容易论文答辩图片做记录片的是哪个网站
  • 怎样在微信中做网站网站的备案号在哪
  • 返利淘网站怎么做wordpress htnl短代码
  • 网站 手机 appwordpress管理账户
  • 徐州网站建设 网站制作做招商网站的前景怎么样
  • 网站开发就业岗位鹧鸪哨网站1v1深度开发
  • 在线手机动画网站模板网站登录注册怎么做
  • 苏州品牌网站设计晋江论坛兔区是什么
  • 怎么利用代码做网站重庆网络营销网站建设销售
  • 用dw怎么做网站留言板百度举报网站
  • 成都微网站设计企业为什么要做网络营销推广
  • 双桥区网站制作企业网站一般内容包括哪些
  • 莆田外贸专业建站做app 需要先做网站吗
  • 网站怎么用北京口碑最好的装修公司
  • 潮州网站建设深圳微信分销网站设计
  • asp.net网站开发实例教程pdf泉州seo网站关键词优推广
  • 怎样建立一个企业网站dede 网站名称