当前位置: 首页 > news >正文

西部网站建设网站建设步骤 文档

西部网站建设,网站建设步骤 文档,国内顶尖设计椅子图片,哪些网站可以免费看剧判断选择什么模型#xff0c;什么量化方案#xff0c;什么推理框架#xff0c;最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度#xff0c;但是运算速度是无法计算的#xff0c;所以定义了一些间接标准来推测模型的… 判断选择什么模型什么量化方案什么推理框架最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度但是运算速度是无法计算的所以定义了一些间接标准来推测模型的运算速度。这些标准不仅仅可以用来选择模型的量化方案在设计模型时也应该有所参考。 模型计算量FLOPs Floating point operations浮点运算数量代表一次推理需要的浮点运算次数 注意不要与FLOPS混淆FLOPS是floating point operations per second指芯片每秒浮点运算数量用于衡量芯片的运算能力。 例如对于一个普通CNN卷积层输入尺寸为 C o u t × H × W C_{out}\times H\times W Cout​×H×W输出尺寸相同卷积核尺寸 K 3 K3 K3添加偏置 b i a s bias bias 一次卷积的运算量 乘法: C i n K 2 C_{in} K^2 Cin​K2加法: C i n ( K 2 − 1 ) ( C i n − 1 ) 1 C i n K 2 C_{in}(K^2-1)(C_{in}-1)1C_{in}K^2 Cin​(K2−1)(Cin​−1)1Cin​K2 输出尺寸 C o u t × H × W C_{out}\times H\times W Cout​×H×W中的每个像素点都是一次卷积运算量共计 2 C i n C o u t H W × K 2 2C_{in}C_{out}HW\times K^2 2Cin​Cout​HW×K2 计算方法的不同以及是否添加bias导致算出来的结果可能不完全一样无所谓FLOPs这种就跟算法中的复杂度O(n)差不多常数不会对结果产生数量级的影响。 FLOPs只是一个衡量标准还有其他的衡量标准例如MACCsmultiply-accumulate operations乘-加操作次数一次乘法一次加法为一个MACCsMACCs 大约是 FLOPs 的一半。 模型参数量parameters 顾名思义模型的参数总量 例如对于普通CNN卷积层一共有 C i n C o u t C_{in}C_{out} Cin​Cout​个卷积核参数量 C i n C o u t × K 2 C_{in}C_{out}\times K^2 Cin​Cout​×K2 模型内存访问代价MAC 一次前向推理的过程中模型内存交换的总量体现了模型的空间复杂度。 模型计算强度 I F L O P s M A C I\frac{FLOPs}{MAC} IMACFLOPs​表示每次内存交换对应多少次浮点运算计算强度越大模型内存利用率越高 模型量化就约等于是运算量不变但是每次运算本来要读取fp324个字节现在换成了读取int81个字节MAC降低了模型计算强度提高了。 推理平台衡量标准 算力FLOPS 每秒浮点数运算次数(用 π \pi π来表示) 带宽 每秒的内存交换量(用 β \beta β表示) 计算强度上限 I m a x π β I_{max}\frac{\pi}{\beta} Imax​βπ​ 理论上模型的计算强度刚好达到推理平台的计算强度上限时性能最佳这个理论最佳性能称为roof-line。计算强度低于 I m a x I_{max} Imax​时被称为带宽瓶颈区这时推理平台的性能没有完全发挥出来性能的上限取决于模型的计算强度计算强度高于 I m a x I_{max} Imax​时称为计算瓶颈区平台的算力得到了充分利用。 不过想要达到roof-line不是光考虑模型的计算量和内存访问代价就够的。因为实际计算过程中还有除算力和带宽之外的其他重要因素它们也会影响模型的实际性能这是 Roofline Model 未考虑到的。例如矩阵乘法会因为 cache 大小的限制、GEMM 实现的优劣等其他限制导致你几乎无法达到 Roofline 模型所定义的边界屋顶。 GEMM指通用矩阵乘法这个在后面的blog中我们也要讲到多年来数学家和计算机科学家都在努力优化矩阵乘法但是进展不大最近清华姚班大佬发了一篇paper被称为十年来矩阵乘法的最大优化有空可以读一下 论文地址https://epubs.siam.org/doi/10.1137/1.9781611977912.134 多年来矩阵乘法优化算法的发展历程 pytorch社区中的一篇讲解矩阵乘法的bloghttps://pytorch.org/blog/inside-the-matrix/ 解放双手 这么复杂的运算自然不会是考我们人手工计算然后评估模型实际上有很多用于评估模型的库实践如下 pytorch自行计算 如果只是评估模型参数量不需要进行借助工具直接两行代码就搞定 from torchvision.models import resnet50model resnet50() total sum([param.nelement() for param in model.parameters()]) print(parameter:%fM % (total/1e6))Torchstat 统计模型的参数量、计算量、访存量等指标且会针对模型的每层指标进行打印部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install torchstat使用方法如下 import torch import torchvision.models as models from torchstat import statmodel models.resnet50(pretrainedTrue)# 使用torchstat的stat函数来分析模型 stat(model, (3, 224, 224))Thop top这个词在计算机领域很常见很多关系到性能的都会有top这个词例如Linux平台下的性能管理工具topJetson中的性能检测工具jtop。这是为啥呢不懂。 统计模型的参数量和计算量部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install thop使用方法如下 from torchvision.models import resnet50 from thop import profile model resnet50() input torch.randn(1, 3, 224, 224) flops, params profile(model, inputs(input, )) print(FLOPs, str(flops/1e9) {}.format(G)) print(params, str(params/1e6) {}.format(M))更复杂的使用建议用到了再去翻文档学习工具类的提前学习没有意义。 如果感觉有帮助点赞收藏关注thanks
http://www.w-s-a.com/news/355909/

相关文章:

  • 沈阳红方城网站建设专业的微网站哪家好
  • 医院网站asp东营信息发布平台
  • 网站全站建设开题报告范文南京本地网站
  • 网站漏洞扫描工具wampserver集成环境搭建了一个织梦cms网站
  • 如何在局域网上做网站宁波设计公司排行榜
  • 自己的电脑做网站服务器吗百度搜索风云榜总榜
  • 做化妆品的一些网站企业网站建设与营运计划书
  • 重庆速代网络科技seo整站优化服务教程
  • 成都比较好的装修设计公司seo3的空间构型
  • 开发商建设审批网站成都创意设计公司
  • 百度快照比网站上线时间早wordpress新建阅读量字段
  • 国家工程建设标准化协会网站网站开发工具有
  • 上海网站建设集中公关公司组织架构图
  • wordpress副标题的作用百度网站标题优化
  • 大连哪家公司做网站比较好wordpress 判断用户组
  • 网站空间1g多少钱东莞公司高端网站建设
  • 网站服务器出错是什么意思做餐饮酒店网站
  • 房地产网站建设策划方案网站建设教程简笔画
  • 3d室内设计软件wordpress本地优化加速版
  • 南京高新区规划建设局网站石家庄哪里做网站比较好
  • 免费培训课程网站优化的方式
  • 做网站要固定电话在家自己做网站
  • 招聘网站开发视频新手如何做网站维护
  • flash 网站欣赏国外做的比较好的网站有哪些
  • 推广一个网站需要什么官网首页设计
  • 淘宝建设网站的理由企业官网建设哪家好
  • 青岛网站推wordpress主题切换
  • 天元建设集团有限公司资质郑州网站seo推广
  • 免费网站后台管理系统模板下载百度网盘app下载安装
  • 开封网站建设培训郑州高端网站建设哪家好