网加做网站推广,做网站42类商标怎么选小类,教育教学成果展示网站建设,苏州网站建设网站优化先说结论#xff1a;
4070T显卡FP32的训练和推理速度跟3090应该基本类似。但由于显存12G偏低#xff0c;4070T不太适合如今的深度学习模型训练#xff08;新手列外#xff0c;大部分模型都能训练起来#xff0c;耗电也相对很低#xff09;#xff0c;更适合测试最新的一…
先说结论
4070T显卡FP32的训练和推理速度跟3090应该基本类似。但由于显存12G偏低4070T不太适合如今的深度学习模型训练新手列外大部分模型都能训练起来耗电也相对很低更适合测试最新的一些算法效果只用推理。 环境
pytorch环境conda install pytorch1.12.1 torchvision0.13.1 torchaudio0.12.1 cudatoolkit11.6 -c pytorch -c conda-forge
测试代码霹雳吧啦Wz的GitHub中的swin-L和FastRCNN。 深度学习模型个人测试结果 swin-L模型单位是 图像/秒FastRCNN模型单位是 秒/图像
备注1主流显卡的测评分 备注2其他显卡的测试性能SSD模型FP32训练 备注3另一个网站上的综合评分 备注4各类GPU的FP16和FP8训练和推理性能 编辑感觉备注4和我真实测试的有较大差异FP16的训练4070ti竟然和2080Ti几乎一样不知道为什么作者会得出此结论。
个人总结
timespy 4K跑分非常适合深度学习性能评估作为经过本人验证4070ti的深度学习性能FP32训练和推理相对1080T和2080T显卡的差异几乎跟time spy 4K跑分差异几乎一致。至于FP16和FP8还未测试。操作系统基本不影响显卡深度学习性能Ubuntu 22.04和win11系统下4070ti的训练和推理速度几乎一模一样。12G显存是硬伤4070T相对3090速度上并不差只是显存12G真的是硬伤分类网络swin-L的batchsize都只能设为8图像224*224。