城乡建设管理局网站,专业做室内设计的网站有哪些内容,蓝色企业网站配色,不允许网站建设协议大家读完觉得有意义记得关注和点赞#xff01;#xff01;#xff01;
1 术语 1.1 CPU1.2 GPU1.3 NPU / TPU1.4 小结2 华为 DaVinci 架构#xff1a;一种方案覆盖所有算力场景 2.1 场景、算力需求和解决方案2.2 Ascend NPU 设计3 路线一#xff1a;NPU 用在手机芯片…大家读完觉得有意义记得关注和点赞
1 术语 1.1 CPU1.2 GPU1.3 NPU / TPU1.4 小结2 华为 DaVinci 架构一种方案覆盖所有算力场景 2.1 场景、算力需求和解决方案2.2 Ascend NPU 设计3 路线一NPU 用在手机芯片Mobile AP SoC 3.1 Kirin 9702017, Mate 10 系列手机3.2 Kirin 990 5G2019, Mate 30 系列手机3.3 Kirin 9000 5G2020Mate 40 系列手机3.4 Kirin 9000s2023Mate 60 系列手机3.5 小结4 路线二NPU 用作推理/训练芯片Ascend AI Processor 4.1 产品加速卡 Atlas 系列4.2 Ascend 3102019推理 Spec4.3 Ascend 910, 2019训练 4.3.1 Spec Performance, vs. Google TPU4.3.2 计算集群4.4 Ascend 910B, 2023参考资料 本文内容都来自公开资料仅供个人了解参考。 AI 相关的东西现在迭代非常快所以部分内容可能已经过时请注意甄别。
1 术语
CPU/GPU/NPU 等等都是硬件芯片简单来说晶体管既可以用来实现逻辑控制单元 也可以用来实现运算单元算力。 在芯片总面积一定的情况下就看控制和算力怎么分。
CPU通用目的处理器重逻辑控制GPU通用目的并行处理器GPGPU图形处理器NPU专用处理器相比 CPU/GPU擅长执行更具体的计算任务。
1.1 CPU
大部分芯片面积都用在了逻辑单元因此逻辑控制能力强算力弱相对。
1.2 GPU
大部分芯片面积用在了计算单元因此并行计算能力强但逻辑控制弱。 适合图像渲染、矩阵计算之类的并行计算场景。作为协处理器 需要在 CPU 的指挥下工作 Image Source [8]
1.3 NPU / TPU
也是协处理器。在 wikipedia 中没有专门的 NPU (Neural Processing Unit) 页面而是归到 AI Processors 大类里面 指的是一类特殊目的硬件加速器更接近 ASIC硬件实现神经网络运算 比如张量运算、卷积、点积、激活函数、多维矩阵运算等等[7]。 如果还不清楚什么是神经网络可以看看 以图像识别为例关于卷积神经网络CNN的直观解释2016。 在这些特殊任务上比 CPU/GPU 这种通用处理器效率更高功耗更小响应更快 比如一个时钟周期内可以完成几十万个乘法运算 因此适合用在手机、边缘计算、物联网等等场景。
TPU这里特制 Google 的 Tensor Processing Unit目的跟 NPU 差不多。 [11] 对 TPU 和 GPU 的使用场景区别有一个非常形象的比喻 如果外面下雨了你其实并不需要知道每秒到底有多少滴雨 而只要知道雨是大还是小。 与此类似神经网络通常不需要 16/32bit 浮点数做精确计算可能 8bit 整型预测的精度就足以满足需求了。 Floor Plan of Google TPU die(yellow compute, blue data, green I/O, red control) [11]
1.4 小结
GPU 已经从最初的图像渲染和通用并行计算逐步引入越来越多的神经网络功能 比如 Tensor Cores、Transformer 另一方面NPU 也在神经网络的基础上开始引入越来越强大的通用计算功能 所以这俩有双向奔赴的趋势。
2 华为 DaVinci 架构一种方案覆盖所有算力场景
2.1 场景、算力需求和解决方案 不同算力场景下算力需求TFLOPS和内存大小GB的对应关系 [1] 华为的解决方案一种架构DaVinci覆盖所有场景 [1]
用在几个不同产品方向上
手机处理器自动驾驶芯片等等专门的 AI 处理器使用场景类似于 GPU
2.2 Ascend NPU 设计
2017 年发布了自己的 NPU 架构[2] 详细介绍了 DaVinci 架构的设计。 除了支持传统标量运算、矢量运行还引入了 3D Cube 来加速矩阵运算 Image Source [2]
单位芯片面积或者单位功耗下性能比 CPU/GPU 大幅提升 Image Source [2]
下面看看实际使用场景和产品系列。
3 路线一NPU 用在手机芯片Mobile AP SoC
现代手机芯片不再是单功能处理器而是集成了多种芯片的一个 片上系统SoC 华为 NPU 芯片就集成到麒麟手机芯片内部随着华为 Mate 系列高端手机迭代。 Image Source [7]
比如一些典型的功能划分 [7]
CPU 主处理器运行 appGPU 渲染、游戏等NPU 图像识别、AI 应用加速。
Mate 系列手机基本上是跟 Kirin 系列芯片一起成长的早期的手机不是叫 “Mate XX” 而是 “Ascend Mate XX”从中也可以看出跟昇腾Ascend的渊源。
3.1 Kirin 9702017, Mate 10 系列手机
据称是第一个手机内置的 AI 处理器NPU[3]。 在 AI 任务上比如手机上输入文字搜图片涉及大批量图片识别比 CPU 快 25~50 倍。
10nm台积电代工CPU 8-core with a clockspeed of uP to 2.4GHz i.e. 4 x Cortex A73 at 2.4GHz 4 x Cortex 53 at 1.8GHzGPU 12-core Mali G72MP12 ARM GPUNPU 1.92 TFLOPs FP16
3.2 Kirin 990 5G2019, Mate 30 系列手机
Kirin 990 包含了 D-lite 版本的 NPU [1]
World’s st 5G SoC Poweed by 7nm EUVWorld’s 1st 5G NSA SA Flagship SoCWolrd’s 1st 16-Core Mali-G76 GPUWorld’s 1st Big-Tiny Core Architechture NPU 麒麟 990 5G 芯片逻辑拓扑 [1]
一些硬件参数 [1,4]
台积电 7nm 工艺CPU 8-CoreNPU 21 Core GPU 16-core Mali-G76ARM GPU GPU 16-core Mali-G76 (ARM GPU)NPU HUAWEI Da Vinci Architecture,2x Ascend Lite 1x Ascend Tiny2G/3G/4G/5G ModemLPDDR 4X4K HDR Video
3.3 Kirin 9000 5G2020Mate 40 系列手机 Image Source
台积电 5nm 工艺GPU 24-core Mali-G78, Kirin Gaming 3.0NPU HUAWEI Da Vinci Architecture 2.0 第二代架构2x Ascend Lite 1x Ascend Tiny
这个是台积电 5nm 工艺 [5]然后就被美国卡脖子了。 所以 Mate 50 系列用的高通处理器Mate 60 系列重新回归麒麟处理器。
3.4 Kirin 9000s2023Mate 60 系列手机
王者低调回归官网没有资料。
据各路媒体分析是中芯国际 7nm 工艺比上一代 9000 落后一些 毕竟制程有差距看看国外媒体的副标题 [6] Its tough to beat a 5nm processor with a 7nm chip. Wikipedia 提供的参数 [10]
SMIC 7nm FinFETCPU HiSilicon Taishan microarchitecture Cortex-A510GPU Maleoon 910 MP4NPU 有但是没提
3.5 小结
手机芯片系列先到这里接下来看看作为独立卡使用的 NPU 系列。
4 路线二NPU 用作推理/训练芯片Ascend AI Processor 两个产品301 低功耗910 高算力。
设计见 paper [2]。
4.1 产品加速卡 Atlas 系列
型号 Atlas 200/300/500/…包括了 NPU 在内的 SoC用于 AI 推理和训练。
4.2 Ascend 3102019推理
Spec
用的是 D-mini version 纸面算力基本对标 NVIDIA T4 [9]。
4.3 Ascend 910, 2019训练
4.3.1 Spec Performance, vs. Google TPU Image Source [1] Image Source [1]
4.3.2 计算集群 Image Source [1] Image Source [1]
4.4 Ascend 910B, 2023
GPU 进阶笔记二华为 Ascend 910B GPU 相关2023。
参考资料
DaVinci: A Scalable Architecture for Neural Network Computinghuawei, 2020Ascend: a Scalable and Unified Architecture for Ubiquitous Deep Neural Network Computing, HPCA, 2021Huawei Unveils The Kirin 970, The World’s First Processor With A Dedicated NPU, 2017Kirin 990 5G Data Sheet, hisilicon.comKirin 9000 Data Sheet, hisilicon.comHuawei’s sanctions-evading Kirin 9000S processor tested: significantly behind its Kirin 9000 predecessor that used TSMC tech2023Neural Processing Unit (NPU) Explained, 2021AI 101: GPU vs. TPU vs. NPU, 2023GPU Performance (Data Sheets) Quick Reference (2023)Wikipedia: HiSilicon, wikipedia.comAn in-depth look at Google’s first Tensor Processing Unit (TPU), Google Cloud Blog, 2017