建网站投放广告赚钱,西安做小程序的公司,免费的外链平台,手机上如何创建微信公众号交并比#xff08;IoU#xff09;前言IoU公式及示意图IoU Loss缺点GIoU Loss公式及示意图缺点DIoU公式及示意图CIoU前言
目标检测是一个常见的计算机视觉任务#xff0c;在目标检测任务中#xff0c;交并比作为评判检测框的标准具有很重要的意义#xff0c;在实际的应用中…
交并比IoU前言IoU公式及示意图IoU Loss缺点GIoU Loss公式及示意图缺点DIoU公式及示意图CIoU前言
目标检测是一个常见的计算机视觉任务在目标检测任务中交并比作为评判检测框的标准具有很重要的意义在实际的应用中人们又对最初的IoU进行了诸多的改进。本文将对IoU以及他的改进形式的思路以及公式进行详细通俗的介绍。
IoU
IoU是最早的用于评价预测框与实际框差距的标准并被用于设置关于预测框回归的损失函数其思路就是计算预测框与实际框相交区域的面积以及相并区域的面积
假设我们是在这样一张图片上进行目标检测
那么我们令蓝框为真实框绿框为预测框以这个图片的人脸检测为例介绍IoU
公式及示意图
IoUT∩PT∪P,其中T为实际框P为预测框IoU\frac{T \cap P}{T \cup P},其中T为实际框P为预测框IoUT∪PT∩P,其中T为实际框P为预测框
通俗来看 从直观上讲就如上图我们假设蓝框是真实框绿框为预测框上下红色阴影部分的面积之比就是IoU
示意图
IoU Loss
IoU越大说明真实框与预测框的重合度越高即越好所以我们可以使用IoU重建损失函数一般有两种方式 IoULoss1−IoU或IoULoss−lnIoUIoU \space Loss 1-IoU或IoU\space Loss-lnIoUIoU Loss1−IoU或IoU Loss−lnIoU
缺点
失效情况我们首先来看图 如果真实框与预测框没有重合区域就会出现这样的情况 这种情况并不是少数因为在模型训练初期模型的参数趋近于混乱所以基本上预测框和乱标的没什么太大差别如果真实框与预测框没有相重合拟合会较为困难因为所有的没有重合的损失值都为1并且没有指明梯度下降的合理方向。他的问题是只考虑了真实框与预测框的相交情况并没有考虑框的位置关系
GIoU Loss
公式及示意图
GIoULoss1−IoU∣C−T∪P∣∣C∣其中T为真实框P为预测框C为两个框的最小边界GIoU\space Loss1-IoU\frac{|C-T \cup P|}{|C|}其中T为真实框P为预测框C为两个框的最小边界GIoU Loss1−IoU∣C∣∣C−T∪P∣其中T为真实框P为预测框C为两个框的最小边界 如果是上述不相交的情况 此时虽然1-IoU仍然为1但是加入的一项会使得两个不相交的框距离越远损失越大这样可以通过新加入的这一项继续进行梯度下降这里的GIoU Loss可以大于1
缺点
当一个框被另一个框框住的时候被框住的框无论在哪个位置得出的GIoU Loss的值都是完全相同的这种情况下又会影响梯度下降的方向 在这种情况下绿框在蓝框里面无论绿框如何移动只要它还在蓝框内部他的损失值就不变显然这也是不利于框的拟合的为了解决这种情况可以采用DIoU
DIoU
公式及示意图
DIoULoss1−IoUρ2(cT,cP)d2其中ρ2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离d2是两框对角线距离的平方DIoU \space Loss1-IoU\frac{\rho^2(cT,cP)}{d^2} \\其中\rho^2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离 \\ d^2是两框对角线距离的平方DIoU Loss1−IoUd2ρ2(cT,cP)其中ρ2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离d2是两框对角线距离的平方 使用DIoU时不仅可以解决框不相交的问题又解决了框在内部情况下遇到的问题此时我们考虑了框的重合度和中心点的距离还只剩下高宽比这种评价指标。如果深入理解DIoU可以发现在DIoU中通过IoU和中心距离比的协调高宽比实际上已经隐含在里边了不过为了更加容易收敛仍然可以在多考虑高宽比这一条件并加到损失函数中去
CIoU
这个损失函数画图并不是很好表示所以只对公式进行讲解如果理解不了也可以使用DIoUDIoU也已经达到了很好的效果了 CIoULoss1−IoUρ2(cT,cP)d2αv其中ρ2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离d2是两框对角线距离的平方CIoU \space Loss1-IoU\frac{\rho^2(cT,cP)}{d^2} \alpha v \\其中\rho^2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离 \\ d^2是两框对角线距离的平方CIoU Loss1−IoUd2ρ2(cT,cP)αv其中ρ2(cT,cP)是真实框中心(cT)与预测框中心(cP)的欧氏距离d2是两框对角线距离的平方 v4π2(arctanwThT−arctanwPhP)2v\frac{4}{\pi ^2}(arctan\frac{wT}{hT}-arctan\frac{wP}{hP})^2vπ24(arctanhTwT−arctanhPwP)2 αv1−IoUv\alpha\frac{v}{1-IoU}vα1−IoUvv 其中wThT是真实框的高宽wPhP是预测框的高宽其中wThT是真实框的高宽wPhP是预测框的高宽其中wThT是真实框的高宽wPhP是预测框的高宽