门户网站建设的背景和意义,手机网站前,wordpress添加og,网站建设推广方案最近在做回归任务#xff0c;有一点小小的思考。
回归任务经常用的评价指标#xff0c;MAE#xff08;平均绝对误差#xff09;、MSE#xff08;均方误差#xff09;#xff0c;RMSE(均方根误差)等
比如要做一个气温预测#xff0c;那么模型预测的值#xff0c;即为…最近在做回归任务有一点小小的思考。
回归任务经常用的评价指标MAE平均绝对误差、MSE均方误差RMSE(均方根误差)等
比如要做一个气温预测那么模型预测的值即为温度单位是摄氏度。而上述提到的评估指标计算结果与原数据具有相同的量纲即摄氏度值。
在实际业务场景中领导往往更喜欢看准确率百分比这种显而易见的指标。但在回归任务中预测值与真实值几乎不可能完全相等。
第一直觉想到一种计算误差率的公式abs(真实值-预测值)/真实值。首先计算真实值与预测值的绝对误差值在除以真实值进而获取单条样本的误差率在用1-误差率方式计算准确率。这种计算方式有利也有弊
1、优势直观不受原始数据量纲单位的影响高估与低估具备对称性例子如下
对低估和高估的惩罚是对称的在误差率层面假定真实值a7:
高估预测值 b15绝对误差值8误差率为8/7
低估预测值 b-1绝对误差值8误差率为8/7
2、缺点以及异常情况
上面例子很直观地说明了误差率并不能控制在100%以内有可能误差率还会高于100%这样在用1-误差率作为准确率负准确率不符合常识。
3、适用条件
一定要保证真实值不能为0这是最致命的问题真实值为0意味着分母为0这就会导致除0错误或无穷大inf的误差率。当绝对误差值较大时一般指超过真实值1倍以上就会发生误差率大于100%的问题一定要注意这种情况。
基于我目前在做的项目预测值都是大于0的而上述误差率大于100%的情况呢只能发生在高估上即预测值远大于真实值。因为高估无上限低估有下限大于0。还是举一个例子说明
假定真实值为a预测值为b且两值均大于0分两种情况讨论
真实值是大于预测值的此时误差率 a-b /a 1 - b/a由于ab所以b/a一定大于0且小于1的所以最终的误差率范围一定在0,1。真实值小于预测值此时误差率 b-a/a b/a - 1 由于ba所以b/a一定大于1但没有上限假定b 3a此时误差率为2所以此时的误差率范围在0无穷。
4、那有没有更好的方式呢还是用到百分比这种形式去量化指标目前我还没想到欢迎大家补充新思路。