数据挖掘人工智能常用的回归损失函数

常用的回归损失函数平均绝对误差（Mean Absolute Error, MAE）均方误差（Mean Squared Error, MSE）均方根误差（Root Mean Squared Error, RMSE）平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）Huber损失总结

常用的回归损失函数

平均绝对误差（Mean Absolute Error, MAE）

定义： MAE计算预测值与真实值之间差的绝对值的平均数。

∑

∣

−

∣

MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|

MAE=n1i=1∑n∣yi−y^i∣

其中n是样本数量，y_i是真实值，\hat{y}_i是预测值。

优点：

直观易理解。对异常值不敏感。缺点：

不提供关于误差方向的信息。梯度恒定，可能导致收敛速度慢。

均方误差（Mean Squared Error, MSE）

定义： MSE计算预测值与真实值之间差的平方的平均数。

∑

(

−

)

MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2

MSE=n1i=1∑n(yi−y^i)2

优点：

惩罚较大的误差，有利于模型更精确预测。在优化中具有良好的数学性质（可微）。缺点：

对异常值非常敏感。误差较大时，梯度也较大，可能导致模型不稳定。

均方根误差（Root Mean Squared Error, RMSE）

定义： RMSE是MSE的平方根。

∑

(

−

)

RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}

RMSE=n1i=1∑n(yi−y^i)2

优点：

惩罚大误差，有助于模型精度。与目标变量同一量纲，易于解释。缺点：

对异常值敏感。可能过度惩罚大误差。

平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）

定义： MAPE计算预测值与真实值之间差的绝对值与真实值之比的平均数。

∑

∣

−

∣

MAPE = \frac{1}{n}\sum_{i=1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right|

MAPE=n1i=1∑n

yiyi−y^i

优点：

结果易于解释，因为它是百分比形式。适用于不同量级的数据。缺点：

当真实值接近或等于零时，MAPE会变得非常大或不确定。对异常值相对敏感。

Huber损失

定义： Huber损失是MAE和MSE的结合，对于小的误差，它是平方误差，对于大的误差，则是线性误差。

(

)

{

(

−

)

for

∣

−

∣

≤

(

∣

−

∣

−

)

otherwise.

L_{\delta}(y, \hat{y}) = \begin{cases} \frac{1}{2}(y - \hat{y})^2 & \text{for } |y - \hat{y}| \le \delta,\\ \delta(|y - \hat{y}| - \frac{1}{2}\delta) & \text{otherwise.} \end{cases}

Lδ(y,y^)={21(y−y^)2δ(∣y−y^∣−21δ)for ∣y−y^∣≤δ,otherwise.

其中δ是一个可调参数，决定了何时切换损失。

优点：

对异常值更加鲁棒。在误差较小时是平滑的，有助于模型稳定。缺点：

需要选择合适的δ值。计算复杂度高于MAE和MSE。

总结

对于选择损失函数，需要考虑模型的具体需求和数据的特点。例如，如果数据包含许多异常值，可能会选择Huber损失或MAE来减少异常值的影响。如果模型需要惩罚大的误差，MSE或RMSE可能是更好的选择。

好文推荐

评论可见，请评论后查看内容，谢谢！！！评论后请刷新页面。

夸智网

数据挖掘人工智能常用的回归损失函数

【python】商业数据聚类-回归数据分析可视化（源码+数据）【独一无二】

数据挖掘多种时间序列、数据分类、数据回归算法（matlab代码）

发表评论取消回复

夸智网

数据挖掘 人工智能 常用的回归损失函数

【python】商业数据聚类-回归数据分析可视化（源码+数据）【独一无二】

数据挖掘 多种时间序列、数据分类、数据回归算法（matlab代码）

相关文章

发表评论取消回复

数据挖掘人工智能常用的回归损失函数

数据挖掘多种时间序列、数据分类、数据回归算法（matlab代码）