为什么需要洞察力?

先说第一件事。为什么线性回归很重要? 线性回归是一项基本技术,它深深植根于经过时间考验的统计学习和推理理论,并为现代数据科学管道中使用的所有基于回归的算法提供支持。而且,对于大多数数据分析工作——除了处理图像、音频或自然语言等高维数据的问题——这种回归技术仍然是最广泛使用的工具。 它们易于实现,更重要的是,易于遵循和解释。而且,可解释性变得越来越重要。

但是,线性回归模型的成功还取决于对基础数据性质的一些基本假设。验证这些假设是否得到“合理”满足的重要性再怎么强调也不为过。该检查是确保线性回归模型质量的唯一保证。

Scikit-learn机器学习的首选包

对于我们所有人使用 Python 作为数据科学的首选语言,机器学习的首选包是 Scikit-learn。尽管 Scikit-learn 的估计器经过高度优化和精心设计,但它们并没有为回归任务提供很多统计见解或检查。例如,他们可以为您提供R²分数和回归系数,仅此而已。 但是,如果您想要(来自同一个估算器)以下见解/图表怎么办?

Residuals vs. predicting variables plots

Fitted vs. residuals plot

Histogram of the normalized residuals

Q-Q plot of the normalized residuals

Shapiro-Wilk normality test on the residuals

Cook’s distance plot of the residuals

Variance inflation factor (VIF) of the pre

文章链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。