2146441b6f158a25b881067126b70aca.png

假设有原始数据集

包含n个数据点
,由此拟合了多元线性回归函数

拟合之后有以下常用定义:

  • (Sum of Squares for Error 剩余平方和):
    (也称为
    ,Residual Sum of Squares)
  • (corrected Sum of Squares for Model 回归平方和):
    (也称为
    ,Sum of Squares for Regression)
  • (corrected Sum of Squares Total 总离差平方和):
    为所有
    的均值)

值得注意的是

自由度:

在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。
  • 自由度
    (因为有
    个数据点减去
    个变量限制)
  • 自由度
    (因为有
    个变量减去
    均值限制)
  • 自由度
    (因为在均值确定后,如果知道了其中
    个数的值,第
    个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为

相似的

以及调整后的

通常认为

越接近1,模型拟合的效果越好,其定义为回归平方和与总离差平方和的比值。

调整后的

会考虑自由度的影响,惩罚过多的参数数量
,防止模型过拟合


-test

用于衡量拟合模型整体是否在统计上有意义,其表达式为

求出此值之后可以对比根据显著性水平

,自由度
查表所得的
值。如果
,则拟合模型总体关系可称为显著成立。

-test

用于衡量每个变量是否在统计上有意义,表达式为

求出此值后,可以对比根据显著性水平

,自由度
查表所得的
值。如果
,则该变量可称为有显著影响。之所以不同于
检验,用
为参考值查表,是因为
检验基于的假设是该变量参数服从正态分布。

参考资料:

https://blog.csdn.net/Jesszen/article/details/80989714​blog.csdn.net[图文]第三讲 回归模型检验 - 百度文库​wenku.baidu.comF-test for Regression​facweb.cs.depaul.edu
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐