R²(决定系数),统计学中用于衡量因变量的变异中可以通过自变量解释的比例,是回归分析中一个重要的评价指标。简而言之,它表示模型对数据的拟合程度。本文将详细介绍R²的计算方法。
首先,我们需要明确R²的计算公式。R²可以通过以下两种方式计算:
- 总变异与回归变异的比值
- 总离差平方和与回归离差平方和的差值与总离差平方和的比值
计算方法一:总变异与回归变异的比值 第一步,计算总变异(Total Variation),它等于因变量的总平方和(Total Sum of Squares, TSS),表示因变量变异的总和。 第二步,计算回归变异(Regression Variation),它等于回归方程可以解释的平方和(Regression Sum of Squares, RSS),表示模型预测值与因变量平均值的差异。 第三步,用回归变异除以总变异,得到R²的值。
计算方法二:总离差平方和与回归离差平方和的比值 第一步,计算总离差平方和(Total Sum of Squares for Error, SSE),表示实际观测值与因变量平均值之间的差异总和。 第二步,计算回归离差平方和(Regression Sum of Squares, SSR),表示模型预测值与因变量实际值之间的差异总和。 第三步,从总离差平方和中减去回归离差平方和,得到可解释的变异。 第四步,将这个可解释的变异除以总离差平方和,得到R²。
在实际应用中,R²的值介于0和1之间,越接近1表明模型对数据的拟合度越好。R²为0则意味着模型无法解释任何因变量的变异。
总结来说,R²的计算是通过比较模型能够解释的变异与因变量总变异之间的比例来评估模型的拟合程度。在分析数据时,了解R²的大小有助于我们判断模型的优劣和预测能力。