Tuesday, July 5, 2016

线性回归中的error uncorrelate要求

在线性回归模型中通常要求uncorrelated error,一旦error出现相关性,则最终的拟合结果并不能令人满意,而这样的情况通常出现于time series类数据中。所以对于这样的观察值,一定要去做有关time series的residual plot以观察是否由于时间数据的相关性造成了拟合直线图形的变异。

Plots of residuals from simulated time series data sets generated with differing levels of correlation $\rho$
between error terms for adjacent time points.
以上三个图形中,$\rho$代现error的彼此相关性。

另一个要求是:the error terms have a constant variance, $Var(\epsilon_i)=\sigma^2$. 对于non-constant variances in the errors, or heteroscedasticity,如果在residual plot图中出现了funnel shape的形状时,那说明error variance的一致性出现问题。对于这种情形,我们可以通过对因变量Y施加凹形函数,将突出的residual plot图形往回拉平。这样的函数有$logY, \sqrt{Y}$等。


No comments:

Post a Comment