Advertisement

统计学习精要 (Elements of Statistical Learning ) 习题 5.13

阅读量:

统计学习精要 (Elements of Statistical Learning ) 习题 5.13

You have fitted a smoothing spline \hat{f}_\lambda to a sample of N pairs (x_i, y_i). Suppose you augment your original sample with the pair x_0,\hat{f}_\lambda(x_0), and refit; describe the result. Use this to derive the N-fold cross-validation formula (5.26).

思路:

由于smoothing spline 最终还是带罚项的最小二乘线性回归,因此我在这里仅推导等价的岭回归的形式,为了写着方便。

\bar{X} = [X^T, x_0^T]^T\bar{y}=[y^T,y_0]^T,那么可以得到

若按题目说的y_0是重复fit的,则

代入上式可得

其中

因此代入上式可得

因此,重复refit得到的结果是一样的。

接下来设f(x_0) = x_0 \betaf(x_0)'=x_0\beta',那么

其中S_{00} = x_0 (\bar{X}^T \bar{X} + \lambda I)^{-1} x_0^T。所以f(x_0)' = \frac{f(x) - S_{00}y_0}{ 1 - S_{00} }

最后我们得到\sum_{i=1}^N (y_i - f^{-i}(x_i) )^2 = \sum_{i=1}^N (y_i - \frac{f(x)-S_{i}{i} y_i}{ 1- S_{ii} } )^2 = \sum_{i=1}^N ( \frac{y_i - f(x_i)}{1-S_{ii}} )^2

全部评论 (0)

还没有任何评论哟~