L1 L2 Elastic Net
April 27, 2019
Lp 范数
\[||x||_p = (\sum_{i=1}^n|x_i|^p)^{\frac{1}{p}}\]称为Lp范数
L2 正则项
Ridge中:
\[\sum_{i=1}^n\theta^2\]为L2正则项
L1 正则项
LASSO中:
\[\sum_{i=1}^n|\theta|\]为L1正则项
Ln 正则项
\[\sum_{i=1}^m|\theta|^n\]L0 正则项
\[J(\theta) = MSE(y,\hat{y};\theta) + min\{number-of-non-zero-\theta\}\]其中的$min{number-of-non-zero-\theta}$代表theta中非零的个数尽可能小,称为L0正则项
实际上我们很少使用L0正则,实际用L1取代,因为L0正则的优化是个NP难的问题
弹性网 Elastic Net
\[J(\theta) = MSE(y,\hat{y};\theta) + r\alpha\sum_{i=1}^n|\theta_i| + \frac{1-r}{2}\alpha\sum_{i=1}^n\theta_i^2\]同时结合了岭回归和LASSO的优势
计算量足够应该优先选择岭回归,不足时优先选择弹性网