L1和L2正则的先验分布

[[MAP]] 公式 :-> logP(x,w)P(w)=logP(x,w)+logP(w){\log P(x,w)P(w) = \log P(x,w) + \log P(w)}

  • [[L2 Regularization]] 中参数先验分布 [[Normal Distribution]]
    + P(wj)P(w_j) :-> 1σ2πe(wj)22σ2\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(w_j)^{2}}{2 \sigma^{2}}}
    + logP(w)=logjP(wj)=logj[12πσe(wj)22σ2]\log P(w)=\log \prod_{j} P\left(w_{j}\right)= \log \prod_{j}\left[\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{\left(w_{j}\right)^{2}}{2 \sigma^{2}}}\right] :<-> 12σ2jwj2+C-\frac{1}{2 \sigma^{2}} \sum_{j} w_{j}^{2}+C
  • [[L1 Regularization]] 中参数先验分布 [[Laplace Distribution]]
    + P(wj)P\left(w_{j}\right) :-> 12aewja\frac{1}{\sqrt{2 a}} e^{\frac{\left|w_{j}\right|}{a}}
    + logP(w)=logjP(wj)=logj[12aσewja]\log P(w)=\log \prod_{j} P\left(w_{j}\right)=\log \prod_{j}\left[\frac{1}{\sqrt{2 a} \sigma} e^{-\frac{w_{j}}{a}}\right] :<-> 12ajwj+C-\frac{1}{2 a} \sum_{j}\left|w_{j}\right|+C
    id:: 3c341e2e-412f-4ca1-a4cb-d8175fdb21ad
作者

Ryen Xiang

发布于

2024-10-05

更新于

2024-10-05

许可协议


网络回响

评论