求未知参数 θ,数据集是 D
将 θ 在 D 下的期望写成
- Eθ[θ∣D]=Ep(θ∣D)[θ∣D]=∫θp(θ∣D)dθ
如果取遍全部的数据集,期望可以写成
- Eθ[θ]=ED[Eθ[θ∣D]]=∫{∫θp(θ∣D)dθ}p(D)dD=∫θ{∫p(θ,D)dD}dθ=∫θp(θ)dθ=Ep(θ)[θ]
θ 的先验均值 Eθ[θ] = 后验均值在全部数据集下的期望 ED[Eθ[θ∣D]] 。
[[PRML/2.24]] 参数 θ 先验分布的方差等于参数 θ 后验分布方差的均值加上后验分布均值的方差
-
varθ[θ]=ED[varθ[θ∣D]]+varD[Eθ[θ∣D]]
-
在考虑了全部的数据集后,后验方差的均值总是小于等于先验方差。
ls-type:: annotation
hl-page:: 65
hl-color:: yellow
-
根据 2.24 可以推导出 varθ[θ]≥ED[varθ[θ∣D]],后验分布均值的方差总是大于等于 0
-
给定某个数据集时,参数 theta 的方差会小于等于给定数据集之前的方差。
试验越多,模型参数(后验)越准,方差越小。为什么不用先验而是用后验的原因。