Beta 分布

Beta(μa,b)=Γ(a+b)Γ(a)Γ(b)μa1(1μ)b1\operatorname{Beta}(\mu \mid a, b)=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \mu^{a-1}(1-\mu)^{b-1}

E[μ]=aa+b\mathbb{E}[\mu]=\frac{a}{a+b}
var[μ]=ab(a+b)2(a+b+1)\operatorname{var}[\mu]=\frac{a b}{(a+b)^2(a+b+1)}

例子 [[@PRML Note 前十一章]] 2-006
ls-type:: annotation
hl-page:: 62
hl-color:: purple
以及 ((654bb13c-db71-49d4-ad0e-123ec812c258))

  • [[二项分布]] 概率函数

    • p(mN,μ)=CNmμm(1μ)Nmp(m \mid N, \mu)=C_N^m \mu^m(1-\mu)^{N-m}
  • 结合 Beta 先验分布,根据[[贝叶斯公式]]后验分布有

    • p(μm,N,a,b)p(mN,μ)p(μa,b)=CNmμm(1μ)NmΓ(a+b)Γ(a)Γ(b)μa1(1μ)b1μm+a1(1μ)Nm+b1\begin{aligned} p(\mu \mid m, N, a, b) & \propto p(m \mid N, \mu) p(\mu \mid a, b) \\ & =C_N^m \mu^m(1-\mu)^{N-m} \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \mu^{a-1}(1-\mu)^{b-1} \\ & \propto \mu^{m+a-1}(1-\mu)^{N-m+b-1}\end{aligned}

      • n 和 m 都是已知

      • 超参数 a 和 b 是先验中时间发生的次数和不发生的次数,a+b就是有效观察次数

      • 根据这个公式可以看出先验对后验的影响

  • 根据 p(μm,l,a,b)=Γ(m+a+l+b)Γ(m+a)Γ(l+b)μm+a1(1μ)l+b1p(\mu \mid m, l, a, b)=\frac{\Gamma(m+a+l+b)}{\Gamma(m+a) \Gamma(l+b)} \mu^{m+a-1}(1-\mu)^{l+b-1} 后验分布也服从 Beta 分布

    • 根据 E[μ]=aa+b\mathbb{E}[\mu]=\frac{a}{a+b}
      得到事件发生的概率期望等于事件发生次数除以总次数

    • 二项分布中 p(x=1D)p(x=1 \mid D) 预测的分布就是 E[μD]\mathrm{E}[\mu \mid D]

      • p(x=1D)=E[μD]=m+aN+a+b=m+am+a+l+bp(x=1 \mid D)=\mathrm{E}[\mu \mid D]=\frac{m+a}{N+a+b}=\frac{m+a}{m+a+l+b}

      • l = N-m,后验中时间不发生的次数

      • 次数增加,m 和 N 值会变大,当趋于无穷时,a 和 b 可以忽略。

        • 试验次数少,受先验影响大,反之相反。

        • 试验次数多到一定程度后,先验几乎没有影响,后验估计和极大似然估计趋于一致。

  • 2-008
    ls-type:: annotation
    hl-page:: 63
    hl-color:: purple
    [[Bayesian Online Learning]] ((654e45e1-d673-4eeb-806f-9334ee4ee3d9))

    • a+b 值越大,u 取值越集中。根据 var[μ]=ab(a+b)2(a+b+1)\operatorname{var}[\mu]=\frac{a b}{(a+b)^2(a+b+1)}
      a和趋于无穷时,u 的方差趋于 0。对应试验次数越多,u 的取值越集中,不确定(方差)越小。

      • 下图是 beta 分布概率密度曲线

image.png

+ [\[\[试验次数和后验分布的关系\]\]](/post/logseq/%E8%AF%95%E9%AA%8C%E6%AC%A1%E6%95%B0%E5%92%8C%E5%90%8E%E9%AA%8C%E5%88%86%E5%B8%83%E7%9A%84%E5%85%B3%E7%B3%BB.html) 随着试验次数的增加(数据集的变大),未知参数的取值越来越集中?

ls-type:: annotation
hl-page:: 63
hl-color:: yellow

  + 随着试验次数的增加,后验分布的不确定性会越来越小?

ls-type:: annotation
hl-page:: 63
hl-color:: yellow

  + 答案是:在一般情况下,理论上的确有这样的趋势,但对于某些特定的数据集则不一定。

ls-type:: annotation
hl-page:: 63
hl-color:: yellow

作者

Ryen Xiang

发布于

2024-10-05

更新于

2024-10-05

许可协议


网络回响

评论