Beta 分布

[[概率密度函数]] #card

  • Beta(μa,b)=Γ(a+b)Γ(a)Γ(b)μa1(1μ)b1\operatorname{Beta}(\mu \mid a, b)=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \mu^{a-1}(1-\mu)^{b-1}
  • Γ\Gamma 是 [[gamma函数]]

期望 #card

  • E[μ]=aa+b\mathbb{E}[\mu]=\frac{a}{a+b}

方差 #card

  • var[μ]=ab(a+b)2(a+b+1)\operatorname{var}[\mu]=\frac{a b}{(a+b)^2(a+b+1)}

和 [[二项分布]] 的区别 #card

  • 二项分布对成功次数 x 进行建模
  • beta 分布对成功概率 p 进行建模

image.png

  • a 和 b 对分布图像的影响 #card
    • 随着 α\alpha 的增加(成功事件增多),概率分布的大部分将向右移动。
    • 另一方面,β\beta 的增加会使分布向左移动(更多失败事件)。
    • 同样,如果我们同时确定 α\alphaβ\beta 都增加,则分布将变窄。

例子 [[@PRML Note 前十一章]] ((654bb131-7217-4196-8e32-dc425539ca08)) 以及 ((654bb13c-db71-49d4-ad0e-123ec812c258))

  • [[二项分布]] 概率函数
    • p(mN,μ)=CNmμm(1μ)Nmp(m \mid N, \mu)=C_N^m \mu^m(1-\mu)^{N-m}
  • 结合 Beta 先验分布,根据[[贝叶斯公式]]后验分布有
    • p(μm,N,a,b)p(mN,μ)p(μa,b)=CNmμm(1μ)NmΓ(a+b)Γ(a)Γ(b)μa1(1μ)b1μm+a1(1μ)Nm+b1\begin{aligned} p(\mu \mid m, N, a, b) & \propto p(m \mid N, \mu) p(\mu \mid a, b) \\ & =C_N^m \mu^m(1-\mu)^{N-m} \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \mu^{a-1}(1-\mu)^{b-1} \\ & \propto \mu^{m+a-1}(1-\mu)^{N-m+b-1}\end{aligned}
      • n 和 m 都是已知
      • 超参数 a 和 b 是先验中时间发生的次数和不发生的次数,a+b就是有效观察次数
      • 根据这个公式可以看出先验对后验的影响
  • 根据 p(μm,l,a,b)=Γ(m+a+l+b)Γ(m+a)Γ(l+b)μm+a1(1μ)l+b1p(\mu \mid m, l, a, b)=\frac{\Gamma(m+a+l+b)}{\Gamma(m+a) \Gamma(l+b)} \mu^{m+a-1}(1-\mu)^{l+b-1} 后验分布也服从 Beta 分布
    • 根据 ((654badd6-1934-41fd-9dd5-fc2af14017e6)) 得到事件发生的概率期望等于事件发生次数除以总次数
    • 二项分布中 p(x=1D)p(x=1 \mid D) 预测的分布就是 E[μD]\mathrm{E}[\mu \mid D]
      • p(x=1D)=E[μD]=m+aN+a+b=m+am+a+l+bp(x=1 \mid D)=\mathrm{E}[\mu \mid D]=\frac{m+a}{N+a+b}=\frac{m+a}{m+a+l+b}
      • l = N-m,后验中时间不发生的次数
      • 次数增加,m 和 N 值会变大,当趋于无穷时,a 和 b 可以忽略。
        • 试验次数少,受先验影响大,反之相反。
        • 试验次数多到一定程度后,先验几乎没有影响,后验估计和极大似然估计趋于一致。
  • ((654cf203-7d16-4d26-bd9d-9f2b852689be)) [[Bayesian Online Learning]] ((654e45e1-d673-4eeb-806f-9334ee4ee3d9))
    • a+b 值越大,u 取值越集中。根据 ((654badf6-f52a-4efa-bbbc-88f2d90b9f6b)) a和趋于无穷时,u 的方差趋于 0。对应试验次数越多,u 的取值越集中,不确定(方差)越小。#card
      • 下图是 beta 分布概率密度曲线
        image.png
    • [[试验次数和后验分布的关系]] ((654cf374-0985-47e2-8102-6b1b507d5a5b)) #card
      • ((654cf369-2af9-47ae-89dc-93b509f6cedc))
      • ((654cf389-98f0-484d-bd63-73b9e4c08879))

[[@例子:概率的概率]]

[[不同 beta 分布形状]]

网络回响

作者

Ryen Xiang

发布于

2025-06-26

更新于

2026-02-17

许可协议


评论