Beta 分布
例子 [[@PRML Note 前十一章]] 2-006
ls-type:: annotation
hl-page:: 62
hl-color:: purple
以及 ((654bb13c-db71-49d4-ad0e-123ec812c258))
-
[[二项分布]] 概率函数
-
结合 Beta 先验分布,根据[[贝叶斯公式]]后验分布有
-
-
n 和 m 都是已知
-
超参数 a 和 b 是先验中时间发生的次数和不发生的次数,a+b就是有效观察次数
-
根据这个公式可以看出先验对后验的影响
-
-
-
根据 后验分布也服从 Beta 分布
-
根据
得到事件发生的概率期望等于事件发生次数除以总次数 -
二项分布中 预测的分布就是
-
-
l = N-m,后验中时间不发生的次数
-
次数增加,m 和 N 值会变大,当趋于无穷时,a 和 b 可以忽略。
-
试验次数少,受先验影响大,反之相反。
-
试验次数多到一定程度后,先验几乎没有影响,后验估计和极大似然估计趋于一致。
-
-
-
-
2-008
ls-type:: annotation
hl-page:: 63
hl-color:: purple
[[Bayesian Online Learning]] ((654e45e1-d673-4eeb-806f-9334ee4ee3d9))-
a+b 值越大,u 取值越集中。根据
a和趋于无穷时,u 的方差趋于 0。对应试验次数越多,u 的取值越集中,不确定(方差)越小。- 下图是 beta 分布概率密度曲线
-
+ [\[\[试验次数和后验分布的关系\]\]](/post/logseq/%E8%AF%95%E9%AA%8C%E6%AC%A1%E6%95%B0%E5%92%8C%E5%90%8E%E9%AA%8C%E5%88%86%E5%B8%83%E7%9A%84%E5%85%B3%E7%B3%BB.html) 随着试验次数的增加(数据集的变大),未知参数的取值越来越集中?
ls-type:: annotation
hl-page:: 63
hl-color:: yellow
+ 随着试验次数的增加,后验分布的不确定性会越来越小?
ls-type:: annotation
hl-page:: 63
hl-color:: yellow
+ 答案是:在一般情况下,理论上的确有这样的趋势,但对于某些特定的数据集则不一定。
ls-type:: annotation
hl-page:: 63
hl-color:: yellow