2024-10-05 2024-10-05 随手记 1 分钟读完 (大约159个字) 0次访问狄利克雷分布根据多项分布的形式 Mult(m1,m2,…,mK∣μ,N)=(Nm1m2…mK)∏k=1Kμkmk\operatorname{Mult}\left(m_1, m_2, \ldots, m_K \mid \boldsymbol{\mu}, N\right)=\left(\begin{array}{c}N \\ m_1 m_2 \ldots m_K\end{array}\right) \prod_{k=1}^K \mu_k^{m_k}Mult(m1,m2,…,mK∣μ,N)=(Nm1m2…mK)∏k=1Kμkmk ,所以 dirichlet 的 μ\muμ 应该是 μk\mu kμk 的指数形式 p(μ∣α)∝∏k=1Kμkαk−1p(\boldsymbol{\mu} \mid \boldsymbol{\alpha}) \propto \prod_{k=1}^K \mu_k^{\alpha_k-1}p(μ∣α)∝∏k=1Kμkαk−1 0⩽μk⩽10 \leqslant \mu_k \leqslant 10⩽μk⩽1 and ∑kμk=1\sum_k \mu_k=1∑kμk=1 α1,…,αK\alpha_1, \ldots, \alpha_Kα1,…,αK 是分布的参数 α\boldsymbol{\alpha}α denotes (α1,…,αK)T\left(\alpha_1, \ldots, \alpha_K\right)^{\mathrm{T}}(α1,…,αK)T 满足这一约束的全体 μ{\mu}μ 构成一个 K-1 维度的[[单纯形]] simplex Dir(μ∣α)=Γ(α0)Γ(α1)⋯Γ(αK)∏k=1Kμkαk−1\operatorname{Dir}(\boldsymbol{\mu} \mid \boldsymbol{\alpha})=\frac{\Gamma\left(\alpha_0\right)}{\Gamma\left(\alpha_1\right) \cdots \Gamma\left(\alpha_K\right)} \prod_{k=1}^K \mu_k^{\alpha_k-1}Dir(μ∣α)=Γ(α1)⋯Γ(αK)Γ(α0)∏k=1Kμkαk−1 α0=∑k=1Kαk\alpha_0=\sum_{k=1}^K \alpha_kα0=∑k=1Kαk 狄利克雷分布https://blog.xiang578.com/post/logseq/狄利克雷分布.html作者Ryen Xiang发布于2024-10-05更新于2024-10-05许可协议