Probability Matching

Boltzmann Exploration

  • 手柄的概率 $p(i)=\frac{\exp \frac{\bar{R}(i)}{\tau}}{\sum_{j=1}^N \exp \frac{\bar{R}(j)}{\tau}}$ #card
    image.png
作者

Ryen Xiang

发布于

2025-06-07

更新于

2025-06-07

许可协议


网络回响

评论