Grid 用交替概率生成二维网格
我想根据Falk和Konald在论文中定义的交替概率生成一个二维网格环境,其中奖励是分布式的(1是奖励,0是没有奖励) 其基本思想是,一旦一个随机方块被播种(比如左上角)为1或0,那么相邻方块保持与前一个相同的概率,或者说切换的概率,由交替概率给出 本文描述了从Grid 用交替概率生成二维网格,grid,2d,probability-density,Grid,2d,Probability Density,我想根据Falk和Konald在论文中定义的交替概率生成一个二维网格环境,其中奖励是分布式的(1是奖励,0是没有奖励) 其基本思想是,一旦一个随机方块被播种(比如左上角)为1或0,那么相邻方块保持与前一个相同的概率,或者说切换的概率,由交替概率给出 本文描述了从左到右和上到下的生成过程。我不清楚作者打算如何实现它 算法: 种子左上角方块 从左到右:从1,1开始——以集合概率交替 自上而下:从1,1开始——与集合概率交替 获得奖励矩阵
左到右
和上到下
的生成过程。我不清楚作者打算如何实现它
算法:
- 种子左上角方块
- 从左到右:从1,1开始——以集合概率交替
- 自上而下:从1,1开始——与集合概率交替
- 获得奖励矩阵