Machine learning 关于推荐系统的DQN
我想在零售业推荐系统中使用DQN 但问题是,这个问题的状态空间是时间不均匀的&不是确定性的 (与Atari游戏相比) 我想出了两种解决这个问题的方法Machine learning 关于推荐系统的DQN,machine-learning,deep-learning,recommendation-engine,q-learning,Machine Learning,Deep Learning,Recommendation Engine,Q Learning,我想在零售业推荐系统中使用DQN 但问题是,这个问题的状态空间是时间不均匀的&不是确定性的 (与Atari游戏相比) 我想出了两种解决这个问题的方法 使状态转换变得确定性 使用历史数据计算转移概率,使用转移状态概率 但是……这两种说法似乎都没有道理 这样的人 如果我想建立一个基于强化学习的推荐系统 我应该从哪里开始
- 使状态转换变得确定性
- 使用历史数据计算转移概率,使用转移状态概率