Machine learning 关于推荐系统的DQN

Machine learning 关于推荐系统的DQN,machine-learning,deep-learning,recommendation-engine,q-learning,Machine Learning,Deep Learning,Recommendation Engine,Q Learning,我想在零售业推荐系统中使用DQN 但问题是,这个问题的状态空间是时间不均匀的&不是确定性的 (与Atari游戏相比) 我想出了两种解决这个问题的方法 使状态转换变得确定性 使用历史数据计算转移概率,使用转移状态概率 但是……这两种说法似乎都没有道理 这样的人 如果我想建立一个基于强化学习的推荐系统 我应该从哪里开始

我想在零售业推荐系统中使用DQN

但问题是,这个问题的状态空间是时间不均匀的&不是确定性的

(与Atari游戏相比)

我想出了两种解决这个问题的方法

  • 使状态转换变得确定性
  • 使用历史数据计算转移概率,使用转移状态概率
但是……这两种说法似乎都没有道理

这样的人

如果我想建立一个基于强化学习的推荐系统

我应该从哪里开始