Machine learning (如何)我可以对已经看到的数据使用强化学习?

Machine learning (如何)我可以对已经看到的数据使用强化学习?,machine-learning,reinforcement-learning,Machine Learning,Reinforcement Learning,大多数教程和RL课程侧重于教授如何将模型(如Q-Learning)应用于环境(健身房环境)。可以输入状态以获得一些输出/奖励 在无法获取新数据的情况下,如何将RL用于历史数据?(例如,从海量拍卖数据集中,如何使用RL导出最佳策略)如果数据集是由时间序列构成的,则可以将时间的每个瞬间设置为您的状态。然后,您可以让您的代理浏览数据系列,以便通过它学习策略 如果您的数据集已经标记了动作,您可以通过它训练代理学习这些动作背后的策略 诀窍是为你的代理提供每一个连续的时间瞬间,就像它在实时探索一样 当然,您

大多数教程和RL课程侧重于教授如何将模型(如Q-Learning)应用于环境(健身房环境)。可以输入状态以获得一些输出/奖励


在无法获取新数据的情况下,如何将RL用于历史数据?(例如,从海量拍卖数据集中,如何使用RL导出最佳策略)

如果数据集是由时间序列构成的,则可以将时间的每个瞬间设置为您的状态。然后,您可以让您的代理浏览数据系列,以便通过它学习策略

如果您的数据集已经标记了动作,您可以通过它训练代理学习这些动作背后的策略

诀窍是为你的代理提供每一个连续的时间瞬间,就像它在实时探索一样

当然,您需要根据每个时刻的信息对不同的状态进行建模