Machine learning （如何）我可以对已经看到的数据使用强化学习？_Machine Learning_Reinforcement Learning

Machine learning （如何）我可以对已经看到的数据使用强化学习？

machine-learning

Machine learning （如何）我可以对已经看到的数据使用强化学习？,machine-learning,reinforcement-learning,Machine Learning,Reinforcement Learning,大多数教程和RL课程侧重于教授如何将模型（如Q-Learning）应用于环境（健身房环境）。可以输入状态以获得一些输出/奖励在无法获取新数据的情况下，如何将RL用于历史数据？（例如，从海量拍卖数据集中，如何使用RL导出最佳策略）如果数据集是由时间序列构成的，则可以将时间的每个瞬间设置为您的状态。然后，您可以让您的代理浏览数据系列，以便通过它学习策略如果您的数据集已经标记了动作，您可以通过它训练代理学习这些动作背后的策略诀窍是为你的代理提供每一个连续的时间瞬间，就像它在实时探索一样当然，您

大多数教程和RL课程侧重于教授如何将模型（如Q-Learning）应用于环境（健身房环境）。可以输入状态以获得一些输出/奖励

在无法获取新数据的情况下，如何将RL用于历史数据？（例如，从海量拍卖数据集中，如何使用RL导出最佳策略）

如果数据集是由时间序列构成的，则可以将时间的每个瞬间设置为您的状态。然后，您可以让您的代理浏览数据系列，以便通过它学习策略

如果您的数据集已经标记了动作，您可以通过它训练代理学习这些动作背后的策略

诀窍是为你的代理提供每一个连续的时间瞬间，就像它在实时探索一样

当然，您需要根据每个时刻的信息对不同的状态进行建模