Machine learning 家庭自动化的强化学习

Machine learning 家庭自动化的强化学习,machine-learning,unsupervised-learning,timetable,Machine Learning,Unsupervised Learning,Timetable,我遇到了一个问题,我必须自动化一些任务。比如说,根据用户在一周中的不同日子与设备的交互来打开和关闭设备 假设我们有一个灯泡B1和一个用户U1。开始时,U1将在他想要的时间打开和关闭灯泡B1。例如,他可能会在周日上午9:10打开,在周日上午11:15关闭。同样,如果我们将7天划分为5个时间单位,我们将得到2016个单位时间。我们的系统必须学习每5分钟一次的用户行为,学习2周后,按照用户的要求打开或关闭灯泡 你认为它可以通过基于再实施的学习技术来实现吗?还有其他机器学习算法的建议吗 这基本上是一个家

我遇到了一个问题,我必须自动化一些任务。比如说,根据用户在一周中的不同日子与设备的交互来打开和关闭设备

假设我们有一个灯泡B1和一个用户U1。开始时,U1将在他想要的时间打开和关闭灯泡B1。例如,他可能会在周日上午9:10打开,在周日上午11:15关闭。同样,如果我们将7天划分为5个时间单位,我们将得到2016个单位时间。我们的系统必须学习每5分钟一次的用户行为,学习2周后,按照用户的要求打开或关闭灯泡

你认为它可以通过基于再实施的学习技术来实现吗?还有其他机器学习算法的建议吗


这基本上是一个家庭自动化与机器学习大学项目。

阅读您的问题时,我的第一个直觉是尝试贝叶斯推理方法,使用单位时间上的均匀分布作为先验,用户行为作为证据。可以找到一个很好的视觉解释。另外,你可以看看这个。

如果我明白了,你想说的是使用贝叶斯方法。为每个机组分配1/2016的概率?然后将每个用户事件视为证据并在过程中进行更新?请您再解释一下好吗?是的,但请记住这只是第一个想法。如果你的前科是统一的,你的后科将受到你的证据的高度影响。一种简单的建模方法是,在2周的学习周期内,计算用户每次打开(例如)灯的时间单位。将每个计数除以观测总数,生成概率质量函数。它的采样应该以某种方式模仿用户的行为。如果您想从不同的Previor开始,可以查看初始响应中的链接。