Machine learning 直接或间接的培训经验类型

Machine learning 直接或间接的培训经验类型,machine-learning,Machine Learning,我有个问题 在机器学习中,我们为培训体验定义了两种类型: 直接和间接的 我找了很多关于差异的东西,但都找不到。有人熟悉这些吗 提前感谢汤姆·米切尔在他的书中解释如下(见第5页第1.2.1节): 例如,在学习游戏时,系统可能会从直接的训练示例中学习,这些示例包括各个跳棋棋盘状态和每个棋盘的正确移动。或者,它可能只有间接信息,包括动作序列和各种游戏的最终结果。在后一种情况下,关于游戏早期特定动作正确性的信息必须从游戏最终胜负的事实中间接推断出来 他还说: 在这里[使用间接反馈]学习者面临一个额外的问

我有个问题

在机器学习中,我们为培训体验定义了两种类型:

直接和间接的

我找了很多关于差异的东西,但都找不到。有人熟悉这些吗

提前感谢

汤姆·米切尔在他的书中解释如下(见第5页第1.2.1节):

例如,在学习游戏时,系统可能会从直接的训练示例中学习,这些示例包括各个跳棋棋盘状态和每个棋盘的正确移动。或者,它可能只有间接信息,包括动作序列和各种游戏的最终结果。在后一种情况下,关于游戏早期特定动作正确性的信息必须从游戏最终胜负的事实中间接推断出来

他还说:

在这里[使用间接反馈]学习者面临一个额外的问题,即学分分配,或者确定序列中的每个动作在多大程度上应该为最终结果获得学分或责备。信贷分配可能是一个特别困难的问题,因为即使在早期的行动是最佳的情况下,如果随后的行动是糟糕的,游戏也可能失败。因此,从直接培训反馈中学习通常比从间接反馈中学习更容易


多少钱是很多?快速的谷歌搜索会给我显示大量的结果,但我需要一个答案,为什么最大熵是有用的,而我却找不到。因为最大熵显示出更多的杂质,这是不好的