Machine learning 如何找到MDP的最优线性基函数?

Machine learning 如何找到MDP的最优线性基函数?,machine-learning,artificial-intelligence,dynamic-programming,markov-chains,reinforcement-learning,Machine Learning,Artificial Intelligence,Dynamic Programming,Markov Chains,Reinforcement Learning,在给定一组基函数的情况下,有许多关于寻找线性逼近值函数的权向量的论文。 有关于如何求基函数的论文吗?有没有可能计算出最佳基函数来简洁地表示值函数?我不这么认为 基本上,您要寻找的是为您的数据自动找到正确的模型:即模型选择 除非您有一些信息支持某些强先验,否则您不可能自动找到最佳解决方案。通常,您将进行一些特征工程或采用贝叶斯方法在不同的假设之间进行选择

在给定一组基函数的情况下,有许多关于寻找线性逼近值函数的权向量的论文。 有关于如何求基函数的论文吗?有没有可能计算出最佳基函数来简洁地表示值函数?

我不这么认为

基本上,您要寻找的是为您的数据自动找到正确的模型:即模型选择

除非您有一些信息支持某些强先验,否则您不可能自动找到最佳解决方案。通常,您将进行一些特征工程或采用贝叶斯方法在不同的假设之间进行选择