Machine learning 机器学习模型don';无法处理连续数据

Machine learning 机器学习模型don';无法处理连续数据,machine-learning,scikit-learn,regression,random-forest,logistic-regression,Machine Learning,Scikit Learn,Regression,Random Forest,Logistic Regression,我试图建立一个机器学习模型,根据棒球运动员的击球率和命中率预测棒球运动员的平均击球率。自: Batting Average = Hits/At Bats 我认为这种关系相对比较容易发现。但是,由于击球平均值是浮动的(即0.300),因此我尝试的所有型号都返回以下错误: ValueError: Unknown label type: 'continuous' 我用的是SKL模型。我试过逻辑回归,随机森林分类,线性回归。他们都有同样的问题 通过阅读其他有关此错误的StackOverflow帖子,

我试图建立一个机器学习模型,根据棒球运动员的击球率和命中率预测棒球运动员的平均击球率。自:

Batting Average = Hits/At Bats
我认为这种关系相对比较容易发现。但是,由于击球平均值是浮动的(即0.300),因此我尝试的所有型号都返回以下错误:

ValueError: Unknown label type: 'continuous'
我用的是SKL模型。我试过逻辑回归,随机森林分类,线性回归。他们都有同样的问题

通过阅读其他有关此错误的StackOverflow帖子,我开始这样做:

lab_enc = preproccessing.LabelEncoder()
y = pd.DataFrame(data=lab_enc.fit_transform(y))
这似乎改变了值,比如0.227到136,这对我来说很奇怪。可能只是因为我不太明白转换在做什么。如果可能的话,我宁愿只使用实际的击球平均值


在预测连续值时,是否有方法获得我尝试使用的模型?

您试图解决的问题属于回归(即数值预测)环境,并且它肯定可以通过ML算法处理

我用的是SKL模型。我试过逻辑回归,随机森林分类,线性回归。他们都有同样的问题

您在这里提到的前两个算法(逻辑回归和随机森林分类器)用于分类问题,因此适合您的(回归)设置(它们预期会产生您提到的错误)。然而,线性回归是合适的,在这里应该可以很好地工作


首先,请坚持线性回归,以便说服自己它确实能够处理问题;随后,您可以扩展到其他scikit学习算法,如RandomForestRegressionor等。如果您遇到任何问题,请使用特定的代码和错误打开一个新问题。

谢谢您的回复。当我使用LinearRegression时,会出现以下错误:“ValueError:不支持continuous”。同样的错误也适用于RandomForestRegressionor。@VirtuallyRealistic如我所说,既然您已经可以缩小问题的范围(即,您知道您尝试过的一些模型确实不适用),请1)接受答案2)打开一个新的问题并提供详细信息(你在这里提到的错误与你在帖子中提到的错误甚至不一样)