Python 错误“无法将字符串转换为浮点:'INLAND'”

Python 错误“无法将字符串转换为浮点:'INLAND'”,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我正在做一个用机器学习预测房价的项目,我想把它提交给一家私人公司申请 我在Jupiter笔记本上为这个项目工作,但是我无法修复关于将字符串转换为数字数据的错误 from sklearn.model_selection import train_test_split X_train,X_test, Y_train, Y_test= train_test_split(X, Y,

我正在做一个用机器学习预测房价的项目,我想把它提交给一家私人公司申请

我在Jupiter笔记本上为这个项目工作,但是我无法修复关于将字符串转换为数字数据的错误

from sklearn.model_selection import train_test_split
X_train,X_test, Y_train, Y_test= train_test_split(X,
                                              Y,
                                             test_size=0.2,
                                               random_state=0)
from sklearn.preprocessing import StandardScaler
independent_scalar = StandardScaler()
X_train = independent_scalar.fit_transform (X_train) #fit and transform
X_test = independent_scalar.transform (X_test) # only transform
print(X_train)

我希望训练集数据完全是数字的

我相信您拥有的数据集中有字符串。StandardScaler仅获取数字数据并标准化值

要将文本转换为数字数据,您可以查看sklearn.feature_extraction.text中的函数。根据您的数据,您可以查看最适合的功能。CountVectorizer和TfidfVectorizer是最常用的矢量器。计数矢量器基于字袋算法,TFIDF矢量器基于TF-IDF


要知道要使用哪个函数,如果我们知道数据集是什么样子,那就更容易了。

请至少向我们显示一个链接或您正在使用的数据集的前几行。还有,错误发生在哪里。你认为在你的标题中请帮助我解决这个问题会增加标题的描述质量吗?