Python 线性回归打印预测值_Python_Linear Regression_Valueerror

Python 线性回归打印预测值

python

Python 线性回归打印预测值,python,linear-regression,valueerror,Python,Linear Regression,Valueerror,我有一个购物中心数据集，我用k=5运行k-means。现在，在我运行线性回归之后，我想打印我的预测值Y，以便与Y的实际值进行比较。打印实际值非常容易，但在我尝试打印预测值Y时，我一直会出错。要打印预测值，我使用了df=pd.DataFrame（{'actual'：Y_test，'predicted'：Y_pred}）。但是我得到一个错误ValueError:数组长度35与索引长度18不匹配代码：它应该是y\u pred=regressor.predict（X\u test），这样您就可以根据

我有一个购物中心数据集，我用k=5运行k-means。现在，在我运行线性回归之后，我想打印我的预测值Y，以便与Y的实际值进行比较。打印实际值非常容易，但在我尝试打印预测值Y时，我一直会出错。要打印预测值，我使用了

df=pd.DataFrame（{'actual'：Y_test，'predicted'：Y_pred}）

。但是我得到一个错误

ValueError:数组长度35与索引长度18不匹配
代码：
它应该是y\u pred=regressor.predict（X\u test）
，这样您就可以根据相同长度的y\u test检查它了谢谢您的工作！如果您想将其作为upvote的答案发布，并作为正确答案进行投票，则应该是y\u pred=regressor.predict（X\u test），以便您可以将其与相同长度的y\u test进行对比检查谢谢您！如果您想将其作为答案发布到upvote，并作为正确答案进行投票
df = pd.read_csv('D:\Mall_Customers.csv', usecols = ['Spending Score (1-100)', 'Annual Income (k$)'])


x = StandardScaler().fit_transform(df)


kmeans = KMeans(n_clusters=5, max_iter=100, random_state=0)
y_kmeans= kmeans.fit_predict(x)

df0 = df[df.index.isin(mydict[0].tolist())]
Y = df0['Spending Score (1-100)']
X = df0[[ 'Annual Income (k$)','Age']]

from sklearn.model_selection import train_test_split
X_train, X_test, y_train,y_test = train_test_split(X, Y, test_size = 0.5, random_state = 0)

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)

r_sq = regressor.score(X, Y)
print('coefficient of determination:', r_sq)


print('intercept:', regressor.intercept_)
print('slope:', regressor.coef_)


y_pred = regressor.predict(X)

df = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
print(df)