Python 线性回归打印预测值
我有一个购物中心数据集,我用k=5运行k-means。现在,在我运行线性回归之后,我想打印我的预测值Y,以便与Y的实际值进行比较。打印实际值非常容易,但在我尝试打印预测值Y时,我一直会出错。要打印预测值,我使用了Python 线性回归打印预测值,python,linear-regression,valueerror,Python,Linear Regression,Valueerror,我有一个购物中心数据集,我用k=5运行k-means。现在,在我运行线性回归之后,我想打印我的预测值Y,以便与Y的实际值进行比较。打印实际值非常容易,但在我尝试打印预测值Y时,我一直会出错。要打印预测值,我使用了df=pd.DataFrame({'actual':Y_test,'predicted':Y_pred})。但是我得到一个错误ValueError:数组长度35与索引长度18不匹配 代码: 它应该是y\u pred=regressor.predict(X\u test),这样您就可以根据
df=pd.DataFrame({'actual':Y_test,'predicted':Y_pred})
。但是我得到一个错误ValueError:数组长度35与索引长度18不匹配
代码:
它应该是y\u pred=regressor.predict(X\u test)
,这样您就可以根据相同长度的y\u test检查它了谢谢您的工作!如果您想将其作为upvote的答案发布,并作为正确答案进行投票,则应该是y\u pred=regressor.predict(X\u test)
,以便您可以将其与相同长度的y\u test进行对比检查谢谢您!如果您想将其作为答案发布到upvote,并作为正确答案进行投票
df = pd.read_csv('D:\Mall_Customers.csv', usecols = ['Spending Score (1-100)', 'Annual Income (k$)'])
x = StandardScaler().fit_transform(df)
kmeans = KMeans(n_clusters=5, max_iter=100, random_state=0)
y_kmeans= kmeans.fit_predict(x)
df0 = df[df.index.isin(mydict[0].tolist())]
Y = df0['Spending Score (1-100)']
X = df0[[ 'Annual Income (k$)','Age']]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train,y_test = train_test_split(X, Y, test_size = 0.5, random_state = 0)
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)
r_sq = regressor.score(X, Y)
print('coefficient of determination:', r_sq)
print('intercept:', regressor.intercept_)
print('slope:', regressor.coef_)
y_pred = regressor.predict(X)
df = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
print(df)