Python 在使用scikit学习训练线性回归模型后,如何对原始数据集中不存在的新数据点进行预测?
我正在学习线性回归,我用scikit编写了这个线性回归代码,在进行预测之后,如何对原始数据集中没有的新数据点进行预测 在这个数据集中,你会根据人们的工作经验得到他们的工资 例如,具有15年工作经验的人员的预测工资应为[167005.32889087] 这是我的密码Python 在使用scikit学习训练线性回归模型后,如何对原始数据集中不存在的新数据点进行预测?,python,machine-learning,scikit-learn,linear-regression,Python,Machine Learning,Scikit Learn,Linear Regression,我正在学习线性回归,我用scikit编写了这个线性回归代码,在进行预测之后,如何对原始数据集中没有的新数据点进行预测 在这个数据集中,你会根据人们的工作经验得到他们的工资 例如,具有15年工作经验的人员的预测工资应为[167005.32889087] 这是我的密码 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.linear_model import LinearReg
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
data = pd.read_csv('project_1_dataset.csv')
X = data.iloc[:,0].values.reshape(-1,1)
Y = data.iloc[:,1].values.reshape(-1,1)
linear_regressor = LinearRegression()
linear_regressor.fit(X,Y)
Y_pred = linear_regressor.predict(X)
plt.scatter(X,Y)
plt.plot(X, Y_pred, color = 'red')
plt.show()
在使用现有数据集对模型进行拟合和训练后(即在
线性回归器.fit(X,Y)
之后),您可以以相同的方式在新实例中进行预测:
new_prediction = linear_regressor.predict(new_data)
print(new_prediction)
其中new_data
是您的新数据点
如果您想对特定的随机新数据点进行预测,上述方法应该足够了。如果您的新数据点属于另一个数据帧,那么您可以用包含要预测的新实例的相应数据帧替换
new\u data
。只需将该值传递给linear\u regressor.fit
。@fischmalte能否请您更详细地说明如何进一步操作?我不是这方面的专家?谢谢