Python 在使用scikit学习训练线性回归模型后,如何对原始数据集中不存在的新数据点进行预测?

Python 在使用scikit学习训练线性回归模型后,如何对原始数据集中不存在的新数据点进行预测?,python,machine-learning,scikit-learn,linear-regression,Python,Machine Learning,Scikit Learn,Linear Regression,我正在学习线性回归,我用scikit编写了这个线性回归代码,在进行预测之后,如何对原始数据集中没有的新数据点进行预测 在这个数据集中,你会根据人们的工作经验得到他们的工资 例如,具有15年工作经验的人员的预测工资应为[167005.32889087] 这是我的密码 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.linear_model import LinearReg

我正在学习线性回归,我用scikit编写了这个线性回归代码,在进行预测之后,如何对原始数据集中没有的新数据点进行预测

在这个数据集中,你会根据人们的工作经验得到他们的工资

例如,具有15年工作经验的人员的预测工资应为[167005.32889087]

这是我的密码

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

data = pd.read_csv('project_1_dataset.csv')

X = data.iloc[:,0].values.reshape(-1,1)

Y = data.iloc[:,1].values.reshape(-1,1)

linear_regressor = LinearRegression()

linear_regressor.fit(X,Y)

Y_pred = linear_regressor.predict(X)

plt.scatter(X,Y)
plt.plot(X, Y_pred, color = 'red')
plt.show()

在使用现有数据集对模型进行拟合和训练后(即在
线性回归器.fit(X,Y)
之后),您可以以相同的方式在新实例中进行预测:

new_prediction = linear_regressor.predict(new_data)
print(new_prediction)
其中
new_data
是您的新数据点


如果您想对特定的随机新数据点进行预测,上述方法应该足够了。如果您的新数据点属于另一个数据帧,那么您可以用包含要预测的新实例的相应数据帧替换
new\u data

只需将该值传递给
linear\u regressor.fit
。@fischmalte能否请您更详细地说明如何进一步操作?我不是这方面的专家?谢谢