Machine learning 如何通过机器学习预测员工任务结束日期

Machine learning 如何通过机器学习预测员工任务结束日期,machine-learning,artificial-intelligence,non-linear-regression,Machine Learning,Artificial Intelligence,Non Linear Regression,下面如何预测,哪种算法最适合 员工有工作活动开始日期和结束日期(列)。 工作表中几乎没有其他列,例如工作复杂性(高和低)、每个活动的子任务数 如何预测开始日期的工作活动结束日期?必须使用哪种ML算法 这是一个现实的用例吗 谢谢 是的,这是一个现实的用例 如果您有一个带标签的数据平均值,您有一个工作表,其中现有任务的员工开始日期和结束日期是已知的,现在您想要预测任何新任务的结束日期,您可以使用多变量线性回归。 有关多变量线性回归的更多信息,请点击以下链接: 不管怎样,不要对这个理论感到困惑。简单

下面如何预测,哪种算法最适合

员工有工作活动开始日期和结束日期(列)。 工作表中几乎没有其他列,例如工作复杂性(高和低)、每个活动的子任务数

如何预测开始日期的工作活动结束日期?必须使用哪种ML算法

这是一个现实的用例吗


谢谢

是的,这是一个现实的用例

如果您有一个带标签的数据平均值,您有一个工作表,其中现有任务的员工开始日期和结束日期是已知的,现在您想要预测任何新任务的结束日期,您可以使用多变量线性回归。 有关多变量线性回归的更多信息,请点击以下链接:

不管怎样,不要对这个理论感到困惑。简单来说,线性回归是一种建模变量(列)之间关系的方法。单变量线性回归意味着,您试图仅使用一个变量(列)预测结束日期,即案例中的开始日期。如果要使用多个变量(列)预测结束日期,即开始日期、任务复杂性、子任务等;你必须使用多元线性回归。我使用的是房价预测模型

下面是使用python实现一个变量的线性回归,我们将仅使用一个变量预测房价:

import pandas as pd  #used for uploading your datasets #you have to import machine learning libraries
import numpy as np   #for array
from sklearn import linear_model  #for prediction

df = pd.read_csv('/content/MLPractical2 - Sheet1.csv')  #you need to upload your file
df
输出:我上传的文件,包含以下数据

面积| |价格

2600 | 555000

3000 | 565000

3200 | 610000

3600 | 680000

4000 | 725000

让我们对面积为3601的房价进行预测:

reg = linear_model.LinearRegression()
reg.fit(df[['Area']], df.Price)
reg.predict([[3601]])
输出:数组([669653.42465753])

我们仅根据一个变量(列)预测价格,即面积

正如您在我上传的文件中所看到的,面积为3600的房屋价格为680000,我们的算法预测的面积为3601的房屋价格为669653.42465753,非常接近

让我们看看使用python实现多变量线性回归;我们将使用多个变量来预测我们的房价

import pandas as pd                  #same as above
import numpy as np
from sklearn import linear_model
df = pd.read_csv('/content/ML_Sheet_2.csv')
df
输出:我在本例中上载的文件包含以下数据

面积| |卧室| | |年龄| | |价格

2600 | 3.0 | 20 | 550000

3000 | 4.0 | 15 | 565000

3200 | 3.0 | 18 | 610000

3600 | 3.0 | 30 | 595000

4000 | 5.0 | 8 | 760000

让我们预测一下房价,面积3500,3间卧室,10年楼龄

reg = linear_model.LinearRegression()
reg.fit(df[['Area', 'Bedroooms', 'Age']], df.Price)
reg.predict([[3500, 3, 10]])
输出:数组([717775])

我们根据三个变量预测房价,即面积、卧室数量和房屋年龄

正如您在我上传的文件中所看到的,面积为3200、3间卧室和18岁的房子的价格为610000,我们的算法预测的价格为3500(超过3200),3间卧室和10年楼龄为717775,这是非常接近和可以理解的,因为我们预测的房子面积大于3200,楼龄小于18岁(新房子价格更高)

同样,您也可以准备一份现有数据的excel表,并将其保存为.csv格式,然后像我一样继续操作。我正在使用GoogleColab编写代码;我希望您使用相同的:

希望这对你有帮助