Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/281.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用来自旧数据帧的信息预测新Python数据帧中列的值_Python_Machine Learning_Predict - Fatal编程技术网

如何使用来自旧数据帧的信息预测新Python数据帧中列的值

如何使用来自旧数据帧的信息预测新Python数据帧中列的值,python,machine-learning,predict,Python,Machine Learning,Predict,假设有两个数据帧df1和df2。在df1中,我有几个列,如userid、sexid、location等。在df2中,我有与df1中相同的列,除了sexid,我需要使用一些预测算法来填充。 我只是一个初学者,我尝试了另一种问题。因此,欢迎任何有助于我破解它的建议或有用的参考资料。一个简单的例子: import pandas as pd from sklearn.linear_model import LogisticRegression df1 = pd.DataFrame({'sexid':

假设有两个数据帧df1和df2。在df1中,我有几个列,如userid、sexid、location等。在df2中,我有与df1中相同的列,除了sexid,我需要使用一些预测算法来填充。 我只是一个初学者,我尝试了另一种问题。因此,欢迎任何有助于我破解它的建议或有用的参考资料。

一个简单的例子:

import pandas as pd
from sklearn.linear_model import LogisticRegression

df1 = pd.DataFrame({'sexid': list('MMFFMFFMMF'), 'x1': [0, 12, 2, 3, 4, 2, 0, 12, 12, 12], 'x2': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1]})

df2 = pd.DataFrame({'x1': [0, 12, 2, 3, 4, 2, 0, 12, 12, 12], 'x2': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1]})

X = df1[['x1', 'x2']]
y = df1['sexid']

model = LogisticRegression()

model.fit(X, y)

model.predict(df2)
返回:

array(['F', 'M', 'F', 'F', 'M', 'F', 'F', 'M', 'M', 'M'], dtype=object)

我强烈建议您阅读。

如果您不知道这些个体的特征(即,如果您的模型中没有数据),您将如何预测
df2
中的
sexid
)?哦,我搞混了一些东西。在我的
df2
中,我还有
df1
中的所有列,我只是没有
sexid
,因为我需要预测它。我将编辑我的帖子。感谢您指出我的错误:)查看sklearn包文档可能是一个好的开始(在您的情况下,您需要一个分类器)