Python 按行分组整数并将其放入逻辑回归模型序列误差_Python_Machine Learning_Encoding_Logistic Regression

Python 按行分组整数并将其放入逻辑回归模型序列误差

python machine-learning encoding

Python 按行分组整数并将其放入逻辑回归模型序列误差,python,machine-learning,encoding,logistic-regression,Python,Machine Learning,Encoding,Logistic Regression,我是一个模型制作的初学者，我有一个关于逻辑回归模型的问题我想预测客户转化率，我想根据用户id对客户的旅程进行分组，然后将旅程作为X值，将转化率作为y。但是，当我这样做时，我会得到错误： ValueError:使用序列设置数组元素就我所知，逻辑模型不可能将序列作为输入正确吗为了澄清，接触点是不同接触点的字符串，例如谷歌、付费搜索、活动1和有机搜索。我标记了编码，因为模型不能接受字符串，然后按照上面所示进行分组 from sklearn.preprocessing import LabelEn

我是一个模型制作的初学者，我有一个关于逻辑回归模型的问题

我想预测客户转化率，我想根据用户id对客户的旅程进行分组，然后将旅程作为X值，将转化率作为y。但是，当我这样做时，我会得到错误：

ValueError:使用序列设置数组元素

就我所知，逻辑模型不可能将序列作为输入正确吗

为了澄清，接触点是不同接触点的字符串，例如谷歌、付费搜索、活动1和有机搜索。我标记了编码，因为模型不能接受字符串，然后按照上面所示进行分组

from sklearn.preprocessing import LabelEncoder
# integer encode
le = LabelEncoder()
df['touchpoints_id'] = le.fit_transform(df['touchpoints'])

google,organic,winkel,Organic Search           1
Unknown,email,automation,E-mail - Automation    2

df=df.groupby('jid').agg({'conversion':'sum', 'path': lambda 
x:`x.str.strip().tolist()}).reset_index()`

User ID   Touchpoints   Conversion
    1           87, 87       1
    2            31          0
    3           1             1

那么，我的理解是否正确呢。我不应该把它们分组，而是把它们单独当作int

像这样：

User id   Touchpoints  Conversion
1           87          0
1           87           0
2           37           0
3           1           1

X= np.array(df['touchpoints'])
y= np.array(df['conversion'])

提前谢谢