Python 将数据帧转换为numpy值

Python 将数据帧转换为numpy值,python,pandas,numpy,Python,Pandas,Numpy,我有以下数据集: df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID')) 现在我想做的是将标记类别转换为如下所示的numpy数组 df = df[['Tag']] tags = df.values 然而,这给了我 [['Tree'] ['Tree, Hug']] 当我在寻找 [['Tree'] ['Tree', 'Hug']] 你有没有想过我该怎么做 >>> impor

我有以下数据集:

df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID'))
现在我想做的是将标记类别转换为如下所示的numpy数组

df = df[['Tag']]
tags = df.values
然而,这给了我

[['Tree']
 ['Tree, Hug']]
当我在寻找

[['Tree']
 ['Tree', 'Hug']]
你有没有想过我该怎么做

>>> import pandas as pd
>>> df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID'))
>>> [ x.split(', ') for row in df[['Tag']].values for x in row ]
[['Tree'], ['Tree', 'Hug']]

小心使用
split
调用。由于原始字符串有一个空格,因此必须在此处拆分
,'

要保留所有内容,您可以使用
apply
迭代
标记
列,并使用
tolist
进行转换

df.Tag.apply(lambda x: [s.strip() for s in x.split(',')]).tolist()

[['Tree'], ['Tree', 'Hug']]