Python 如何获取数据帧列中由逗号分隔的值的频率计数?

Python 如何获取数据帧列中由逗号分隔的值的频率计数?,python,pandas,dataframe,Python,Pandas,Dataframe,假设我正在尝试创建一些stackoverflow元数据的计数向量(实际上不是我正在做的,而是类似的)。因此,数据帧可能看起来像这样: question: description: tags: Q1 desc1 java, android Q2 desc2 python, machine learning Q3 desc3 javascript, No

假设我正在尝试创建一些stackoverflow元数据的计数向量(实际上不是我正在做的,而是类似的)。因此,数据帧可能看起来像这样:

question:    description:      tags:
Q1           desc1             java, android
Q2           desc2             python, machine learning
Q3           desc3             javascript, Node.js
如果我想创建一个包含每个标签的频率计数,而不是标签的组合,我将如何做

<>我知道我可以使用<代码> df.GROPBY('TAGE]).CONTUTE()/CUT>,但是这只会考虑<代码> java、Android < /C> >,而不是考虑<代码> java < /C> >,而“Android是单独的类别”。

< P> >可以使用RexEX代码>,S++/Cube >逗号,一个或多个空白,然后根据创建系列和最后获取计数:

您可以使用by regex
,s\+
作为带有一个或多个空格的逗号,然后创建
系列
by和最后一次获取计数by:


成功了。谢谢我有一些直觉,我可以在某种程度上使用
split
,但不确定具体是如何使用的。这是有效的。谢谢我有一些直觉,我可以以某种方式使用
split
,但不确定具体如何使用。
out = df['tags'].str.split(',\s+', expand=True).stack().value_counts()
print (out)
python              1
javascript          1
machine learning    1
java                1
android             1
Node.js             1
dtype: int64