Python Groupby和frequency count未返回正确的值
我正在使用此代码对公司进行分组和频率计数。然而,返回的结果并没有将这些公司分组Python Groupby和frequency count未返回正确的值,python,pandas,Python,Pandas,我正在使用此代码对公司进行分组和频率计数。然而,返回的结果并没有将这些公司分组 freq = df.groupby(['company'])['recruitment'].size() I got some result similar to this. recruitment company Data Co 3 Data Co 8 Apple Co 3 Apple Co 6 我有两个问题:
freq = df.groupby(['company'])['recruitment'].size()
I got some result similar to this.
recruitment
company
Data Co 3
Data Co 8
Apple Co 3
Apple Co 6
我有两个问题:
如果公司名称看起来是“相同的”,那么前面或后面都有空格,我也在添加大写的convert all to大写
freq = df.groupby(df['company'].str.strip().str.upper())['recruitment'].size()
如果公司名称看起来是“相同的”,那么前面或后面都有空格,我也在添加大写的convert all to大写
freq = df.groupby(df['company'].str.strip().str.upper())['recruitment'].size()
如果看不到您的实际数据,就无法判断,但我猜您的公司名称可能会有细微差异,例如尾随空格或隐藏字符。这对我来说很好。。。请包含数据框中的一些示例数据,但groupby应该可以工作。关于你的第二个问题,也许你需要的是
reset_index()
你的freq-df,然后freq.columns
。没有看到你的实际数据就无法判断,但我猜你的公司名称可能会有细微的差异,比如尾随空格或隐藏字符。这对我来说很好。。。请包含数据框中的一些示例数据,但groupby应该可以工作。关于第二个问题,可能您需要的是reset_index()
freq-df,然后freq.columns
。