Python 3.x 在al列中查找最常见的字符串

Python 3.x 在al列中查找最常见的字符串,python-3.x,pandas,dataframe,Python 3.x,Pandas,Dataframe,df每列有许多不同的值 我想将df分组在每列的most COMMON字符串之后,并将字符串及其频率存储到字典中 Values 0 99;3;;Sicherheitstür (0SS4.2) bei Anfang Boxen... 1 100;3;;Sicherheitstür (0SS4.2) bei Anfang Boxe... 3 145;3;;Sicherheitstür (0SS3b.5) bei Einspeisef... 4 95;3;;

df每列有许多不同的值 我想将df分组在每列的most COMMON字符串之后,并将字符串及其频率存储到字典中

     Values          
0   99;3;;Sicherheitstür (0SS4.2) bei Anfang Boxen...
1   100;3;;Sicherheitstür (0SS4.2) bei Anfang Boxe...
3   145;3;;Sicherheitstür (0SS3b.5) bei Einspeisef...
4   95;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
5   96;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
6   30;3;;Anlage ausgeschaltet (Schlüsselschalter ...
7   37;3;;Sicherheitsbereich 5 (Paketierung) ausge...
12  1400;2;;Entladeförderer (Pos. 730) -Handbetrie...
13  1404;2;;Stauförderer 2 (Pos. 1130) -Handbetrie...
14  1401;2;;Bretterzerteiler (Pos. 1060) -Handbetr...
15  1431;2;;Stauförderer 2 (Pos. 1130) -Handbetrie...
17  1402;2;;Ausrichtrollgang (Pos. 1110) -Handbetr...
18  1403;2;;Stauförderer 1 (Pos. 1120) -Handbetrie...
19  1406;2;;Lagenklemmung (Pos. 1140) -Handbetrieb...
20  1402;2;;Ausrichtrollgang (Pos. 1110) -Handbetr..


到目前为止,我只能以简单的形式对df进行分组


{Sicherheitstür: 5, Ausrichtrollgang: 2, ....


您可以使用以下工具创建词典:

new_data = df["a"].value_counts().to_dict()
这将为您提供字数和字数,然后您可以按以下方式进行排序:

mydict = df["a"].value_counts().to_dict()
或:

有关排序的更多方法,请查看


对于一个简单的问题,您可以看一看。

我如何只能按大多数公共字符串进行选择?新字典的新数据按值计数排序,最常见的字符串将从顶部开始。如果要选择前10个字符串,可以使用new_data=df[“a”]。value_counts()[0:10]。to_dict()
mydict = df["a"].value_counts().to_dict()
for key in sorted(mydict):
    print "%s: %s" % (key, mydict[key])
from collections import OrderedDict
ordereddict = OrderedDict(sorted(mydict.items(), key=lambda t: t[0]))