Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/336.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 关于pandas value_counts函数的说明_Python_Pandas - Fatal编程技术网

Python 关于pandas value_counts函数的说明

Python 关于pandas value_counts函数的说明,python,pandas,Python,Pandas,有人能解释一下这句话的意思吗 result = data.apply(pd.value_counts).fillna(0) 你住在这里吗 import pandas as pd from pandas import Series, DataFrame data = DataFrame({'Qu1': [1, 3, 4, 3, 4], 'Qu2': [2, 3, 1, 2, 3], 'Qu3': [1, 5, 2,

有人能解释一下这句话的意思吗

result = data.apply(pd.value_counts).fillna(0)  
你住在这里吗

import pandas as pd 
from pandas import Series, DataFrame

data = DataFrame({'Qu1': [1, 3, 4, 3, 4],
                  'Qu2': [2, 3, 1, 2, 3],
                  'Qu3': [1, 5, 2, 4, 4]})

result = data.apply(pd.value_counts).fillna(0)  

In [26]:data
Out[26]:
Qu1 Qu2 Qu3
0 1 2 1
1 3 3 5
2 4 1 2
3 3 2 4
4 4 3 4

In [27]:result
Out[28]:
Qu1 Qu2 Qu3
1 1 1 1
2 0 2 1
3 2 2 0
4 2 0 2
5 0 0 1

从文档中,它生成非空值的直方图。只要看一下
结果
列Qu1
,我们就可以知道原始列
数据中有一个1、零2、两个3、两个4和零5。Qu1

我认为理解发生了什么的最简单方法是将其分解

每列一次,value_counts仅统计序列中每个值的出现次数(即,in 4在Qu1列中出现两次):

当您执行应用时,每列都会与其他结果重新对齐,因为1到5之间的每一个值都会被看到,所以它与
范围(1,6)
对齐:

您希望将未看到的值计数为0而不是NaN,因此fillna:

In [13]: pd.value_counts(data.Qu1).reindex(range(1, 6)).fillna(0)
Out[13]:
1    1
2    0
3    2
4    2
5    0
dtype: float64
执行“应用”时,它将为每列显示执行此操作的结果:

In [14]: pd.concat((pd.value_counts(data[col]).reindex(range(1, 6)).fillna(0)
                       for col in data.columns),
                   axis=1, keys=data.columns)
Out[14]:
   Qu1  Qu2  Qu3
1    1    1    1
2    0    2    1
3    2    2    0
4    2    0    2
5    0    0    1

非常感谢。我不熟悉直方图这个术语,否则它就很清楚了。很遗憾,示例值没有帮助。
In [13]: pd.value_counts(data.Qu1).reindex(range(1, 6)).fillna(0)
Out[13]:
1    1
2    0
3    2
4    2
5    0
dtype: float64
In [14]: pd.concat((pd.value_counts(data[col]).reindex(range(1, 6)).fillna(0)
                       for col in data.columns),
                   axis=1, keys=data.columns)
Out[14]:
   Qu1  Qu2  Qu3
1    1    1    1
2    0    2    1
3    2    2    0
4    2    0    2
5    0    0    1