python中缺少值的统计信息

python中缺少值的统计信息,python,pandas,numpy,Python,Pandas,Numpy,我有一个巨大的数据集,大约有23列。我想对第18列(以及其他许多列)进行描述性统计,但有许多缺少的值。我想知道,如果单元格不是缺失值,是否存在类似于SAS中的命令来计算统计信息。在我提供的图片中,我想计算第1、2、5列的描述性统计数据 我在每列中至少有1个N/a,因此我无法删除N/a 我尝试了以下方法 import numpy numpy.nanmean(df_14,axis=18) 但它没有起作用。顺便说一句,我刚开始使用Python Thxs,df.descripe()就可以了 在计算

我有一个巨大的数据集,大约有23列。我想对第18列(以及其他许多列)进行描述性统计,但有许多缺少的值。我想知道,如果单元格不是缺失值,是否存在类似于SAS中的命令来计算统计信息。在我提供的图片中,我想计算第1、2、5列的描述性统计数据

我在每列中至少有1个N/a,因此我无法删除N/a

我尝试了以下方法

import numpy 
numpy.nanmean(df_14,axis=18)
但它没有起作用。顺便说一句,我刚开始使用Python

Thxs,

df.descripe()
就可以了

在计算描述性统计信息时,默认情况下忽略NaN值

示例:直接取自

df.descripe()
就可以了

在计算描述性统计信息时,默认情况下忽略NaN值

示例:直接取自

考虑:

df = pd.DataFrame({ "a": [1,2,3,4,5],
                  "b":[5,4,3,2,24],
                  "c":[52,45,32,62,24]})
要获取统计信息,请使用
df.descripe()

如果您想获得有关数据集的信息,请使用
df.info()


范围索引:5个条目,0到4
数据列(共3列):
一个5非空的int64
b 5非空int64
c 5非空int64
数据类型:int64(3)
内存使用:200.0字节
没有一个
考虑:

df = pd.DataFrame({ "a": [1,2,3,4,5],
                  "b":[5,4,3,2,24],
                  "c":[52,45,32,62,24]})
要获取统计信息,请使用
df.descripe()

如果您想获得有关数据集的信息,请使用
df.info()


范围索引:5个条目,0到4
数据列(共3列):
一个5非空的int64
b 5非空int64
c 5非空int64
数据类型:int64(3)
内存使用:200.0字节
没有一个

如果您使用的是数据帧,则可以使用
df.mean()
(其中
df
是您的数据帧)取平均值。Pandas在取平均值时默认忽略NaN,还有
df.description
,如果您想快速收集一系列描述性统计数据,这会很方便。非常感谢!它工作得很好。如果您使用的是数据帧,那么您可以使用
df.mean()
(其中
df
是您的数据帧)获取平均值。Pandas在取平均值时默认忽略NaN,还有
df.description
,如果您想快速收集一系列描述性统计数据,这会很方便。非常感谢!它工作得很好。
              a        b          c
count  5.000000   5.0000   5.000000
mean   3.000000   7.6000  43.000000
std    1.581139   9.2358  15.231546
min    1.000000   2.0000  24.000000
25%    2.000000   3.0000  32.000000
50%    3.000000   4.0000  45.000000
75%    4.000000   5.0000  52.000000
max    5.000000  24.0000  62.000000
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
a    5 non-null int64
b    5 non-null int64
c    5 non-null int64
dtypes: int64(3)
memory usage: 200.0 bytes
None