Python 读取文件时,函数中显示意外值
我正在处理csv数据。当我使用pandas读取csv文件并找到平均值时,它附带了一个额外的数字开始 正确答案:87.98 当我打印时:97 87.98 97是数据的第一个条目(在A1处)。表中从A1到A100的所有数字都没有标题和数字列 为什么会这样?如何卸下97部件Python 读取文件时,函数中显示意外值,python,pandas,Python,Pandas,我正在处理csv数据。当我使用pandas读取csv文件并找到平均值时,它附带了一个额外的数字开始 正确答案:87.98 当我打印时:97 87.98 97是数据的第一个条目(在A1处)。表中从A1到A100的所有数字都没有标题和数字列 为什么会这样?如何卸下97部件 file = pd.read_csv("malnutrition.csv") meanD = file.mean() print("\nPeople with malnutrition's IQ average: " + str
file = pd.read_csv("malnutrition.csv")
meanD = file.mean()
print("\nPeople with malnutrition's IQ average: " + str(meanD))
还有,我如何显示数据?喜欢R中的视图
谢谢数据帧。mean()
返回一个系列
,其中索引是原始数据帧的列标签,值是这些列的平均值。即使file
是一栏数据帧,您仍然会返回一个序列,因为一栏数据帧不是一个序列
import pandas as pd
import numpy as np
np.random.seed(42)
df = pd.DataFrame(np.random.randint(1, 10, 100))
print(df.mean())
0 5.32
#| |
#| Mean of column `0`
#|
#Col label
而是使用返回标量的Series.mean()
print(df[0].mean())
5.32
但您的数据还有一些其他问题。您正在读取第一个值作为标头,这是您不想要的。此外,当您只有一列时,不需要数据帧。所以你想要
s = pd.read_csv('malnutrition.csv', header=None, squeeze=True) # Should be a Series
print(s.mean())
您可以编辑您的问题以显示csv的格式吗?这可能意味着第一个值位于不同的列中。请打印文件以检查DataFrame的结构。它认为
97
是您的列标题。请尝试pd.read\u csv(“detrominate.csv”,header=None)