csv文件中的pandas/numpy算术平均值
我有一个csv文件,它包含3000行和5列,每周都有更多的行附加到它 我想做的是每周找出最后1000行最后一列的算术平均值。(因此,当每周向其中添加新行时,只需取最近1000行的平均值) 我应该如何构建pandas或numpy阵列来实现这一点csv文件中的pandas/numpy算术平均值,numpy,pandas,average,mean,Numpy,Pandas,Average,Mean,我有一个csv文件,它包含3000行和5列,每周都有更多的行附加到它 我想做的是每周找出最后1000行最后一列的算术平均值。(因此,当每周向其中添加新行时,只需取最近1000行的平均值) 我应该如何构建pandas或numpy阵列来实现这一点 df = pd.read_csv(fds.csv, index_col=False, header=0) df_1 = df['Results'] #How should I write the next line of codes to get the
df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']
#How should I write the next line of codes to get the average for the most 1000 rows?
我的
pandas
安装在一台不同的机器上,所以我使用内存,但我认为您需要做的是
df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']
#Let's pretend your 5th column has a name (header) of `Stuff`
last_thousand = df_1.tail(1000)
np.mean(last_thousand.Stuff)
所以基本上我需要使用熊猫尾巴函数。我下面的代码可以工作
df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']
numpy.average(df_1.tail(1000))
使用以下命令可以更快一点: 结果将包含最后1000行中每列的平均值。如果需要更多统计信息,还可以使用:
,您应该利用
pandas
的tails
功能抓取最后1000行。谢谢!我知道头部和尾部的功能。但我没想到我能这样使用它。谢谢,马特,酷。如果下面的答案对你有帮助,一定要接受它(或者如果有人发布了更好的答案)。
df = pd.read_csv("fds.csv", header = 0)
results = df.tail(1000).mean()
resutls = df.tail(1000).describe().unstack()