csv文件中的pandas/numpy算术平均值_Numpy_Pandas_Average_Mean

csv文件中的pandas/numpy算术平均值

numpy pandas

csv文件中的pandas/numpy算术平均值,numpy,pandas,average,mean,Numpy,Pandas,Average,Mean,我有一个csv文件，它包含3000行和5列，每周都有更多的行附加到它我想做的是每周找出最后1000行最后一列的算术平均值。（因此，当每周向其中添加新行时，只需取最近1000行的平均值）我应该如何构建pandas或numpy阵列来实现这一点 df = pd.read_csv(fds.csv, index_col=False, header=0) df_1 = df['Results'] #How should I write the next line of codes to get the

我有一个csv文件，它包含3000行和5列，每周都有更多的行附加到它

我想做的是每周找出最后1000行最后一列的算术平均值。（因此，当每周向其中添加新行时，只需取最近1000行的平均值）

我应该如何构建pandas或numpy阵列来实现这一点

df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']
#How should I write the next line of codes to get the average for the most 1000 rows?

我的

pandas

安装在一台不同的机器上，所以我使用内存，但我认为您需要做的是

df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']
#Let's pretend your 5th column has a name (header) of `Stuff`
last_thousand = df_1.tail(1000)
np.mean(last_thousand.Stuff)

所以基本上我需要使用熊猫尾巴函数。我下面的代码可以工作

df = pd.read_csv(fds.csv, index_col=False, header=0)
df_1 = df['Results']    
numpy.average(df_1.tail(1000))

使用以下命令可以更快一点：

结果将包含最后1000行中每列的平均值。如果需要更多统计信息，还可以使用：

，您应该利用

pandas

的

tails

功能抓取最后1000行。谢谢！我知道头部和尾部的功能。但我没想到我能这样使用它。谢谢，马特，酷。如果下面的答案对你有帮助，一定要接受它（或者如果有人发布了更好的答案）。

df = pd.read_csv("fds.csv", header = 0)
results = df.tail(1000).mean()

resutls = df.tail(1000).describe().unstack()