Python 导入csv文件,根据第一个标题计算平均值并创建图表

Python 导入csv文件,根据第一个标题计算平均值并创建图表,python,csv,graph,average,Python,Csv,Graph,Average,我有一个csv格式的列表,样式如下: 阿尔图拉山脉 L10015,95.95 L10015,98.2 L10015,99.17 L10015,98.17 L10015,95.76 … L10025109.44 L10025116.87 L10025127.57 … L10035111.52 我想在Python3.x上导入这个csv列表(我使用的是Spyder),并计算每种类型行的平均ALTURA值(只要行的名称发生变化)。例如,L10015的平均值,L10025的平均值,L10035的平均值,

我有一个csv格式的列表,样式如下:

阿尔图拉山脉
L10015,95.95
L10015,98.2
L10015,99.17
L10015,98.17
L10015,95.76

L10025109.44
L10025116.87
L10025127.57

L10035111.52

我想在Python3.x上导入这个csv列表(我使用的是Spyder),并计算每种类型行的平均ALTURA值(只要行的名称发生变化)。例如,L10015的平均值,L10025的平均值,L10035的平均值,依此类推

这个文件有1759679行(包括标题),我认为Excel不是处理这些数据的最佳软件

我还想创建一个图,其中包含每条线(y轴)和每条线(x轴)的平均值

我做到了:

将熊猫作为pd导入
将matplotlib.pyplot作为plt导入
df=pd.read\u csv(r'C:\Users\..\Downloads\teste\u gama.csv')
平均值1=df['ALTURA'].平均值()
打印('总算术平均值:'+str(平均值1))
groupby_means1=df.groupby(['Line']).means()
打印('值的平均值,按行分组:'+str(按组平均值1))
df.groupby(“Line”)['ALTURA'].mean().plot(kind='bar')
我想我能得到每行的平均值。但是,如何修复打印以垂直方向显示x标签并使其间距更大?是否有办法在值100中添加水平常量行?

作为第一个提示,我建议您使用pandas软件包加载您的csv。 它将创建一个数据帧。使用函数
groupby
可以计算每组的平均值。 请看这里:


要创建图表,一旦计算了平均值,就可以使用pandas的
plot
功能

那么您尝试了什么,它到底有什么问题?我会支持@jornsharpe所说的。Stack Overflow不是一个人们为你做所有工作的地方。这是激励非编程用户在Stack社区寻求帮助的好方法。谢谢你,Thombou。我只知道一些编程和检查熊猫文档的基础知识,这对我很有帮助。