Python 导入csv文件，根据第一个标题计算平均值并创建图表_Python_Csv_Graph_Average

Python 导入csv文件，根据第一个标题计算平均值并创建图表

python csv graph

Python 导入csv文件，根据第一个标题计算平均值并创建图表,python,csv,graph,average,Python,Csv,Graph,Average,我有一个csv格式的列表，样式如下：阿尔图拉山脉 L10015,95.95 L10015,98.2 L10015,99.17 L10015,98.17 L10015,95.76 … L10025109.44 L10025116.87 L10025127.57 … L10035111.52 我想在Python3.x上导入这个csv列表（我使用的是Spyder），并计算每种类型行的平均ALTURA值（只要行的名称发生变化）。例如，L10015的平均值，L10025的平均值，L10035的平均值，

我有一个csv格式的列表，样式如下：

阿尔图拉山脉
L10015,95.95
L10015,98.2
L10015,99.17
L10015,98.17
L10015,95.76
…
L10025109.44
L10025116.87
L10025127.57
…
L10035111.52

我想在Python3.x上导入这个csv列表（我使用的是Spyder），并计算每种类型行的平均ALTURA值（只要行的名称发生变化）。例如，L10015的平均值，L10025的平均值，L10035的平均值，依此类推

这个文件有1759679行（包括标题），我认为Excel不是处理这些数据的最佳软件

我还想创建一个图，其中包含每条线（y轴）和每条线（x轴）的平均值

我做到了：

将熊猫作为pd导入
将matplotlib.pyplot作为plt导入
df=pd.read\u csv（r'C:\Users\..\Downloads\teste\u gama.csv'）
平均值1=df['ALTURA'].平均值（）
打印（'总算术平均值：'+str（平均值1））
groupby_means1=df.groupby（['Line']）.means（）
打印（'值的平均值，按行分组：'+str（按组平均值1））
df.groupby（“Line”）['ALTURA'].mean（）.plot（kind='bar'）

我想我能得到每行的平均值。但是，如何修复打印以垂直方向显示x标签并使其间距更大？是否有办法在值100中添加水平常量行？

作为第一个提示，我建议您使用pandas软件包加载您的csv。它将创建一个数据帧。使用函数

groupby

可以计算每组的平均值。请看这里：

要创建图表，一旦计算了平均值，就可以使用pandas的

plot

功能

那么您尝试了什么，它到底有什么问题？我会支持@jornsharpe所说的。Stack Overflow不是一个人们为你做所有工作的地方。这是激励非编程用户在Stack社区寻求帮助的好方法。谢谢你，Thombou。我只知道一些编程和检查熊猫文档的基础知识，这对我很有帮助。