Python 3.x 为选定的主步骤分析和创建新数据集

Python 3.x 为选定的主步骤分析和创建新数据集,python-3.x,Python 3.x,我有一个巨大的数据文件,每个列的标题都是字符串。在这17列中,第2列有MainSteps,我想用它来绘制其余列中的参数。例如: column1 column2 cloumn3 column4 column5 column6 column7 ...... num1 Mainstep1 num3 num5 num7 num2 Mainstep1 num4 num6 ... ... ...

我有一个巨大的数据文件,每个列的标题都是字符串。在这17列中,第2列有
MainSteps
,我想用它来绘制其余列中的参数。例如:

column1 column2     cloumn3    column4    column5   column6   column7 ......
num1    Mainstep1    num3       num5       num7
num2    Mainstep1    num4       num6       ...
...     ...          ...        ...        ...

...     Mainstep2    ...       ...         ...
要求是根据
Mainstep1
进行解析,然后从csv文件中仅获取该
Mainstep1
的所有参数。使用这些参数,在
column1
column3
column5
column6
之间绘图

我是编程新手。有时我很难找到程序员用来提问的准确词汇。请询问是否需要澄清问题的含义


首选输出是打印与特定
Mainstep
对应的x轴和y轴两个参数的所有数据。我希望我能澄清这个问题。

下面使用熊猫这样的方法对你有用吗

import pandas as pd

my_df = pd.read_csv('/location/to/so_sample.csv', sep='\t')
filtered_df = my_df[my_df.column2=='Mainstep1']
基本上,过滤的_df将包含column2为Mainstep1的所有行。你可以打电话

filtered_df.column1
filtered_df.column3
获取所需的行集以绘制图表