Python 从数据集获取列名_Python_Pandas_Data Cleaning

Python 从数据集获取列名

python pandas

Python 从数据集获取列名,python,pandas,data-cleaning,Python,Pandas,Data Cleaning,我试图从脏数据集中获取列名。列名的名称开始于符号=。有没有一种快速的方法可以在不循环所有数据的情况下做到这一点？看起来您正在读取第一行作为标题名。在read_csv方法中，传递参数header=None。用于设置列名： missing_values=["n/a", "na", "--"] df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values, header=None) df.col

我试图从脏数据集中获取列名。列名的名称开始于符号=。有没有一种快速的方法可以在不循环所有数据的情况下做到这一点？

看起来您正在读取第一行作为标题名。在read_csv方法中，传递参数header=None。用于设置列名：

missing_values=["n/a", "na", "--"]
df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values, header=None)

df.columns = df.loc[0].str.split('=').str[0].values

请尝试df.columns=df.columns.str.split'='。str[0]df.columns=[col.strip for col in df.loc[0]。str.split'='。str[0]。values]我使用strip删除列名前的空格

missing_values=["n/a", "na", "--"]
df = pd.read_csv("data/data_bestand_3.txt", sep="&", na_values=missing_values, header=None)

df.columns = df.loc[0].str.split('=').str[0].values