Python 从数据框中的列标题修剪字符串的一部分

Python 从数据框中的列标题修剪字符串的一部分,python,pandas,data-cleaning,Python,Pandas,Data Cleaning,我正在处理一个从.csv文件导入的熊猫数据框,该文件大约有18列。每列都有一个项目名称和一个html格式的图像描述作为列标题。是这样的: A <img width="300" alt="A" height="300".jpg">` ` B <img width="400" alt="B" height="600".jpg"`...... 任何帮助都将不胜感激。我将使用正则表达式 df.columns = df.columns.str.replace('\s*<.*&

我正在处理一个从.csv文件导入的熊猫数据框,该文件大约有18列。每列都有一个项目名称和一个html格式的图像描述作为列标题。是这样的:

A  <img width="300" alt="A" height="300".jpg">`  ` B <img width="400" alt="B" height="600".jpg"`......

任何帮助都将不胜感激。

我将使用正则表达式

df.columns = df.columns.str.replace('\s*<.*>\s*$', '')
df.columns=df.columns.str.replace('\s*\s*$,'')

我会使用正则表达式

df.columns = df.columns.str.replace('\s*<.*>\s*$', '')
df.columns=df.columns.str.replace('\s*\s*$,'')

如果您不熟悉正则表达式,也可以尝试:

df.rename(columns=lambda x: x.split(' ')[0], inplace=True)

假设您想要的输出和不想要的输出之间总是有一个空格。

如果您不熟悉正则表达式,您也可以尝试:

df.rename(columns=lambda x: x.split(' ')[0], inplace=True)
假设在你想要的输出和你不想要的输出之间总是有一个空间