Python Pandas-用某物替换数据帧中的双引号(";)
我正在为自己做一个小项目,我将两个csv文件与Python Pandas-用某物替换数据帧中的双引号(";),python,pandas,replace,concat,Python,Pandas,Replace,Concat,我正在为自己做一个小项目,我将两个csv文件与pd.concat() 如下图所示,在每个表i的数据中添加了双引号,并将“表1数据”、“表2数据”组合在一起 我想从csv文件中删除双引号,但使用时: df = df.replace('"', '', regex=True) 什么也没发生 如果我使用: df = df.replace('e', 'x', regex=True) 它很好用 这是我的密码: 将熊猫作为pd导入 导入xlrd 导入操作系统 从pathlib导入路径 导入csv
pd.concat()
如下图所示,在每个表i的数据中添加了双引号,并将“表1数据”、“表2数据”组合在一起
我想从csv文件中删除双引号,但使用时:
df = df.replace('"', '', regex=True)
什么也没发生
如果我使用:
df = df.replace('e', 'x', regex=True)
它很好用
这是我的密码:
将熊猫作为pd导入
导入xlrd
导入操作系统
从pathlib导入路径
导入csv
#我们从中读取的文件的路径
filename=os.path.join(“…”,“C:\\prosjekt\u lisensreport\\201902\u moduleslicensreport.xlsx”)
图纸名称=[0,1]
dfs=pd.read\u excel(文件名,
图纸名称=图纸名称)
pd.concat((df.assign(source=sheet)用于sheet,df在dfs.items()中),ignore_index=True)
def图纸到图纸df(文件名、图纸名称):
df_dict=pd.read_excel(文件名,sheetname=sheet_名称)
返回pd.concat(
(图纸的df.assign(),dfs.items()中的df),轴=1,连接='inner')
df=图纸到图纸df(文件名、图纸名称)
df=df.replace(“”,“”,regex=True)
df.to_csv('testResult.csv',sep=',encoding='utf-8')
您可以这样做,但它会将非字符串列转换为字符串列(请参阅):
如果你不在乎,你可以用
或者更简单,只需打开文件并用所需的字符替换所有双引号。无需将数据插入数据框即可
Best谢谢你的回答,但这仍然对数据帧没有任何影响。编辑了我的答案。该项目的目标是,我可以轻松筛选出特定列中所有具有正值的行,因此将所有列转换为字符串将以负面方式影响这一点。我还尝试了applymap()函数,但它对文件没有影响。您是否正确地重新分配了数据帧?我在帖子中犯了一个错误,现在已更正。顺便说一句,为什么不简单地删除文件中的所有双引号,而不是在DF中读取文件,然后更新DF?我想这是严重的隧道视觉的结果…一个好的旧文件。open()-replace-file.write()完成了魔术:)非常感谢@maxouille这里的帮助您可以打印数据帧的一部分并粘贴到这里进行调试吗?
for i, col in enumerate(df.columns):
df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')
df = df.applymap(lambda x: x.replace('"', ''))