Python 如果一个json blob/对象包含来自的文件名/路径,并且外部文件包含已知的重复项,那么我需要删除整个json blob/对象

Python 如果一个json blob/对象包含来自的文件名/路径,并且外部文件包含已知的重复项,那么我需要删除整个json blob/对象,python,json,pandas,Python,Json,Pandas,如何去掉以“{”filename:“\\network\test\etc\file0001.tif”开头并以}]}结尾的字符串 对象的长度取决于文件的大小和内容 我开始了解python中的dataframes/pandas,但我还不了解一般的json结构 import pandas as pd df = pd.read_json('Filelist.json') --ColA in the index = "filename" (Need help here)-- dups = pd.read_

如何去掉以“{”filename:“\\network\test\etc\file0001.tif”开头并以}]}结尾的字符串

对象的长度取决于文件的大小和内容

我开始了解python中的dataframes/pandas,但我还不了解一般的json结构

import pandas as pd
df = pd.read_json('Filelist.json')
--ColA in the index = "filename" (Need help here)--
dups = pd.read_csv('Deleted_Duplicates.csv')

df_final = df.loc[~df.ColA.isin(dups.Duplicates),:]

df_final.to_json('Filelist_NoDupes.csv',index=False)

我希望我可以忽略文件名所在的列,使用外部列表删除整个行/对象并输出新文件。

您需要找出正确的转义,因为您没有可测试的工作示例,但它将是这样的:

df_final = df.loc[~df.ColA.str.match(pat = '\{"filename"\: "\\\\network\\test\\etc\\file0001.tif.*\}\]\}\]\}') ,:]

听起来像是一个经典的正则表达式问题。您可以在这里找到很多想法:。另外,有一个示例json文件也会很有帮助。