Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/vba/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 检查部分行是否与数据集中的行匹配_Python_Dataset_Match - Fatal编程技术网

Python 检查部分行是否与数据集中的行匹配

Python 检查部分行是否与数据集中的行匹配,python,dataset,match,Python,Dataset,Match,我有一个数据库,其中包括一系列汽车品牌、型号和大量垃圾以及其他一些干净的信息。我还有一个关于大多数汽车品牌和型号的数据库,我想检查这些品牌和型号是否出现在脏线中,并用品牌和型号替换它们 我或多或少是Python新手,所以如果能得到一些支持就好了。让我们把这两个文件称为Dirty和Clean。您可以有一个通过Dirty索引的循环,然后在该循环中有另一个通过clean索引的循环,以查看您正在搜索的行是否存在 如果该行确实存在于Clean中,则将其写入名为NEWDATABASE的新文件中,如果不存在,

我有一个数据库,其中包括一系列汽车品牌、型号和大量垃圾以及其他一些干净的信息。我还有一个关于大多数汽车品牌和型号的数据库,我想检查这些品牌和型号是否出现在脏线中,并用品牌和型号替换它们


我或多或少是Python新手,所以如果能得到一些支持就好了。

让我们把这两个文件称为Dirty和Clean。您可以有一个通过Dirty索引的循环,然后在该循环中有另一个通过clean索引的循环,以查看您正在搜索的行是否存在

如果该行确实存在于Clean中,则将其写入名为NEWDATABASE的新文件中,如果不存在,则写入Dirty中已经存在的内容


如果你能更具体地回答你的问题,并提供这些行是什么样子的,我可以提供更多帮助。

谢谢。这些线条看起来像“大众高尔夫+1.2 TSI 105 PK DSG Automatch CLIMA/CRUISE/PDC清洁数据”,我想要“大众高尔夫+1.2清洁数据”。这是一个相当大的文件,超过50万行。我仍然不明白你在问什么。你能在你的问题上非常具体并给出详细的例子吗?我有一个数据库,里面有超过50万条脏线,比如“大众高尔夫+1.2 TSI 105 PK DSG Automatch CLIMA/CRUISE/PDC”,然后是一个标签,然后是一些干净的数据。此外,我有一个数据集,有清晰的线条,比如“大众高尔夫+”。我想用干净的行替换脏行,并在制表符后保留干净的数据。