Python 使用Pandas,我是否可以检测固定列中的错误元素并返回该值?

Python 使用Pandas,我是否可以检测固定列中的错误元素并返回该值?,python,pandas,nlp,Python,Pandas,Nlp,我对熊猫不熟悉。我的目标是检测固定列中的错误元素并返回该行值 下面是示例场景 45美元是国家栏中的错误元素。所以我想检测这个值并在我的程序中返回可能的行号。我的第一个想法是创建一个列表并与之匹配,或者我需要在这里搜索NLP解决方案。请帮我解决这个问题有些答案取决于您希望如何验证未来。您是否正在查找任何包含数字的值或任何不属于预期国家/地区的值?安装并导入该值,然后执行以下代码: [i.name for i in list(pycountry.countries)] 这将为您提供所有国家/地区的

我对熊猫不熟悉。我的目标是检测固定列中的错误元素并返回该行值 下面是示例场景


45美元是国家栏中的错误元素。所以我想检测这个值并在我的程序中返回可能的行号。我的第一个想法是创建一个列表并与之匹配,或者我需要在这里搜索NLP解决方案。请帮我解决这个问题

有些答案取决于您希望如何验证未来。您是否正在查找任何包含数字的值或任何不属于预期国家/地区的值?

安装并导入该值,然后执行以下代码:

[i.name for i in list(pycountry.countries)]
这将为您提供所有国家/地区的列表

张贴此检查哪些国家在列表中,并否定它们以获得哪些行不在国家列表中的列表

 import pycountry
 df.Country[~df.Country.isin([i.name for i in list(pycountry.countries)])]

注意:如果列名中没有标准地维护国家名称,则这可能不起作用。

在这种情况下,任何国家不需要的值:因此,45美元将是我想要检测的无效数据。您需要首先确定一个条目如何被视为错误。所有国家的列表或集合肯定会检查这些值是否在该列表中。