Python 查找熊猫系列中的所有非数字元素
对于具有混合字符串和数字(整数和浮点数)的pd.级数,我需要标识所有非数字元素。比如说Python 查找熊猫系列中的所有非数字元素,python,regex,pandas,string,text-processing,Python,Regex,Pandas,String,Text Processing,对于具有混合字符串和数字(整数和浮点数)的pd.级数,我需要标识所有非数字元素。比如说 data=pd.Series(['1'、'error value'、'2.5'、'-3000'、'>=50'、'not application'、'p>使用pd.to_numeric来标记它们 data[pd.to_numeric(data, errors='coerce').isna()] Out[1159]: 1 wrong value 4 >=50 5
data=pd.Series(['1'、'error value'、'2.5'、'-3000'、'>=50'、'not application'、'p>使用pd.to_numeric
来标记它们
data[pd.to_numeric(data, errors='coerce').isna()]
Out[1159]:
1 wrong value
4 >=50
5 not applicable
6 <40.5
dtype: object
data[pd.to_numeric(data,errors='concurve').isna()]
出[1159]:
1错误值
4 >=50
5不适用
6什么使字符串成为有效数字?试图将整数和浮点数作为数字。所有其他字符将使整个字符串无效。试图将整数和浮点数作为数字。如何定义整数和浮点数?在上面的示例中,我将1、2.5、-3000定义为整数/浮点数。其他所有字符都是无效值此定义。根据此定义,所有其他值都是无效值。什么定义?1
、2.5
和-3000
是示例,而不是定义。在任何情况下,我都看到了熊猫。to_numeric
为您提供了窍门。太棒了。谢谢!!
data[~data.str.replace(r'[\.\-]','').str.isnumeric()]
data[pd.to_numeric(data, errors='coerce').isna()]
Out[1159]:
1 wrong value
4 >=50
5 not applicable
6 <40.5
dtype: object