Regex 从DataFrame字符串对象中提取数值
我有一个dtype字符串的数据帧对象。典型的行如下所示:Regex 从DataFrame字符串对象中提取数值,regex,pandas,extract,dataframe,numerical,Regex,Pandas,Extract,Dataframe,Numerical,我有一个dtype字符串的数据帧对象。典型的行如下所示: '\n\n Dividend Indicated Gross Yield\n \n\n 1.50%\n \n' 我试图从上面的字符串中只提取数字数据。例如,我想要的输出应该是1.50 另一件事要记住的是,每一行将有不同长度的数字,有些可能还包括负号 我尝试了一些建议,包括.rstrip(),regex,convert\u对象,但它们没有按预期工作。感
'\n\n Dividend Indicated Gross Yield\n \n\n 1.50%\n \n'
我试图从上面的字符串中只提取数字数据。例如,我想要的输出应该是1.50
另一件事要记住的是,每一行将有不同长度的数字,有些可能还包括负号
我尝试了一些建议,包括
.rstrip()
,regex
,convert\u对象
,但它们没有按预期工作。感谢您的帮助。您可能希望这样做:
df.col.str.extract('(\-?\d+\.\d+)').astype(np.float64)
您可以发布一些您尝试过的
regex
吗?我尝试了上面的解决方案,但它抛出了一条错误消息:“ValueError:此模式不包含要捕获的组。”我在regex上犯了一个错误,它需要一组括号来告诉它要提取的组,现在应该可以工作了。