Python 熊猫:在数据框中搜索星号时出错。例如:最忙的_主机['host'].str.contains('***.botol.dk'))
下面是我的dataframe的样子,您可以看到我的dataframe列中的一个是URL,另一个是timestamp count。当我运行以下代码时:busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误:错误:在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题,我将不胜感激 contains假定字符串是正则表达式,并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候,逃离这个世界。还有 演示 或者正如OP向我指出的;-,只需关闭regex,regex=False contains假定字符串是正则表达式,并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候,逃离这个世界。还有 演示 或者正如OP向我指出的;-,只需关闭regex,regex=FalsePython 熊猫:在数据框中搜索星号时出错。例如:最忙的_主机['host'].str.contains('***.botol.dk')),python,r,pandas,data-science,text-analysis,Python,R,Pandas,Data Science,Text Analysis,下面是我的dataframe的样子,您可以看到我的dataframe列中的一个是URL,另一个是timestamp count。当我运行以下代码时:busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误:错误:在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题,我将不胜感激 contains假定字符串是正则表达式,并将*解释为重复前
哦,我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗,正则表达式=False@JubinSoni对或者那样。哦,我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗,正则表达式=False@JubinSoni对或者那样。
busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]
busiest_hosts = pd.DataFrame(dict(host=['***.novo.dk', '007.thegap.com'], timestamp=[16, 45]))
print(busiest_hosts)
host timestamp
0 ***.novo.dk 16
1 007.thegap.com 45
busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]
host timestamp
0 ***.novo.dk 16
busiest_hosts[busiest_hosts['host'].str.contains('***.novo.dk', regex=False)==True]