Python 熊猫：在数据框中搜索星号时出错。例如：最忙的_主机['host'].str.contains（'***.botol.dk'））_Python_R_Pandas_Data Science_Text Analysis

Python 熊猫：在数据框中搜索星号时出错。例如：最忙的_主机['host'].str.contains（'***.botol.dk'））

python r pandas

Python 熊猫：在数据框中搜索星号时出错。例如：最忙的_主机['host'].str.contains（'***.botol.dk'））,python,r,pandas,data-science,text-analysis,Python,R,Pandas,Data Science,Text Analysis,下面是我的dataframe的样子，您可以看到我的dataframe列中的一个是URL，另一个是timestamp count。当我运行以下代码时：busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误：错误：在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题，我将不胜感激 contains假定字符串是正则表达式，并将*解释为重复前

下面是我的dataframe的样子，您可以看到我的dataframe列中的一个是URL，另一个是timestamp count。当我运行以下代码时：busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误：错误：在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题，我将不胜感激

contains假定字符串是正则表达式，并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候，逃离这个世界。还有

演示

或者正如OP向我指出的；-，只需关闭regex，regex=False

contains假定字符串是正则表达式，并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候，逃离这个世界。还有

演示

或者正如OP向我指出的；-，只需关闭regex，regex=False

哦，我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗，正则表达式=False@JubinSoni对或者那样。哦，我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗，正则表达式=False@JubinSoni对或者那样。

busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]

busiest_hosts = pd.DataFrame(dict(host=['***.novo.dk', '007.thegap.com'], timestamp=[16, 45]))

print(busiest_hosts)

             host  timestamp
0     ***.novo.dk         16
1  007.thegap.com         45

busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]

          host  timestamp
0  ***.novo.dk         16

busiest_hosts[busiest_hosts['host'].str.contains('***.novo.dk', regex=False)==True]