Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/358.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 熊猫:在数据框中搜索星号时出错。例如:最忙的_主机['host'].str.contains('***.botol.dk'))_Python_R_Pandas_Data Science_Text Analysis - Fatal编程技术网

Python 熊猫:在数据框中搜索星号时出错。例如:最忙的_主机['host'].str.contains('***.botol.dk'))

Python 熊猫:在数据框中搜索星号时出错。例如:最忙的_主机['host'].str.contains('***.botol.dk')),python,r,pandas,data-science,text-analysis,Python,R,Pandas,Data Science,Text Analysis,下面是我的dataframe的样子,您可以看到我的dataframe列中的一个是URL,另一个是timestamp count。当我运行以下代码时:busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误:错误:在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题,我将不胜感激 contains假定字符串是正则表达式,并将*解释为重复前

下面是我的dataframe的样子,您可以看到我的dataframe列中的一个是URL,另一个是timestamp count。当我运行以下代码时:busist_hosts[busist_hosts['host'].str.contains'***.novo.dk'==True]我得到一个错误:错误:在位置0处没有要重复的内容。我想这是因为我的URL的第一个元素是*。我的python版本是3.x。如果有人能帮我解决这个问题,我将不胜感激

contains假定字符串是正则表达式,并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候,逃离这个世界。还有

演示

或者正如OP向我指出的;-,只需关闭regex,regex=False

contains假定字符串是正则表达式,并将*解释为重复前面的字符或表达式的命令。你想逃离*。当你这么做的时候,逃离这个世界。还有

演示

或者正如OP向我指出的;-,只需关闭regex,regex=False


哦,我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗,正则表达式=False@JubinSoni对或者那样。哦,我明白了。但是因为我需要检查我的数据框中的所有URL。我能做str.containshost吗,正则表达式=False@JubinSoni对或者那样。
busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]
busiest_hosts = pd.DataFrame(dict(host=['***.novo.dk', '007.thegap.com'], timestamp=[16, 45]))

print(busiest_hosts)

             host  timestamp
0     ***.novo.dk         16
1  007.thegap.com         45
busiest_hosts[busiest_hosts['host'].str.contains('\*{3}\.novo\.dk')==True]

          host  timestamp
0  ***.novo.dk         16
busiest_hosts[busiest_hosts['host'].str.contains('***.novo.dk', regex=False)==True]