Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/325.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
PHP的对应项’;Python中的s preg_匹配_Php_Python_Regex_Preg Match - Fatal编程技术网

PHP的对应项’;Python中的s preg_匹配

PHP的对应项’;Python中的s preg_匹配,php,python,regex,preg-match,Php,Python,Regex,Preg Match,我正计划将我的一个scraper迁移到Python。在PHP中使用preg\u match和preg\u match\u all我感觉很舒服。我在Python中找不到类似于preg\u match的合适函数。有人能帮我吗 例如,如果我想在之间获取内容,您需要查找python的 看一看,然后 正如您所提到的,您正在尝试使用html解析器来解析html。在python中有两个选项可用,比如或 看看这个你可能有兴趣读一下我想你需要这样的东西: output = re.search('a class="

我正计划将我的一个scraper迁移到Python。在PHP中使用
preg\u match
preg\u match\u all
我感觉很舒服。我在Python中找不到类似于
preg\u match
的合适函数。有人能帮我吗

例如,如果我想在
之间获取内容,您需要查找python的

看一看,然后

正如您所提到的,您正在尝试使用
html解析器来解析html。在python中有两个选项可用,比如或


看看这个

你可能有兴趣读一下

我想你需要这样的东西:

output = re.search('a class="title"(.*?)<\/a>', input, flags=re.IGNORECASE)
    if output is not None:
        output = output.group(0)
        print(output)
output=re.search('a class=“title”(.*?),input,flags=re.IGNORECASE)
如果输出不是无:
输出=输出。组(0)
打印(输出)
可以在正则表达式的开头添加(?s)以启用多行模式:

output = re.search('(?s)a class="title"(.*?)<\/a>', input, flags=re.IGNORECASE)
    if output is not None:
        output = output.group(0)
        print(output)
output=re.search('(?s)a class=“title”(.*),输入,flags=re.IGNORECASE)
如果输出不是无:
输出=输出。组(0)
打印(输出)

这里是python正则表达式文档:在python中,我们不使用正则表达式来解析HTML,而是使用正则表达式。谢谢各位的回复。我已经开始使用Beatifulsoup,我在使用它时遇到了一些问题。我已经将html数据传递给Beatifulsopu,我面临这个错误。soup=BeautifulSoup(数据)打印soup.prettify()第52行,在soup=BeautifulSoup(数据)文件“/home/infoken user/Desktop/lin/BeautifulSoup.py”中,第1519行,在init BeautifulSoup中^
output = re.search('(?s)a class="title"(.*?)<\/a>', input, flags=re.IGNORECASE)
    if output is not None:
        output = output.group(0)
        print(output)