Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/80.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用正则表达式解析此HTML以获得所需内容 说明这是一些测试说明1区域_Python_Html_Regex - Fatal编程技术网

Python 如何使用正则表达式解析此HTML以获得所需内容 说明这是一些测试说明1区域

Python 如何使用正则表达式解析此HTML以获得所需内容 说明这是一些测试说明1区域,python,html,regex,Python,Html,Regex,我想得到(strong)描述(/strong)(strong)某物之间的文本(这是不同的,不总是区域)(/strong) 我一直在尝试使用这个正则表达式“Description(.+)”,但没有结果 获得“这是一些测试描述1”的正确表达式是什么 *我正在使用Python的正则表达式库 如果这是一个非常简单且不精确的解析,您可以尝试,但我建议使用一些HTML/XML解析器。 您可以改用Python或类似于库的语言 无论如何,如果你想尝试提取标签之间的数据,你需要更清楚。 我不确定您是否希望文本始终

我想得到(strong)描述(/strong)(strong)某物之间的文本(这是不同的,不总是区域)(/strong)

我一直在尝试使用这个正则表达式“Description(.+)”,但没有结果

获得“这是一些测试描述1”的正确表达式是什么

*我正在使用Python的正则表达式库

如果这是一个非常简单且不精确的解析,您可以尝试,但我建议使用一些HTML/XML解析器。 您可以改用Python或类似于库的语言

无论如何,如果你想尝试提取标签之间的数据,你需要更清楚。 我不确定您是否希望文本始终位于和标记之间。如果是这样的话,您应该能够执行以下操作:

<strong>Description</strong>                                    This is some test description 1<strong>Areas</strong>
重新导入
matches=re.search(r'(.+),“说明这是一些测试说明1区域”)
匹配。组(1)#“这是一些测试描述1”
如果您想要更具体的描述打开和任何其他文本关闭,您可以说使用正则表达式:

import re
matches = re.search(r'</strong>(.+)<strong>', '<strong>Description</strong>                                    This is some test description 1<strong>Areas</strong>')
matches.group(1) # '                                    This is some test description 1'
说明(.+)(.+)

但我想再次告诉您,请查看一些实际的HTML/XML解析器。

发布完整的HTML代码。.我正在使用它,但对于这个特定的部分,我需要正则表达式。剩下的我没有任何问题,但问题是。整个页面集是超无结构的,对于这个特定的东西,我发现正则表达式很有用。
<strong>Description<\/strong>(.+)<strong>(.+)<\/strong>