Python 如何使用正则表达式解析此HTML以获得所需内容 说明这是一些测试说明1区域
我想得到(strong)描述(/strong)(strong)某物之间的文本(这是不同的,不总是区域)(/strong) 我一直在尝试使用这个正则表达式“Description(.+)”,但没有结果 获得“这是一些测试描述1”的正确表达式是什么 *我正在使用Python的正则表达式库 如果这是一个非常简单且不精确的解析,您可以尝试,但我建议使用一些HTML/XML解析器。 您可以改用Python或类似于库的语言 无论如何,如果你想尝试提取标签之间的数据,你需要更清楚。 我不确定您是否希望文本始终位于和标记之间。如果是这样的话,您应该能够执行以下操作:Python 如何使用正则表达式解析此HTML以获得所需内容 说明这是一些测试说明1区域,python,html,regex,Python,Html,Regex,我想得到(strong)描述(/strong)(strong)某物之间的文本(这是不同的,不总是区域)(/strong) 我一直在尝试使用这个正则表达式“Description(.+)”,但没有结果 获得“这是一些测试描述1”的正确表达式是什么 *我正在使用Python的正则表达式库 如果这是一个非常简单且不精确的解析,您可以尝试,但我建议使用一些HTML/XML解析器。 您可以改用Python或类似于库的语言 无论如何,如果你想尝试提取标签之间的数据,你需要更清楚。 我不确定您是否希望文本始终
<strong>Description</strong> This is some test description 1<strong>Areas</strong>
重新导入
matches=re.search(r'(.+),“说明这是一些测试说明1区域”)
匹配。组(1)#“这是一些测试描述1”
如果您想要更具体的描述打开和任何其他文本关闭,您可以说使用正则表达式:
import re
matches = re.search(r'</strong>(.+)<strong>', '<strong>Description</strong> This is some test description 1<strong>Areas</strong>')
matches.group(1) # ' This is some test description 1'
说明(.+)(.+)
但我想再次告诉您,请查看一些实际的HTML/XML解析器。发布完整的HTML代码。.我正在使用它,但对于这个特定的部分,我需要正则表达式。剩下的我没有任何问题,但问题是。整个页面集是超无结构的,对于这个特定的东西,我发现正则表达式很有用。
<strong>Description<\/strong>(.+)<strong>(.+)<\/strong>