Python 如何使用正则表达式解析此HTML以获得所需内容说明这是一些测试说明1区域_Python_Html_Regex

Python 如何使用正则表达式解析此HTML以获得所需内容说明这是一些测试说明1区域

python html regex

Python 如何使用正则表达式解析此HTML以获得所需内容说明这是一些测试说明1区域,python,html,regex,Python,Html,Regex,我想得到（strong）描述（/strong）（strong）某物之间的文本（这是不同的，不总是区域）（/strong）我一直在尝试使用这个正则表达式“Description（.+）”，但没有结果获得“这是一些测试描述1”的正确表达式是什么 *我正在使用Python的正则表达式库如果这是一个非常简单且不精确的解析，您可以尝试，但我建议使用一些HTML/XML解析器。您可以改用Python或类似于库的语言无论如何，如果你想尝试提取标签之间的数据，你需要更清楚。我不确定您是否希望文本始终

我想得到（strong）描述（/strong）（strong）某物之间的文本（这是不同的，不总是区域）（/strong）

我一直在尝试使用这个正则表达式“Description（.+）”，但没有结果

获得“这是一些测试描述1”的正确表达式是什么

*我正在使用Python的正则表达式库

如果这是一个非常简单且不精确的解析，您可以尝试，但我建议使用一些HTML/XML解析器。您可以改用Python或类似于库的语言

无论如何，如果你想尝试提取标签之间的数据，你需要更清楚。我不确定您是否希望文本始终位于和标记之间。如果是这样的话，您应该能够执行以下操作：

<strong>Description</strong>                                    This is some test description 1<strong>Areas</strong>

重新导入
matches=re.search（r'（.+），“说明这是一些测试说明1区域”）
匹配。组（1）#“这是一些测试描述1”

如果您想要更具体的描述打开和任何其他文本关闭，您可以说使用正则表达式：

import re matches = re.search(r'(.+)', 'Description This is some test description 1Areas') matches.group(1) # ' This is some test description 1'

说明（.+）（.+）

但我想再次告诉您，请查看一些实际的HTML/XML解析器。
发布完整的HTML代码。.我正在使用它，但对于这个特定的部分，我需要正则表达式。剩下的我没有任何问题，但问题是。整个页面集是超无结构的，对于这个特定的东西，我发现正则表达式很有用。
Description<\/strong>(.+)(.+)<\/strong>