如何获取标记元素regex的标题类_Regex_Vb.net

如何获取标记元素regex的标题类

regex vb.net

如何获取标记元素regex的标题类,regex,vb.net,Regex,Vb.net,我正在尝试制作一个正则表达式，它抓住了internet标记元素的标题。特别是在这个你怎么能看到有一些团队的“Classifica”表格，我会抓取“Ultime 5 partite”表格，如果用户在彩色框上重叠鼠标，就会出现特定日期的团队结果。我会抓住这个标题类；所以我意识到这样一个正则表达式：我制作了一个这样的正则表达式：.giornata\u 1\u casa=Val（regex.Match（Content，”）.Groups（1.ToString）但是返回0，我想抓取内容：尤文图斯-

我正在尝试制作一个正则表达式，它抓住了internet标记元素的标题。特别是在这个

你怎么能看到有一些团队的“Classifica”表格，我会抓取“Ultime 5 partite”表格，如果用户在彩色框上重叠鼠标，就会出现特定日期的团队结果。我会抓住这个标题类；所以我意识到这样一个正则表达式：

我制作了一个这样的正则表达式：

.giornata\u 1\u casa=Val（regex.Match（Content，”）.Groups（1.ToString）

但是返回0，我想抓取内容：尤文图斯-切沃-维罗纳2-0，尤其是每个元素标签。

这个正则表达式在网站页面中运行良好，但在我之前发布的链接中不起作用。错误在哪里？

对于手头的任务来说，Regex是一个不合适的解决方案，因为您正在处理HTML解析，并且HTML不能用正则表达式定义。例如，如果将

标题

放在

类

前面的元素注册，会发生什么情况？如果某个元素在

title=

中有额外的空格，或者有

title='bla'

而不是

title=“bla”

，该怎么办

在满足HTML规范的同时，有一百万个更改将破坏您的代码。您引入了对

标记中HTML属性的确切顺序和语法的不必要依赖

只需使用HTML或XML解析器即可。

我知道这一点，但现在我只需调整正则表达式即可。我非常清楚xml是理想的。@Antonigo您的实际输入是什么？我的当前输入是您可以从我给您的链接中看到的内容。我已经创建了一个充当解析器的算法，并获得了该内容，我只需要运行regex，然后请求您的帮助。您提供的链接中包含HTML。因此，

“

被转义，以便能够将它们放入JSON。因此，首先要做的是使用vb.net读取JSON。然后我建议您将HTML视为HTML，不要使用正则表达式，解释道。这是我可以找到的vb.net HTML解析器。