Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何获取标记元素regex的标题类_Regex_Vb.net - Fatal编程技术网

如何获取标记元素regex的标题类

如何获取标记元素regex的标题类,regex,vb.net,Regex,Vb.net,我正在尝试制作一个正则表达式,它抓住了internet标记元素的标题。特别是在这个 你怎么能看到有一些团队的“Classifica”表格,我会抓取“Ultime 5 partite”表格,如果用户在彩色框上重叠鼠标,就会出现特定日期的团队结果。我会抓住这个标题类;所以我意识到这样一个正则表达式: 我制作了一个这样的正则表达式:.giornata\u 1\u casa=Val(regex.Match(Content,”).Groups(1.ToString) 但是返回0,我想抓取内容:尤文图斯-

我正在尝试制作一个正则表达式,它抓住了internet标记元素的标题。特别是在这个

你怎么能看到有一些团队的“Classifica”表格,我会抓取“Ultime 5 partite”表格,如果用户在彩色框上重叠鼠标,就会出现特定日期的团队结果。我会抓住这个标题类;所以我意识到这样一个正则表达式:

我制作了一个这样的正则表达式:
.giornata\u 1\u casa=Val(regex.Match(Content,”).Groups(1.ToString)


但是返回0,我想抓取内容:尤文图斯-切沃-维罗纳2-0,尤其是每个元素标签。

这个正则表达式在网站页面中运行良好,但在我之前发布的链接中不起作用。错误在哪里?

对于手头的任务来说,Regex是一个不合适的解决方案,因为您正在处理HTML解析,并且HTML不能用正则表达式定义。例如,如果将
标题
放在
前面的元素注册,会发生什么情况?如果某个元素在
title=
中有额外的空格,或者有
title='bla'
而不是
title=“bla”
,该怎么办

在满足HTML规范的同时,有一百万个更改将破坏您的代码。您引入了对
标记中HTML属性的确切顺序和语法的不必要依赖


只需使用HTML或XML解析器即可。

我知道这一点,但现在我只需调整正则表达式即可。我非常清楚xml是理想的。@Antonigo您的实际输入是什么?我的当前输入是您可以从我给您的链接中看到的内容。我已经创建了一个充当解析器的算法,并获得了该内容,我只需要运行regex,然后请求您的帮助。您提供的链接中包含HTML。因此,
被转义,以便能够将它们放入JSON。因此,首先要做的是使用vb.net读取JSON。然后我建议您将HTML视为HTML,不要使用正则表达式,解释道。这是我可以找到的vb.net HTML解析器。