如何获取标记元素regex的标题类
我正在尝试制作一个正则表达式,它抓住了internet标记元素的标题。特别是在这个 你怎么能看到有一些团队的“Classifica”表格,我会抓取“Ultime 5 partite”表格,如果用户在彩色框上重叠鼠标,就会出现特定日期的团队结果。我会抓住这个标题类;所以我意识到这样一个正则表达式: 我制作了一个这样的正则表达式:如何获取标记元素regex的标题类,regex,vb.net,Regex,Vb.net,我正在尝试制作一个正则表达式,它抓住了internet标记元素的标题。特别是在这个 你怎么能看到有一些团队的“Classifica”表格,我会抓取“Ultime 5 partite”表格,如果用户在彩色框上重叠鼠标,就会出现特定日期的团队结果。我会抓住这个标题类;所以我意识到这样一个正则表达式: 我制作了一个这样的正则表达式:.giornata\u 1\u casa=Val(regex.Match(Content,”).Groups(1.ToString) 但是返回0,我想抓取内容:尤文图斯-
.giornata\u 1\u casa=Val(regex.Match(Content,”).Groups(1.ToString)
但是返回0,我想抓取内容:尤文图斯-切沃-维罗纳2-0,尤其是每个元素标签。
这个正则表达式在网站页面中运行良好,但在我之前发布的链接中不起作用。错误在哪里?对于手头的任务来说,Regex是一个不合适的解决方案,因为您正在处理HTML解析,并且HTML不能用正则表达式定义。例如,如果将
标题
放在类
前面的元素注册,会发生什么情况?如果某个元素在title=
中有额外的空格,或者有title='bla'
而不是title=“bla”
,该怎么办
在满足HTML规范的同时,有一百万个更改将破坏您的代码。您引入了对
标记中HTML属性的确切顺序和语法的不必要依赖
只需使用HTML或XML解析器即可。我知道这一点,但现在我只需调整正则表达式即可。我非常清楚xml是理想的。@Antonigo您的实际输入是什么?我的当前输入是您可以从我给您的链接中看到的内容。我已经创建了一个充当解析器的算法,并获得了该内容,我只需要运行regex,然后请求您的帮助。您提供的链接中包含HTML。因此,
“
被转义,以便能够将它们放入JSON。因此,首先要做的是使用vb.net读取JSON。然后我建议您将HTML视为HTML,不要使用正则表达式,解释道。这是我可以找到的vb.net HTML解析器。