如何在Java中创建大型正则表达式模式?

如何在Java中创建大型正则表达式模式?,java,html,regex,Java,Html,Regex,我试图从HTML页面中解析(窃取)大量信息。很多信息都是以块为单位的。比如:用户名:1.age 2.gender 3.country等。这是一个非常大的块,因此我的正则表达式模式非常大。我所有的正则表达式开发工具都有一行用于模式,一个文本框用于文本。这使得开发这种大型模式变得不可能。我应该如何开发大型正则表达式模式,还是避免它们 HTML页面基本上是一种有效的DOM结构。因此,最好使用DOM解析器而不是正则表达式来获取所需的信息。您可以探索:JavaHTML解析器 使用为HTML描述的解析规则从

我试图从HTML页面中解析(窃取)大量信息。很多信息都是以块为单位的。比如:用户名:1.age 2.gender 3.country等。这是一个非常大的块,因此我的正则表达式模式非常大。我所有的正则表达式开发工具都有一行用于模式,一个文本框用于文本。这使得开发这种大型模式变得不可能。我应该如何开发大型正则表达式模式,还是避免它们

HTML页面基本上是一种有效的DOM结构。因此,最好使用DOM解析器而不是正则表达式来获取所需的信息。您可以探索:JavaHTML解析器

使用为HTML描述的解析规则从文本/HTML资源生成DOM树。这些规则共同定义了所谓的HTML解析器。

HTML页面基本上是DOM结构。所以最好使用DOM解析器而不是正则表达式来获取所需的信息。我开始不关心被搁置的问题和否决票了。这太烦人了。反正我得到了答案。呵呵~