Java 代码名为One的HTML解析,无需使用XML解析器

Java 代码名为One的HTML解析,无需使用XML解析器,java,html,xml,parsing,codenameone,Java,Html,Xml,Parsing,Codenameone,我需要解析一个网站使用代号一。有一个名为HTMLParser()的类,但它似乎不起作用。至少我不能让它运行 作为一种替代方法,我尝试使用XML解析器,该解析器非常有效。但是,在用它解析HTML时,我遇到了与非XHTML一致的标记(如break(br))有关的问题。它们使我的HTML格式错误,因此我无法解析它 有没有什么方法可以让HTML解析器工作,或者用其他方法来完成 编辑: 我选择编写一个Servlet,使用JSoup为我完成解析工作。这似乎是一个很好的实践。被弃用的HTMLComponent

我需要解析一个网站使用代号一。有一个名为HTMLParser()的类,但它似乎不起作用。至少我不能让它运行

作为一种替代方法,我尝试使用XML解析器,该解析器非常有效。但是,在用它解析HTML时,我遇到了与非XHTML一致的标记(如break(br))有关的问题。它们使我的HTML格式错误,因此我无法解析它

有没有什么方法可以让HTML解析器工作,或者用其他方法来完成

编辑:
我选择编写一个Servlet,使用JSoup为我完成解析工作。这似乎是一个很好的实践。

被弃用的
HTMLComponent
使用了
HTMLParser
类。它也应该被弃用,因为没有它是无用的


XMLParser
包括Codename One中内置的所有HTML解析功能。它也应该适用于不一致的
br
标记,对于诸如自动关闭标记和打开标记之类的东西,它可能是不一致的,但是它仍然应该允许您实现大多数这样的用例

谢谢你的快速回答,但我有一个例子,解析一个网站是完全不一致的,我不能进一步与它。这就是我切换到servlet的原因。另一个选择是移植jsoup之类的东西。这不是小事,但可能是可行的。是的,我尝试过,但由于eclipse报告了450个错误而推迟了。这主要是由于JavaSE中缺少正则表达式。但是因为代号一已经得到了RE作为解决方案,你完全正确!是的,这需要一些工作来修复并提高效率。JavaSE上的正则表达式速度非常快,但与Codename One相比,它的速度非常慢。无论如何,如果您选择了这条路线,并且需要RE库中的某些内容,那么您可以通过对代码名为One的项目的pull请求将其添加到RE库中