Java 代码名为One的HTML解析，无需使用XML解析器_Java_Html_Xml_Parsing_Codenameone

Java 代码名为One的HTML解析，无需使用XML解析器

java html xml parsing codenameone

Java 代码名为One的HTML解析，无需使用XML解析器,java,html,xml,parsing,codenameone,Java,Html,Xml,Parsing,Codenameone,我需要解析一个网站使用代号一。有一个名为HTMLParser（）的类，但它似乎不起作用。至少我不能让它运行作为一种替代方法，我尝试使用XML解析器，该解析器非常有效。但是，在用它解析HTML时，我遇到了与非XHTML一致的标记（如break（br））有关的问题。它们使我的HTML格式错误，因此我无法解析它有没有什么方法可以让HTML解析器工作，或者用其他方法来完成编辑：我选择编写一个Servlet，使用JSoup为我完成解析工作。这似乎是一个很好的实践。被弃用的HTMLComponent

我需要解析一个网站使用代号一。有一个名为HTMLParser（）的类，但它似乎不起作用。至少我不能让它运行

作为一种替代方法，我尝试使用XML解析器，该解析器非常有效。但是，在用它解析HTML时，我遇到了与非XHTML一致的标记（如break（br））有关的问题。它们使我的HTML格式错误，因此我无法解析它

有没有什么方法可以让HTML解析器工作，或者用其他方法来完成

编辑：

我选择编写一个Servlet，使用JSoup为我完成解析工作。这似乎是一个很好的实践。

被弃用的

HTMLComponent

使用了

HTMLParser

类。它也应该被弃用，因为没有它是无用的

XMLParser

包括Codename One中内置的所有HTML解析功能。它也应该适用于不一致的

br

标记，对于诸如自动关闭标记和打开标记之类的东西，它可能是不一致的，但是它仍然应该允许您实现大多数这样的用例

谢谢你的快速回答，但我有一个例子，解析一个网站是完全不一致的，我不能进一步与它。这就是我切换到servlet的原因。另一个选择是移植jsoup之类的东西。这不是小事，但可能是可行的。是的，我尝试过，但由于eclipse报告了450个错误而推迟了。这主要是由于JavaSE中缺少正则表达式。但是因为代号一已经得到了RE作为解决方案，你完全正确！是的，这需要一些工作来修复并提高效率。JavaSE上的正则表达式速度非常快，但与Codename One相比，它的速度非常慢。无论如何，如果您选择了这条路线，并且需要RE库中的某些内容，那么您可以通过对代码名为One的项目的pull请求将其添加到RE库中