Java 从html页面提取元素的最佳方法？_Java_Html_Regex

Java 从html页面提取元素的最佳方法？

java html regex

Java 从html页面提取元素的最佳方法？,java,html,regex,Java,Html,Regex,在Java中，从HTML页面提取元素的首选方法是什么 My HTML is包含以下许多行： <tr class="item-odd"> <td class="data"><a href="http://.....">TITLE</a></td> <td><div class="cost">$1.99</div></td> </tr> 该类交替使用奇

在Java中，从HTML页面提取元素的首选方法是什么

My HTML is包含以下许多行：

<tr class="item-odd">
       <td class="data"><a href="http://.....">TITLE</a></td>
       <td><div class="cost">$1.99</div></td>
</tr>

该类交替使用奇数项和偶数项

我需要摘录：

网址标题价格正则表达式是一种方法吗？

我想用一个类似的库来完成这项工作。请查看和/或。也看看这里就这样

非常容易使用，应该可以完成这项工作。关于替代方案，请看一下这个。

我会使用类似的库来完成这项工作。请查看和/或。也看看这里就这样

非常容易使用，应该可以完成这项工作。关于替代方案，请看一看。

在解析HTML并将其作为DOM进行操作方面做得非常好。正则表达式通常是不可取的，因为HTML不是正则的，并且有许多边缘情况会让您感到困惑。

不，不是正则表达式。根据您的用户活动页面，您在过去24小时内提出了不少于24个问题。你有没有想过偶尔回答一个问题只是为了好玩？嗯，我正在学习java，我喜欢这个网站，它帮助我分配了资源。我正在投票并标记问题的答案，我也在以某种方式履行我的职责。布拉赫先生，我以前说过，我会再说一遍——你学习Java的方法越来越不尊重这个社区。我会评论你最近的HtmlUnit问题，但我甚至不确定你是否已经学会了阅读Javadocs的API并自己找到所需的方法——看来你的第一本能很快就变成了在这里提问，而不是自己寻找信息并通过阅读文档来学习。暂时把Delfuego说的话放在一边，这可能是完全正确的，我没有费心回顾布拉的历史，我不认为你可以责怪某人只问问题而不回答。并不是每个人都适合回答问题，即使只有一部分用户真正回答了问题，该网站也不会停止其价值或生产力。考虑一下维基百科，不，不是正则表达式。根据您的用户活动页面，您在过去24小时内提出了不少于24个问题。你有没有想过偶尔回答一个问题只是为了好玩？嗯，我正在学习java，我喜欢这个网站，它帮助我分配了资源。我正在投票并标记问题的答案，我也在以某种方式履行我的职责。布拉赫先生，我以前说过，我会再说一遍——你学习Java的方法越来越不尊重这个社区。我会评论你最近的HtmlUnit问题，但我甚至不确定你是否已经学会了阅读Javadocs的API并自己找到所需的方法——看来你的第一本能很快就变成了在这里提问，而不是自己寻找信息并通过阅读文档来学习。暂时把Delfuego说的话放在一边，这可能是完全正确的，我没有费心回顾布拉的历史，我不认为你可以责怪某人只问问题而不回答。并不是每个人都适合回答问题，即使只有一部分用户真正回答了问题，该网站也不会停止其价值或生产力。想想维基吧，HtmlUnit有什么不同吗？它是一个测试工具。HTML解析器是。。。解析器。没错，但HtmlUnit确实有解析器类型的方法，但我明白你的意思！好的，HtmlUnit确实需要解析HTML来对其进行断言，但是建议的工具允许进行高级操作，清理糟糕的HTML，等等。只要看看API，您就会看到。他们真的有不同的目的。假设你有一个HTML页面，你怎么能得到上面这些内容的集合见问题HTML？我的HTML中可能有10-20个集合，如何使用HTMLPasser获得这些集合？与HtmlUnit不同吗？它是一个测试工具。HTML解析器是。。。解析器。没错，但HtmlUnit确实有解析器类型的方法，但我明白你的意思！好的，HtmlUnit确实需要解析HTML来对其进行断言，但是建议的工具允许进行高级操作，清理糟糕的HTML，等等。只要看看API，您就会看到。他们真的有不同的目的。假设你有一个HTML页面，你怎么能得到上面这些内容的集合见问题HTML？我的HTML中可能有10-20个集，如何使用HTMLPasser获得这些集？