Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/74.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从html页面提取元素的最佳方法?_Java_Html_Regex - Fatal编程技术网

Java 从html页面提取元素的最佳方法?

Java 从html页面提取元素的最佳方法?,java,html,regex,Java,Html,Regex,在Java中,从HTML页面提取元素的首选方法是什么 My HTML is包含以下许多行: <tr class="item-odd"> <td class="data"><a href="http://.....">TITLE</a></td> <td><div class="cost">$1.99</div></td> </tr> 该类交替使用奇

在Java中,从HTML页面提取元素的首选方法是什么

My HTML is包含以下许多行:

<tr class="item-odd">
       <td class="data"><a href="http://.....">TITLE</a></td>
       <td><div class="cost">$1.99</div></td>
</tr>
该类交替使用奇数项和偶数项

我需要摘录:

网址 标题 价格 正则表达式是一种方法吗?

我想用一个类似的库来完成这项工作。请查看和/或。也看看这里就这样

非常容易使用,应该可以完成这项工作。关于替代方案,请看一下这个。

我会使用类似的库来完成这项工作。请查看和/或。也看看这里就这样



非常容易使用,应该可以完成这项工作。关于替代方案,请看一看。

在解析HTML并将其作为DOM进行操作方面做得非常好。正则表达式通常是不可取的,因为HTML不是正则的,并且有许多边缘情况会让您感到困惑。

在解析HTML并将其作为DOM进行操作方面做得非常好。正则表达式通常是不可取的,因为HTML不是正则的,并且有许多边缘情况会让您感到困惑。

不,不是正则表达式。根据您的用户活动页面,您在过去24小时内提出了不少于24个问题。你有没有想过偶尔回答一个问题只是为了好玩?嗯,我正在学习java,我喜欢这个网站,它帮助我分配了资源。我正在投票并标记问题的答案,我也在以某种方式履行我的职责。布拉赫先生,我以前说过,我会再说一遍——你学习Java的方法越来越不尊重这个社区。我会评论你最近的HtmlUnit问题,但我甚至不确定你是否已经学会了阅读Javadocs的API并自己找到所需的方法——看来你的第一本能很快就变成了在这里提问,而不是自己寻找信息并通过阅读文档来学习。暂时把Delfuego说的话放在一边,这可能是完全正确的,我没有费心回顾布拉的历史,我不认为你可以责怪某人只问问题而不回答。并不是每个人都适合回答问题,即使只有一部分用户真正回答了问题,该网站也不会停止其价值或生产力。考虑一下维基百科,不,不是正则表达式。根据您的用户活动页面,您在过去24小时内提出了不少于24个问题。你有没有想过偶尔回答一个问题只是为了好玩?嗯,我正在学习java,我喜欢这个网站,它帮助我分配了资源。我正在投票并标记问题的答案,我也在以某种方式履行我的职责。布拉赫先生,我以前说过,我会再说一遍——你学习Java的方法越来越不尊重这个社区。我会评论你最近的HtmlUnit问题,但我甚至不确定你是否已经学会了阅读Javadocs的API并自己找到所需的方法——看来你的第一本能很快就变成了在这里提问,而不是自己寻找信息并通过阅读文档来学习。暂时把Delfuego说的话放在一边,这可能是完全正确的,我没有费心回顾布拉的历史,我不认为你可以责怪某人只问问题而不回答。并不是每个人都适合回答问题,即使只有一部分用户真正回答了问题,该网站也不会停止其价值或生产力。想想维基吧,HtmlUnit有什么不同吗?它是一个测试工具。HTML解析器是。。。解析器。没错,但HtmlUnit确实有解析器类型的方法,但我明白你的意思!好的,HtmlUnit确实需要解析HTML来对其进行断言,但是建议的工具允许进行高级操作,清理糟糕的HTML,等等。只要看看API,您就会看到。他们真的有不同的目的。假设你有一个HTML页面,你怎么能得到上面这些内容的集合见问题HTML?我的HTML中可能有10-20个集合,如何使用HTMLPasser获得这些集合?与HtmlUnit不同吗?它是一个测试工具。HTML解析器是。。。解析器。没错,但HtmlUnit确实有解析器类型的方法,但我明白你的意思!好的,HtmlUnit确实需要解析HTML来对其进行断言,但是建议的工具允许进行高级操作,清理糟糕的HTML,等等。只要看看API,您就会看到。他们真的有不同的目的。假设你有一个HTML页面,你怎么能得到上面这些内容的集合见问题HTML?我的HTML中可能有10-20个集,如何使用HTMLPasser获得这些集?