Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/342.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
不使用外部库在java中解析html页面_Java - Fatal编程技术网

不使用外部库在java中解析html页面

不使用外部库在java中解析html页面,java,Java,我知道这是一个老问题,已经被问过很多次了。注意:我不能使用外部库。 给定一个以label作为参数的函数,我的函数应该返回包含该标签的所有标记的列表 我想把我的html保存为树,然后我可以找到所有标签的标签和返回列表。但是我不能用java编写代码。如何将html完全解析并存储为树结构并在其上搜索 请帮忙 谢谢 Ravi很多解析器都是开源的。你应该看看他们是怎么做的。课堂作业,还是工作任务?如果这是一项工作任务,那么几乎可以肯定的是,有一个图书馆拥有商业友好许可证。如果它是一个类分配,你能提供一些规

我知道这是一个老问题,已经被问过很多次了。注意:我不能使用外部库。 给定一个以label作为参数的函数,我的函数应该返回包含该标签的所有标记的列表

我想把我的html保存为树,然后我可以找到所有标签的标签和返回列表。但是我不能用java编写代码。如何将html完全解析并存储为树结构并在其上搜索

请帮忙

谢谢


Ravi

很多解析器都是开源的。你应该看看他们是怎么做的。课堂作业,还是工作任务?如果这是一项工作任务,那么几乎可以肯定的是,有一个图书馆拥有商业友好许可证。如果它是一个类分配,你能提供一些规范吗,特别是关于什么样的html是可以预期的?在野外解析真正的html要比解析课堂作业的示例html困难得多。事实上,我在一家初创公司接受采访时被问到,我一直在努力寻找一条清晰的路径来解析。我刚刚被告知:给定一个html页面,返回包含该标签的所有标记的列表。也许你可以使用regex来解决这个问题。我不太赞成regex,并且阅读了stackoverflow的大部分内容,并且确信不要使用regex。我曾想过使用HTMLDocument,但我也无法做到这一点。有什么建议或代码吗?