不使用外部库在java中解析html页面
我知道这是一个老问题,已经被问过很多次了。注意:我不能使用外部库。 给定一个以label作为参数的函数,我的函数应该返回包含该标签的所有标记的列表 我想把我的html保存为树,然后我可以找到所有标签的标签和返回列表。但是我不能用java编写代码。如何将html完全解析并存储为树结构并在其上搜索 请帮忙 谢谢不使用外部库在java中解析html页面,java,Java,我知道这是一个老问题,已经被问过很多次了。注意:我不能使用外部库。 给定一个以label作为参数的函数,我的函数应该返回包含该标签的所有标记的列表 我想把我的html保存为树,然后我可以找到所有标签的标签和返回列表。但是我不能用java编写代码。如何将html完全解析并存储为树结构并在其上搜索 请帮忙 谢谢 Ravi很多解析器都是开源的。你应该看看他们是怎么做的。课堂作业,还是工作任务?如果这是一项工作任务,那么几乎可以肯定的是,有一个图书馆拥有商业友好许可证。如果它是一个类分配,你能提供一些规
Ravi很多解析器都是开源的。你应该看看他们是怎么做的。课堂作业,还是工作任务?如果这是一项工作任务,那么几乎可以肯定的是,有一个图书馆拥有商业友好许可证。如果它是一个类分配,你能提供一些规范吗,特别是关于什么样的html是可以预期的?在野外解析真正的html要比解析课堂作业的示例html困难得多。事实上,我在一家初创公司接受采访时被问到,我一直在努力寻找一条清晰的路径来解析。我刚刚被告知:给定一个html页面,返回包含该标签的所有标记的列表。也许你可以使用regex来解决这个问题。我不太赞成regex,并且阅读了stackoverflow的大部分内容,并且确信不要使用regex。我曾想过使用HTMLDocument,但我也无法做到这一点。有什么建议或代码吗?