Java 从html文件获取信息

Java 从html文件获取信息,java,html,parsing,Java,Html,Parsing,我正在编写一个程序,从页面中获取信息并将其放入excel文件中 问题是,我没有找到一种方法来搜索带有特定信息的标签 这是我的代码(到目前为止): private void getAll()引发IOException{ 对于(inti=0;iif(line.equalsIgnoreCase(“”{} 该if语句正在检查是否完全相等(忽略大小写),但该行上可能有其他内容,例如空格 你可能想要的是 if (line.toLowerCase().contains("<div class=\"su

我正在编写一个程序,从页面中获取信息并将其放入excel文件中

问题是,我没有找到一种方法来搜索带有特定信息的标签

这是我的代码(到目前为止):

private void getAll()引发IOException{
对于(inti=0;i
if(line.equalsIgnoreCase(“”{}
该if语句正在检查是否完全相等(忽略大小写),但该行上可能有其他内容,例如空格

你可能想要的是

if (line.toLowerCase().contains("<div class=\"subcontent\">") { }
if(line.toLowerCase()包含(“”{}

试着从开始使用

看看外部解析器库吧?试一下这个:已经试过了,没用,我发现修改后的api有点难。这确实是你最好的选择;jsoup可能是更好的选择,还有很多例子!)快速提问,如何获取结束标记?如果(line.toLowerCase().contains(“”)包含(“”),您可以继续解析行,直到有一行通过
,实际上,我收回这一点——如果存在嵌套div,您将遇到问题。如果需要达到这种复杂程度,您可能需要使用XML解析器
if (line.equalsIgnoreCase("<div class=\"subcontent\">"){ }
if (line.toLowerCase().contains("<div class=\"subcontent\">") { }