Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/313.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 有什么好的方法可以用来解析HTML简历吗_Java_Parsing_Html Parsing - Fatal编程技术网

Java 有什么好的方法可以用来解析HTML简历吗

Java 有什么好的方法可以用来解析HTML简历吗,java,parsing,html-parsing,Java,Parsing,Html Parsing,我们需要从HTML简历中获取一些信息(例如,经验、位置等),所以我们使用Strip方法将HTML内容转换为文本内容,而不是解析。我的问题是这是一个好方法,或者我可以做任何其他可能的方法 更多信息 我的HTML内容没有唯一的HTML标记,可能会有所不同 Hariharan最好在Java中使用HTML解析器。有一些易于使用的库,例如: 我不可能从标记中提取字符串,因为我的标记是动态的,每次都可能不同。还有其他可能的方法吗。@harisharju即使您事先不知道这些标记是什么,也应该可以对它们进行

我们需要从HTML简历中获取一些信息(例如,经验、位置等),所以我们使用Strip方法将HTML内容转换为文本内容,而不是解析。我的问题是这是一个好方法,或者我可以做任何其他可能的方法

更多信息

我的HTML内容没有唯一的HTML标记,可能会有所不同


Hariharan

最好在Java中使用HTML解析器。有一些易于使用的库,例如:


  • 我不可能从标记中提取字符串,因为我的标记是动态的,每次都可能不同。还有其他可能的方法吗。@harisharju即使您事先不知道这些标记是什么,也应该可以对它们进行迭代。@Jan Dvorak您是对的,但实际上要做的是从多个求职网站获取HTML内容,而不是解析它。所以我不可能硬编码所有的标签,我能做什么。@harisharju@jandvorak我想这可能对我有帮助。我会在这方面进行练习,并让你知道。感谢当前使用html2text脚本将HTML转换为文本。