如何在java中解析web内容中的文本?
我想解析web内容并仅从web内容中获取文本。我正在以HTML/java脚本的形式获取web内容。现在我只需要内容中的文本。 有人能帮我做这件事吗?我正在使用HTML解析器来实现这一点 例如,我需要在下面的文件中的文本内容是粗体如何在java中解析web内容中的文本?,java,parsing,text,using,Java,Parsing,Text,Using,我想解析web内容并仅从web内容中获取文本。我正在以HTML/java脚本的形式获取web内容。现在我只需要内容中的文本。 有人能帮我做这件事吗?我正在使用HTML解析器来实现这一点 例如,我需要在下面的文件中的文本内容是粗体 URLConnection类包含许多方法,可以让您与 网络上的URLURLConnection是一个以HTTP为中心的类;那个 是的,它的许多方法只有在使用HTTP时才有用 网址。然而,大多数URL协议允许您读取和写入 连接。本节介绍这两种功能。 有人可以建议我或提供
URLConnection
类包含许多方法,可以让您与
网络上的URLURLConnection
是一个以HTTP为中心的类;那个
是的,它的许多方法只有在使用HTTP时才有用
网址。然而,大多数URL协议允许您读取和写入
连接。本节介绍这两种功能。
有人可以建议我或提供一些示例代码来实现这一点。
提前感谢。您可以使用Html解析器。一个安全的选择是。我喜欢使用的非正统方法是这样的工具,基本上用于单元测试,但它们具有高级xpath解析功能,还提供自动登录、会话处理等功能。我建议用于web下载和作为html/xml解析器
我用它们从网站上提取信息(也用谷歌搜索)。如果你已经在使用html解析器,会有什么问题?谢谢。我试过用它。有人能帮我用Html解析器解析文本吗?