如何在java中解析web内容中的文本?

如何在java中解析web内容中的文本?,java,parsing,text,using,Java,Parsing,Text,Using,我想解析web内容并仅从web内容中获取文本。我正在以HTML/java脚本的形式获取web内容。现在我只需要内容中的文本。 有人能帮我做这件事吗?我正在使用HTML解析器来实现这一点 例如,我需要在下面的文件中的文本内容是粗体 URLConnection类包含许多方法,可以让您与 网络上的URLURLConnection是一个以HTTP为中心的类;那个 是的,它的许多方法只有在使用HTTP时才有用 网址。然而,大多数URL协议允许您读取和写入 连接。本节介绍这两种功能。 有人可以建议我或提供

我想解析web内容并仅从web内容中获取文本。我正在以HTML/java脚本的形式获取web内容。现在我只需要内容中的文本。 有人能帮我做这件事吗?我正在使用HTML解析器来实现这一点

例如,我需要在下面的文件中的文本内容是粗体

URLConnection
类包含许多方法,可以让您与 网络上的URL
URLConnection
是一个以HTTP为中心的类;那个 是的,它的许多方法只有在使用HTTP时才有用 网址。然而,大多数URL协议允许您读取和写入 连接。本节介绍这两种功能。

有人可以建议我或提供一些示例代码来实现这一点。
提前感谢。

您可以使用Html解析器。一个安全的选择是。

我喜欢使用的非正统方法是这样的工具,基本上用于单元测试,但它们具有高级xpath解析功能,还提供自动登录、会话处理等功能。

我建议用于web下载和作为html/xml解析器


我用它们从网站上提取信息(也用谷歌搜索)。

如果你已经在使用html解析器,会有什么问题?谢谢。我试过用它。有人能帮我用Html解析器解析文本吗?