Java Html 2文本-删除“;“隐藏的”;正文
我目前正在寻找方法来读取网站的可视文本,并使用Java将其存储为纯文本字符串 换句话说,我想转换如下内容:Java Html 2文本-删除“;“隐藏的”;正文,java,html,Java,Html,我目前正在寻找方法来读取网站的可视文本,并使用Java将其存储为纯文本字符串 换句话说,我想转换如下内容: Hello dumby World进入“Hello World” 或者类似的 Unfriendly改为“Unfriendly”(而不是“Unfriendly”) 或 进入“Hello World”(在HTML中忽略新行) 你知道有哪一个lib能够协助完成这项任务吗 干杯 Matthias是一个用Java编写的HTML清理库。看看API是否提供了任何方法来呈现HTML并将其转换为纯文本。您需
Hello dumby World
进入“Hello World”
或者类似的
Unfriendly
改为“Unfriendly”(而不是“Unfriendly”)
或
进入“Hello World”(在HTML中忽略新行)
你知道有哪一个lib能够协助完成这项任务吗
干杯
Matthias是一个用Java编写的HTML清理库。看看API是否提供了任何方法来呈现HTML并将其转换为纯文本。您需要的是某种HTML呈现器。
Hello
World