Java 获取使用HTTPClient获取的部分数据

Java 获取使用HTTPClient获取的部分数据,java,html,http,httpclient,Java,Html,Http,Httpclient,我正在使用HTTPClient连接到网站 byte[] responseBody = method.getResponseBody(); System.out.println(new String(responseBody)); 我现在只想检索html的一部分。i、 e.我想要在标签后和标签前显示的文本 对于上述问题,我应该如何使用拆分函数 我曾经 String[] substr = new String(responseBody).split("<td><font size

我正在使用HTTPClient连接到网站

byte[] responseBody = method.getResponseBody();
System.out.println(new String(responseBody));
我现在只想检索html的一部分。i、 e.我想要在标签后和标签前显示的文本

对于上述问题,我应该如何使用拆分函数

我曾经

String[] substr = new String(responseBody).split("<td><font size=\"2\">");
但它给出了地址

我想显示文本


我应该如何处理这个问题?

对于一个简单的例子,您可以使用regex匹配并删除所有标记,这些标记将留给您数据

\<[^\>]*\>

你能更具体一点吗?你所说的要显示的文本是什么意思。您想从中检索什么文本。@突变体:我使用以下代码检索网站字节[]responseBody=method.getResponseBody的html代码;System.out.printlnnew StringresponseBody;代码中有六个标记,它们之间有数据。我想得到那些数据。如何检索它?您应该使用类似JSOUP的HTML解析器@user2822187-您将需要使用各种示例中所示的模式-@Georgy Gobozov:如何使用byte[]responseBody=method.getResponseBody;文档中的doc=Jsoup.parsehtml;I当我使用Document doc=Jsoup.parsenew StringresponseBody时,它给出了类型转换错误;