Java 从URL获取文本
我正在尝试使用Jsoup获取URL的所有文本,代码如下:Java 从URL获取文本,java,html,proxy,jsoup,Java,Html,Proxy,Jsoup,我正在尝试使用Jsoup获取URL的所有文本,代码如下: Document doc = Jsoup.connect(Url).get(); System.out.println(doc.text()); 但问题是,对于我尝试的所有URL来说,这并不是很好地工作。。。 我需要从网页中获取所有文本(解析HTML),因为我正在使用套接字实现代理,我需要连接到URL,然后找到所选单词,如果它存在,我需要阻止提到的URL,如果它不存在,则网页返回到浏览器 有没有其他方法可以从网页中获取所有文本 谢谢 如
Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());
但问题是,对于我尝试的所有URL来说,这并不是很好地工作。。。
我需要从网页中获取所有文本(解析HTML),因为我正在使用套接字实现代理,我需要连接到URL,然后找到所选单词,如果它存在,我需要阻止提到的URL,如果它不存在,则网页返回到浏览器
有没有其他方法可以从网页中获取所有文本
谢谢 如果我理解正确,你想要一个网页上的所有文本,对吗?这段代码应该从网页中获取所有文本
import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.*;
public class Getdata {
public Getdata() {
try {
String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
Document doc = Jsoup.connect(url).get();
Elements element = doc.select("p");
for (Element t : element) {
System.out.println(t.text());
}
} catch (Exception ex) {
System.err.println(ex);
}
}
public static void main(String[] args) {
new Getdata();
}
}
谢谢
问题是,对于我尝试过的所有URL来说,这都不起作用……
它到底是如何不起作用的?你能给出一些输入、实际输出和预期输出的例子吗?不使用Jsoup,试试下面的方法:URL URL=newURL(args[0]);Scanner scan=新扫描仪(url.openStream());while(scan.hasNextLine())//使用文档api向其中插入字符串}非常感谢拉比,它工作起来很有魅力!:)