Java 从URL获取文本_Java_Html_Proxy_Jsoup

Java 从URL获取文本

java html proxy

Java 从URL获取文本,java,html,proxy,jsoup,Java,Html,Proxy,Jsoup,我正在尝试使用Jsoup获取URL的所有文本，代码如下： Document doc = Jsoup.connect(Url).get(); System.out.println(doc.text()); 但问题是，对于我尝试的所有URL来说，这并不是很好地工作。。。我需要从网页中获取所有文本（解析HTML），因为我正在使用套接字实现代理，我需要连接到URL，然后找到所选单词，如果它存在，我需要阻止提到的URL，如果它不存在，则网页返回到浏览器有没有其他方法可以从网页中获取所有文本谢谢如

我正在尝试使用Jsoup获取URL的所有文本，代码如下：

Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());

但问题是，对于我尝试的所有URL来说，这并不是很好地工作。。。我需要从网页中获取所有文本（解析HTML），因为我正在使用套接字实现代理，我需要连接到URL，然后找到所选单词，如果它存在，我需要阻止提到的URL，如果它不存在，则网页返回到浏览器

有没有其他方法可以从网页中获取所有文本

谢谢

如果我理解正确，你想要一个网页上的所有文本，对吗？这段代码应该从网页中获取所有文本

  import org.jsoup.*;
  import org.jsoup.nodes.*;
  import org.jsoup.select.*;

  public class Getdata {
    public Getdata() {
      try {
           String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
           Document doc = Jsoup.connect(url).get();
           Elements element = doc.select("p");

           for (Element t : element) {
             System.out.println(t.text());
           }

         } catch (Exception ex) {
           System.err.println(ex);

      }
}

public static void main(String[] args) {
    new Getdata();

 }
   }

谢谢

问题是，对于我尝试过的所有URL来说，这都不起作用……

它到底是如何不起作用的？你能给出一些输入、实际输出和预期输出的例子吗？不使用Jsoup，试试下面的方法：URL URL=newURL（args[0]）；Scanner scan=新扫描仪（url.openStream（））；while（scan.hasNextLine（））//使用文档api向其中插入字符串}非常感谢拉比，它工作起来很有魅力！：）