Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/69.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从URL获取文本_Java_Html_Proxy_Jsoup - Fatal编程技术网

Java 从URL获取文本

Java 从URL获取文本,java,html,proxy,jsoup,Java,Html,Proxy,Jsoup,我正在尝试使用Jsoup获取URL的所有文本,代码如下: Document doc = Jsoup.connect(Url).get(); System.out.println(doc.text()); 但问题是,对于我尝试的所有URL来说,这并不是很好地工作。。。 我需要从网页中获取所有文本(解析HTML),因为我正在使用套接字实现代理,我需要连接到URL,然后找到所选单词,如果它存在,我需要阻止提到的URL,如果它不存在,则网页返回到浏览器 有没有其他方法可以从网页中获取所有文本 谢谢 如

我正在尝试使用Jsoup获取URL的所有文本,代码如下:

Document doc = Jsoup.connect(Url).get();
System.out.println(doc.text());
但问题是,对于我尝试的所有URL来说,这并不是很好地工作。。。 我需要从网页中获取所有文本(解析HTML),因为我正在使用套接字实现代理,我需要连接到URL,然后找到所选单词,如果它存在,我需要阻止提到的URL,如果它不存在,则网页返回到浏览器

有没有其他方法可以从网页中获取所有文本


谢谢

如果我理解正确,你想要一个网页上的所有文本,对吗?这段代码应该从网页中获取所有文本

  import org.jsoup.*;
  import org.jsoup.nodes.*;
  import org.jsoup.select.*;

  public class Getdata {
    public Getdata() {
      try {
           String url = "http://stackoverflow.com/questions/20597755/get-text-from-url";
           Document doc = Jsoup.connect(url).get();
           Elements element = doc.select("p");

           for (Element t : element) {
             System.out.println(t.text());
           }

         } catch (Exception ex) {
           System.err.println(ex);

      }
}

public static void main(String[] args) {
    new Getdata();

 }
   } 

谢谢

问题是,对于我尝试过的所有URL来说,这都不起作用……
它到底是如何不起作用的?你能给出一些输入、实际输出和预期输出的例子吗?不使用Jsoup,试试下面的方法:URL URL=newURL(args[0]);Scanner scan=新扫描仪(url.openStream());while(scan.hasNextLine())//使用文档api向其中插入字符串}非常感谢拉比,它工作起来很有魅力!:)