Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/71.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用jsoup从godaddy提取数据_Java_Html_Parsing_Jsoup - Fatal编程技术网

Java 使用jsoup从godaddy提取数据

Java 使用jsoup从godaddy提取数据,java,html,parsing,jsoup,Java,Html,Parsing,Jsoup,我正在使用Jsoup从Godaddy的网站中提取html。我想在下面提取这个特定的片段。我有最后一个网页的特定部分,上面写着“对不起,google.com被占用了”,还有HTML代码本身。 然而,在我的课程中,我有以下几点: import java.io.IOException; 导入org.jsoup.jsoup import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.

我正在使用Jsoup从Godaddy的网站中提取html。我想在下面提取这个特定的片段。我有最后一个网页的特定部分,上面写着“对不起,google.com被占用了”,还有HTML代码本身。

然而,在我的课程中,我有以下几点:

import java.io.IOException;
导入org.jsoup.jsoup

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class test {
    public static void main(String[] args) throws IOException {
        String url = "https://www.godaddy.com/dpp/find?checkAvail=1&tmskey=&domainToCheck=google";
        Document document = Jsoup.connect(url).get();
        Element div = document.getElementById("searchResults");
        Elements spans = div.select("span");
        for (Element e: spans)
            System.out.println(e.text());
    }
}
但是,这段代码打印一个NullPointerException。我知道JSoup不能与JS一起工作,但这是HTML,出于某种原因,它没有被提取。我还尝试从页面中提取所有HTML,但它不包含这些单词


有谁能给我指出正确的方向或给我另一种方法从godaddy提取这段信息吗?

首先,您提供的url重定向到其他位置,因此您需要遵循重定向:

Document document = Jsoup.connect(url).followRedirects(true).get()
但即使这样也不能解决你的问题。为了显示域是否可用,网站使用javascript从服务器获取数据。现在该请求将失败,因为它来自未知来源


简而言之,佩德罗是对的,你必须使用这个API。

使用Godaddy API-@PedroLobito就可以了,谢谢。你能告诉我如何使用这个Godaddy API吗?我希望能够将其合并到Java中。godaddy提供RESTAPI,因此您已经了解了它们是什么以及如何在Java中使用它们。