用动态页面解析HTML的Java_Java_Html_Parsing_Jsoup

用动态页面解析HTML的Java

java html parsing

用动态页面解析HTML的Java,java,html,parsing,jsoup,Java,Html,Parsing,Jsoup,我停下来了对于学校项目，我们必须解析格式为：。如果您转到此链接，您将看到该页面是动态生成的我如何使用jsoup.org或类似的东西将HTML添加到我的过程中？我正在尝试解析这些页面中的一些名称我试过这个： Document doc; doc = (Document) Jsoup.connect(url).get(); System.out.println("text : " + doc.title()); 但它返回403 帮助：（在得到结果之前，是否确实

我停下来了

对于学校项目，我们必须解析格式为：。如果您转到此链接，您将看到该页面是动态生成的

我如何使用jsoup.org或类似的东西将HTML添加到我的过程中？我正在尝试解析这些页面中的一些名称

我试过这个：

        Document doc;

    doc = (Document) Jsoup.connect(url).get();
    System.out.println("text : " + doc.title());

但它返回403

帮助：（

在得到结果之前，是否确实要使用方法初始化所有默认参数，如果不是，可以先这样做

这样试试，

Document doc = Jsoup.connect("http://www.imdb.com/title/tt0112851/")
.data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.get();
String title = doc.title();
System.out.println("text : " + title);

url

的值是什么？链接格式：->strings请注意，不允许对*进行/M/*爬网，这违反了互联网规范。ohh:S这会改变很多东西..tnx不确定您是否注意到，我无法输入您的参数类型。我只有这样的url：这是一种将用户重定向到您的类型的搜索页面所以在代码中，我首先必须从重定向到。。