用动态页面解析HTML的Java

用动态页面解析HTML的Java,java,html,parsing,jsoup,Java,Html,Parsing,Jsoup,我停下来了 对于学校项目,我们必须解析格式为:。如果您转到此链接,您将看到该页面是动态生成的 我如何使用jsoup.org或类似的东西将HTML添加到我的过程中?我正在尝试解析这些页面中的一些名称 我试过这个: Document doc; doc = (Document) Jsoup.connect(url).get(); System.out.println("text : " + doc.title()); 但它返回403 帮助:(在得到结果之前,是否确实

我停下来了

对于学校项目,我们必须解析格式为:。如果您转到此链接,您将看到该页面是动态生成的

我如何使用jsoup.org或类似的东西将HTML添加到我的过程中?我正在尝试解析这些页面中的一些名称

我试过这个:

        Document doc;

    doc = (Document) Jsoup.connect(url).get();
    System.out.println("text : " + doc.title());
但它返回403

帮助:(

在得到结果之前,是否确实要使用方法初始化所有默认参数,如果不是,可以先这样做

这样试试,

Document doc = Jsoup.connect("http://www.imdb.com/title/tt0112851/")
.data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.get();
String title = doc.title();
System.out.println("text : " + title);

url
的值是什么?链接格式:->strings请注意,不允许对*进行/M/*爬网,这违反了互联网规范。ohh:S这会改变很多东西..tnx不确定您是否注意到,我无法输入您的参数类型。我只有这样的url:这是一种将用户重定向到您的类型的搜索页面所以在代码中,我首先必须从重定向到。。