Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/376.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 使用jsoup对模式窗口(对话框)进行Web抓取_Javascript_Java_Html_Jsoup - Fatal编程技术网

Javascript 使用jsoup对模式窗口(对话框)进行Web抓取

Javascript 使用jsoup对模式窗口(对话框)进行Web抓取,javascript,java,html,jsoup,Javascript,Java,Html,Jsoup,我正在研究一个项目,在这个项目中,我必须从网站上提取数据。该项目是在java和网站是在java脚本。我正在使用Jsoup从网站中提取数据,但网页中存在一些模式窗口(对话框、弹出窗口)。因此,是否可以使用Jsoup提取模式窗口的数据????? 所以,如果答案是肯定的,那么我该怎么做呢??请提供链接,如果没有,那么其他最好的方法是什么 谢谢你的帮助。我真的很感激。我假设模式是由Javascript生成的。 Jsoup只是一个解析器。这意味着它将发出一个HTTP请求(GET或POST,无论您告诉它做什

我正在研究一个项目,在这个项目中,我必须从网站上提取数据。该项目是在java和网站是在java脚本。我正在使用Jsoup从网站中提取数据,但网页中存在一些模式窗口(对话框、弹出窗口)。因此,是否可以使用Jsoup提取模式窗口的数据????? 所以,如果答案是肯定的,那么我该怎么做呢??请提供链接,如果没有,那么其他最好的方法是什么


谢谢你的帮助。我真的很感激。

我假设模式是由Javascript生成的。 Jsoup只是一个解析器。这意味着它将发出一个HTTP请求(GET或POST,无论您告诉它做什么),服务器(网站)将用初始html进行响应。我说的initial,是指在执行任何javascript之前的html

Javascript可以生成html(类似于所讨论的模式),但这对Jsoup不可见,因为解析器只能读取,不能执行代码。浏览器能够生成模式,因为它包括一个Javascript执行引擎,可以解析并执行Javascript

当你访问一个网页时,你不知道什么是动态的(由Javascript生成),什么是静态的(由服务器按原样获取)。 检查什么是动态的,什么是静态的(静态对Jsoup可见)的一个小技巧是执行以下操作:

  • 访问你想要解析的网页(如果可能的话,使用chrome,mozilla也可以)
  • 按Ctrl+U。这将打开一个新选项卡
  • 新选项卡将包含一些html、css和js的网格。这是服务器获取到浏览器的内容,对Jsoup也是可见的。 如果模态在那里,那么很好,它对Jsoup是可见的。如果没有,则必须使用充当无头浏览器的库

    无头浏览器本质上是没有图形界面的浏览器。它可以解析和执行Javascript。它“看到”了普通浏览器看到的东西

    最常用的库是。请注意,selenium是一个包含很多部分的测试框架。你需要的是网络驱动程序。
    有很多例子都有现成的代码让你开始

    我假设模式是由Javascript生成的。 Jsoup只是一个解析器。这意味着它将发出一个HTTP请求(GET或POST,无论您告诉它做什么),服务器(网站)将用初始html进行响应。我说的initial,是指在执行任何javascript之前的html

    Javascript可以生成html(类似于所讨论的模式),但这对Jsoup不可见,因为解析器只能读取,不能执行代码。浏览器能够生成模式,因为它包括一个Javascript执行引擎,可以解析并执行Javascript

    当你访问一个网页时,你不知道什么是动态的(由Javascript生成),什么是静态的(由服务器按原样获取)。 检查什么是动态的,什么是静态的(静态对Jsoup可见)的一个小技巧是执行以下操作:

  • 访问你想要解析的网页(如果可能的话,使用chrome,mozilla也可以)
  • 按Ctrl+U。这将打开一个新选项卡
  • 新选项卡将包含一些html、css和js的网格。这是服务器获取到浏览器的内容,对Jsoup也是可见的。 如果模态在那里,那么很好,它对Jsoup是可见的。如果没有,则必须使用充当无头浏览器的库

    无头浏览器本质上是没有图形界面的浏览器。它可以解析和执行Javascript。它“看到”了普通浏览器看到的东西

    最常用的库是。请注意,selenium是一个包含很多部分的测试框架。你需要的是网络驱动程序。
    有很多例子都有现成的代码让你开始

    我假设模式是由Javascript生成的。 Jsoup只是一个解析器。这意味着它将发出一个HTTP请求(GET或POST,无论您告诉它做什么),服务器(网站)将用初始html进行响应。我说的initial,是指在执行任何javascript之前的html

    Javascript可以生成html(类似于所讨论的模式),但这对Jsoup不可见,因为解析器只能读取,不能执行代码。浏览器能够生成模式,因为它包括一个Javascript执行引擎,可以解析并执行Javascript

    当你访问一个网页时,你不知道什么是动态的(由Javascript生成),什么是静态的(由服务器按原样获取)。 检查什么是动态的,什么是静态的(静态对Jsoup可见)的一个小技巧是执行以下操作:

  • 访问你想要解析的网页(如果可能的话,使用chrome,mozilla也可以)
  • 按Ctrl+U。这将打开一个新选项卡
  • 新选项卡将包含一些html、css和js的网格。这是服务器获取到浏览器的内容,对Jsoup也是可见的。 如果模态在那里,那么很好,它对Jsoup是可见的。如果没有,则必须使用充当无头浏览器的库

    无头浏览器本质上是没有图形界面的浏览器。它可以解析和执行Javascript。它“看到”了普通浏览器看到的东西

    最常用的库是。请注意,selenium是一个包含很多部分的测试框架。你需要的是网络驱动程序。
    有很多例子都有现成的代码让你开始

    我假设模式是由Javascript生成的。 Jsoup只是一个解析器。这意味着它将发出一个HTTP请求(GET或POST,无论您告诉它做什么),服务器(网站)将用初始html进行响应。我说的首字母,是指