Dom 如何访问Chrome中“源”选项卡上显示的数据?

Dom 如何访问Chrome中“源”选项卡上显示的数据?,dom,web-scraping,google-chrome-devtools,puppeteer,Dom,Web Scraping,Google Chrome Devtools,Puppeteer,所以我有点被困在这里了。 我正在用木偶演员做一些抓取,但在某个时候我必须下载一个文件。问题是,该文件是在单击按钮后“生成”的。我知道如何在Puppeter上做到这一点,也知道如何从页面上捕获请求和响应,但是,它们都没有用处 我在上一页有一个按钮,这是检查后的按钮 <button id="ReporteOpinionForm:botonConsultar" name="ReporteOpinionForm:botonConsultar"

所以我有点被困在这里了。 我正在用木偶演员做一些抓取,但在某个时候我必须下载一个文件。问题是,该文件是在单击按钮后“生成”的。我知道如何在Puppeter上做到这一点,也知道如何从页面上捕获请求和响应,但是,它们都没有用处

我在上一页有一个按钮,这是检查后的按钮

<button
    id="ReporteOpinionForm:botonConsultar"
    name="ReporteOpinionForm:botonConsultar"
    class="ui-button ui-widget ui-state-default ui-corner-all ui-button-text-only ui-button"
    type="submit">
        <span class="ui-button-text ui-c">
        Consultar
        </span>
</button>

领事
通过检查整个页面,我可以看到它使用了Primefaces和JSF 因此,一旦单击它,就会将XHTML请求发送到XHTML端点 响应(在右边)只不过是一个ID或某种类型,方法是POST,主体是FormData,我认为它有一些不重要的东西 几秒钟后,将加载一个新页面,其中嵌入了PDF

但是在检查页面之后,它只有一个空的主体

但是如果我转到devtools上的sources选项卡,我可以看到这个

内容是一个base64编码的字符串,如果解码成PDF文件,将生成可以在查看器上看到的文件,因此,这里的主要目标是下载该文件,我尝试了几种方法

•捕获请求和响应并复制响应,但XHTML HttpRequest的响应不同,而不是base64字符串 •将鼠标移动到页面顶部的PDF栏,然后单击下载按钮,但这也不起作用 •尝试将页面打印成PDF,但是,单击生成PDF的按钮时,脚本在无标题模式下中断

我迷路了,我不知道该做什么,也不知道我错过了什么或看不见什么
如果有任何帮助,我们将不胜感激,谢谢。

你看了这个吗?@hardkoded Tha是一个完全不同的问题,他们谈论的是无头模式和page.pdf,此外,在Puppeter、chrome或firefox中的响应都是相同的,所以这与Puppeter无关