Javascript 有没有办法加快DrySrape eval_script()的执行速度?
我正在使用DrySrape(因为我需要javascript呈现的部分)来抓取一个web页面,并且我正在使用eval_script()来抑制页面上一些基于javascript的错误检查。我正在抑制的这个脚本基本上是一个Javascript 有没有办法加快DrySrape eval_script()的执行速度?,javascript,jquery,python,web-scraping,dryscrape,Javascript,Jquery,Python,Web Scraping,Dryscrape,我正在使用DrySrape(因为我需要javascript呈现的部分)来抓取一个web页面,并且我正在使用eval_script()来抑制页面上一些基于javascript的错误检查。我正在抑制的这个脚本基本上是一个onkeyup监听器,我需要避免它,因为它强制用户只从下拉列表中选择选项。 这是eval脚本- session.eval_script("$('#input_elem').removeAttr('onblur onclick onkeyup');") 现在,与我在同一个域上的另一个
onkeyup
监听器,我需要避免它,因为它强制用户只从下拉列表中选择选项。
这是eval脚本-
session.eval_script("$('#input_elem').removeAttr('onblur onclick onkeyup');")
现在,与我在同一个域上的另一个页面实现相比,整个抓取所需的时间要长得多,它不需要任何javascript修改(因此没有eval_script()
我使用time.time()
进行了一些分析,以查看脚本的速度在哪里变慢,实际上,在eval_script()步骤上花费了很长时间。以下是结果-
Starting to access at 0.00997018814087
Visited page https://*****/***.aspx 1.30053019524
First eval script run done 5.97628307343
Second eval script run done 9.61053919792
xpath 1 9.6632771492
xpath 2 9.7702870369
xpath 3 9.90402317047
xpath of button to be clicked 9.91756606102
Button clicked 9.97191905975
Second page visited 10.4508111477
Loop 1 else 10.4525721073
xpath 4 10.5330061913
xpath 5 10.6111950874
xpath 6 10.6918411255
xpath 7 10.7721481323
Range begins 10.8208150864
3
Range ends 13.0008580685
虽然当我循环表元素时,大约需要2秒,但是两个eval_script()步骤加起来大约需要8秒。
当我在Chrome开发工具控制台中执行此操作时,相同的脚本会立即运行。
为什么DrySrape实现要花这么多时间?在eval_script()中使用jQuery似乎是罪魁祸首。我能够使用纯javascript显著减少脚本执行时间-
session.eval_script("document.getElementById('input_elem')").removeAttribute('onblur');
在同一个元素上,我必须使用两行代码来执行两个单独的属性删除步骤
这些是我现在的分析日志-
Starting to access at 0.0151550769806
Visited page https://*****/***.aspx 1.73412919044
First eval script run done 1.77594304085
First eval script part 2 run done 1.81522011757
Second eval script run done 1.85607099533
xpath 1 1.94704914093
xpath 2 2.03846216202
xpath 3 2.13886809349
xpath of button to be clicked 2.26395010948
Button clicked 2.27277112007
Second page visited 3.30618906021
Loop 1 else 3.38708400726
xpath 4 3.46828198433
xpath 5 3.54840707779
xpath 6 3.63034701347
xpath 7 3.7106590271
Range begins 3.75155210495
3
Range ends 5.91926407814
即使是现在,范围
循环中的每一步都需要大约0.7秒,我的目标是进一步减少