Python pandas read_html不等待页面加载

Python pandas read_html不等待页面加载,python,pandas,http,web-crawler,Python,Pandas,Http,Web Crawler,我试图使用pandas read_html读取URL上的表,但我感兴趣的表是在页面的其他部分之后加载的,因此我得到的数据框如下所示,而不是实际内容: ColumnA | ColumnB Still loading | Still loading 那么,有没有一种方法可以告诉read_html等待表完全加载,然后再读取表 如果没有特定的代码示例,我们无法确定答案,但您应该知道,read\u html会在提供html时抓取html的静态版本;它不会等待JavaScript执

我试图使用pandas read_html读取URL上的表,但我感兴趣的表是在页面的其他部分之后加载的,因此我得到的数据框如下所示,而不是实际内容:

ColumnA     |     ColumnB

Still loading |    Still loading

那么,有没有一种方法可以告诉read_html等待表完全加载,然后再读取表

如果没有特定的代码示例,我们无法确定答案,但您应该知道,
read\u html
会在提供html时抓取html的静态版本;它不会等待JavaScript执行(可能是当表“加载”时在浏览器中看到的情况),因为HTML爬虫根本不执行JavaScript

您还可以阅读更多关于pandas常见HTML抓取问题的信息,尽管这些问题与性能更相关,而不是等待第二次页面更新

如果您需要将javascript更新合并到爬网中,您可能需要查看无头浏览器,如或无头chrome[]