Python 使用selenium&;获取动态html表;使用beautifulsoup解析它

Python 使用selenium&;获取动态html表;使用beautifulsoup解析它,python,regex,selenium,webdriver,beautifulsoup,Python,Regex,Selenium,Webdriver,Beautifulsoup,我试图在网页中获取JavaScript动态生成的HTML表的内容,并使用BeautifulSoup对其进行解析,以使用表中的某些值 由于内容是由JavaScript生成的,因此在源代码(driver.page\u source)中不可用 是否有其他方法获取内容并使用它?这是一个包含任务列表的表,我需要解析该表并确定我正在搜索的特定任务是否可用。您需要找出Javascript发出的HTTP请求,并在Python代码中发出相同的请求。你可以使用你最喜欢的浏览器的开发工具,或者wireshark(如果

我试图在网页中获取JavaScript动态生成的HTML表的内容,并使用BeautifulSoup对其进行解析,以使用表中的某些值

由于内容是由JavaScript生成的,因此在源代码(
driver.page\u source
)中不可用


是否有其他方法获取内容并使用它?这是一个包含任务列表的表,我需要解析该表并确定我正在搜索的特定任务是否可用。

您需要找出Javascript发出的HTTP请求,并在Python代码中发出相同的请求。你可以使用你最喜欢的浏览器的开发工具,或者wireshark(如果强制的话)来实现这一点。

你需要弄清楚Javascript发出了什么HTTP请求,并在Python代码中发出相同的请求。你可以通过使用你最喜欢的浏览器的开发工具来实现这一点,如果强制使用wireshark,也可以使用wireshark。

正如Julian所提到的,我宁愿检查Firebug(或其他浏览器中的类似工具)中的“Net”选项卡,然后像这样获取数据。如果数据是JSON,只需使用
JSON.loads()
,如果是html,您可以使用BS或任何其他库解析它。也许您想试试my,它简化了这一过程,并将表格作为tablib对象返回,您可以获得csv、excel、json等格式。

正如Julian所提到的,我宁愿检查Firebug中的“Net”选项卡(或其他浏览器中的类似工具)并获得这样的数据。如果数据是JSON,只需使用
JSON.loads()
,如果是html,您可以使用BS或任何其他库解析它。也许您想试试my,它简化了这一过程,并将表作为tablib对象返回,您可以获得csv、excel、json等格式的表