Python 当给定从SeleniumWebDriver获得的HTML数据时,BeautifulSoup如何从HTML中获取文本

Python 当给定从SeleniumWebDriver获得的HTML数据时,BeautifulSoup如何从HTML中获取文本,python,selenium,web-scraping,beautifulsoup,Python,Selenium,Web Scraping,Beautifulsoup,我正在抓取在JS上开发的网页。 我能够从页面中获取HTML内容,但是当我可视化页面的BeautifulSoup内容时,数据似乎缺少文本信息,我看到的只是脚本信息。(图:soupstr输出) 然而,当我显式地调用.text到Beautiful soup对象时,我得到了所有的文本。(图像:souptext输出) 如何在Python上使用SeleniumWebDriver获得由HTML标记和文本(基本上是DOM的副本)组成的纯HTML数据 PS:对于非内联图像表示抱歉,因为我还没有发布内联消息的

我正在抓取在JS上开发的网页。 我能够从页面中获取HTML内容,但是当我可视化页面的BeautifulSoup内容时,数据似乎缺少文本信息,我看到的只是脚本信息。(图:soupstr输出) 然而,当我显式地调用.text到Beautiful soup对象时,我得到了所有的文本。(图像:souptext输出)

如何在Python上使用SeleniumWebDriver获得由HTML标记和文本(基本上是DOM的副本)组成的纯HTML数据

PS:对于非内联图像表示抱歉,因为我还没有发布内联消息的声誉。

您只需执行以下操作:

soup_page = BeautifulSoup(ele_html.content,"html.parser")
print(soup_page)

试试
print(soup)
这会给出页面的html打印(soup)和可视化str(soup)都会给出与我附上的截图相同的结果。不要发布代码的图像。在你的帖子中包含代码。那么,您如何从selenium获取html以及如何将其输入beautifulsoup?您最有可能需要从webdriver获取页面源代码:
soup=beautifulsoup(driver.page\u source,'html.parser')
@chitown88
driver.page\u source
适用于非javascript,不适用于用javascript开发的页面,例如,这不适用于您的解决方案。