Python 当给定从SeleniumWebDriver获得的HTML数据时，BeautifulSoup如何从HTML中获取文本_Python_Selenium_Web Scraping_Beautifulsoup

Python 当给定从SeleniumWebDriver获得的HTML数据时，BeautifulSoup如何从HTML中获取文本

python selenium web-scraping

Python 当给定从SeleniumWebDriver获得的HTML数据时，BeautifulSoup如何从HTML中获取文本,python,selenium,web-scraping,beautifulsoup,Python,Selenium,Web Scraping,Beautifulsoup,我正在抓取在JS上开发的网页。我能够从页面中获取HTML内容，但是当我可视化页面的BeautifulSoup内容时，数据似乎缺少文本信息，我看到的只是脚本信息。（图：soupstr输出）然而，当我显式地调用.text到Beautiful soup对象时，我得到了所有的文本。（图像：souptext输出）如何在Python上使用SeleniumWebDriver获得由HTML标记和文本（基本上是DOM的副本）组成的纯HTML数据 PS：对于非内联图像表示抱歉，因为我还没有发布内联消息的

我正在抓取在JS上开发的网页。我能够从页面中获取HTML内容，但是当我可视化页面的BeautifulSoup内容时，数据似乎缺少文本信息，我看到的只是脚本信息。（图：soupstr输出）然而，当我显式地调用.text到Beautiful soup对象时，我得到了所有的文本。（图像：souptext输出）

如何在Python上使用SeleniumWebDriver获得由HTML标记和文本（基本上是DOM的副本）组成的纯HTML数据

PS：对于非内联图像表示抱歉，因为我还没有发布内联消息的声誉。

您只需执行以下操作：

soup_page = BeautifulSoup(ele_html.content,"html.parser")
print(soup_page)

试试

print（soup）

这会给出页面的html打印（soup）和可视化str（soup）都会给出与我附上的截图相同的结果。不要发布代码的图像。在你的帖子中包含代码。那么，您如何从selenium获取html以及如何将其输入beautifulsoup？您最有可能需要从webdriver获取页面源代码：

soup=beautifulsoup（driver.page\u source，'html.parser'）

@chitown88

driver.page\u source

适用于非javascript，不适用于用javascript开发的页面，例如，这不适用于您的解决方案。