Python 美化组不显示标签<；a>；在标签中<；部门>；_Python_Html_Parsing_Beautifulsoup

Python 美化组不显示标签<；a>；在标签中<；部门>；

python html parsing

Python 美化组不显示标签<；a>；在标签中<；部门>；,python,html,parsing,beautifulsoup,Python,Html,Parsing,Beautifulsoup,在一些测试中，我注意到div标记中的a，beautifulsoup自动将其“翻译”为文本： <div class='a'> <a href='....'>TEXT</a> <i ..... </div> 为什么? 更新：刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在，（用prettify查看输出）我意识到标签bs4使我将其视为一个div，而实际上它是一个标签a！奇怪虫子已解决我做了一些清理并删除了所有请求

在一些测试中，我注意到div标记中的a，beautifulsoup自动将其“翻译”为文本：

<div class='a'>
   <a href='....'>TEXT</a>
   <i .....
</div>

为什么?

更新：刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在，（用prettify查看输出）我意识到标签bs4使我将其视为一个div，而实际上它是一个标签a！奇怪

虫子

已解决 我做了一些清理并删除了所有请求和urllib3的包。。。然后我用apt重新安装了一切，现在一切正常了。

requests和urllib3的软件包版本分别为：2.12.4-1和1.19.1-1我无法复制您的问题，但您使用的HTML中有一个输入错误：

clas='a'

应该是

class='a'

我使用的代码是：

从bs4导入美化组
html=“”
.....
'''
soup=BeautifulSoup（html，'html.parser'）
data=soup.find_all（'div'，{'class'：'a'}）
对于div-in数据：
印刷品（a部分）

我得到的结果是：

<a href="....">TEXT</a>

.text

将不显示标记，而仅显示所选标记及其子标记内的文本。您还需要使用

BeautifulSoup

对象才能使用

find_all

方法

抱歉。。。我写错了。。。但问题依然存在。请再读一遍。。。我纠正了假设：刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在，（用prettify查看输出）我意识到标记bs4使我将其视为一个div，而实际上它是一个标记a！奇怪！！！BUG？？？@vincenzogianfelice我认为问题不在bs4上，因为它在我这方面与python3配合得很好。如中所述，对python2的bs4支持已经停止。如果您仍然想使用python2，请尝试卸载bs4并执行

pip2安装beautifulsoup4

事实上，我已经安装了带有pip2的最新版本。但我试着做些别的。。。如果我把这段代码直接粘贴到beautifulsoup中，一切都很好，但是如果我试图通过请求检索文档，那么“a”标记就不会向我读取它<代码>美化组（requests.get（url，headers.content，'lxml'）我已经解决了这个问题。但我不知道怎么。。。我做了一些清理并删除了python请求和urllib3的所有包。。。然后我用apt重新安装了一切，现在一切正常。。。别问我怎么。。。但现在一切都很好！谢谢你的耐心和晚上好（来自意大利）。

<a href="....">TEXT</a>