Python 美化组不显示标签<;a>;在标签中<;部门>;

Python 美化组不显示标签<;a>;在标签中<;部门>;,python,html,parsing,beautifulsoup,Python,Html,Parsing,Beautifulsoup,在一些测试中,我注意到div标记中的a,beautifulsoup自动将其“翻译”为文本: <div class='a'> <a href='....'>TEXT</a> <i ..... </div> 为什么? 更新:刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在,(用prettify查看输出)我意识到标签bs4使我将其视为一个div,而实际上它是一个标签a!奇怪 虫子 已解决 我做了一些清理并删除了所有请求

在一些测试中,我注意到div标记中的abeautifulsoup自动将其“翻译”为文本:

<div class='a'>
   <a href='....'>TEXT</a>
   <i .....
</div>
为什么?

更新:刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在,(用prettify查看输出)我意识到标签bs4使我将其视为一个div,而实际上它是一个标签a!奇怪

虫子

已解决 我做了一些清理并删除了所有请求和urllib3的包。。。然后我用apt重新安装了一切,现在一切正常了。
requests和urllib3的软件包版本分别为:2.12.4-11.19.1-1我无法复制您的问题,但您使用的HTML中有一个输入错误:
clas='a'
应该是
class='a'

我使用的代码是:

从bs4导入美化组
html=“”
.....
'''
soup=BeautifulSoup(html,'html.parser')
data=soup.find_all('div',{'class':'a'})
对于div-in数据:
印刷品(a部分)
我得到的结果是:

<a href="....">TEXT</a>


.text
将不显示标记,而仅显示所选标记及其子标记内的文本。您还需要使用
BeautifulSoup
对象才能使用
find_all
方法

抱歉。。。我写错了。。。但问题依然存在。请再读一遍。。。我纠正了假设:刚才我注意到。。。还有一个问题。在源代码中有标签a。。。但是现在,(用prettify查看输出)我意识到标记bs4使我将其视为一个div,而实际上它是一个标记a!奇怪!!!BUG???@vincenzogianfelice我认为问题不在bs4上,因为它在我这方面与python3配合得很好。如中所述,对python2的bs4支持已经停止。如果您仍然想使用python2,请尝试卸载bs4并执行
pip2安装beautifulsoup4
事实上,我已经安装了带有pip2的最新版本。但我试着做些别的。。。如果我把这段代码直接粘贴到beautifulsoup中,一切都很好,但是如果我试图通过请求检索文档,那么“a”标记就不会向我读取它<代码>美化组(requests.get(url,headers.content,'lxml')我已经解决了这个问题。但我不知道怎么。。。我做了一些清理并删除了python请求和urllib3的所有包。。。然后我用apt重新安装了一切,现在一切正常。。。别问我怎么。。。但现在一切都很好!谢谢你的耐心和晚上好(来自意大利)。
<a href="....">TEXT</a>