Python 如何从<;类别';lxml.html.HtmlElement'&燃气轮机; 从pyquery导入pyquery作为pq 打印(pq)(url=)https://www.bing.com('div'))

Python 如何从<;类别';lxml.html.HtmlElement'&燃气轮机; 从pyquery导入pyquery作为pq 打印(pq)(url=)https://www.bing.com('div')),python,Python,若我在终端中运行代码,只输出这个 <div id="hp_container"><div id="bgDiv"><div id="bgImgProgLoad" data-ultra-definition-src="/th?id=OHR.AltaFloresta_... 当我在jupyterab中运行上述代码时,我得到以下结果 [<div#hp_container>, <div#

若我在终端中运行代码,只输出这个

<div id="hp_container"><div id="bgDiv"><div id="bgImgProgLoad" data-ultra-definition-src="/th?id=OHR.AltaFloresta_...
当我在jupyterab中运行上述代码时,我得到以下结果

[<div#hp_container>, <div#bgDiv>, <div#bgImgProgLoad>, ...]
[,,…]
每个div标记的选择器将自动显示在结果中,如div#hp_container, 现在我只能在jupyterlab的输出中看到它们,我不知道获取每个选择器名称本身的属性或方法是什么

=================================

2021-05-15评论添加图片


我的意思是,当我输入
x
时,我可以看到选择器列表,我只是不知道如何将其转换为str

列表中的“选择器”,或者更确切地说,每个元素的类都可以作为
使用。元素上的class
iterable:

from pyquery import PyQuery as pq

for div in pq(url='https://www.bing.com')('div'):
    print(list(div.classes))
结果:

['hpapp']
['hp_body']
['hpl']
['img_cont']
等(铸造到字符串以便打印)

如果您只是想像JupyterLab为您所做的那样显示元素名称和类:

pq中的元素的
(url=)https://www.bing.com)(“div”):
打印(f'{elem.tag}{.''.join(elem.classes)}')
结果:

['hpapp']
['hp_body']
['hpl']
['img_cont']
div#hpapp
高压阀体
分区#hpl
分区(续)

等等。

Thx很多,我可以使用像
pq(url=)这样的代码https://www.bing.com“)('div.sw_-sform')[0]。attrib
获取attr
{'id':'sbox','class':'sw_-sform'}
并对其进行组装,但选择器已在结果中进行组装
[…,…]
,我只是不知道如何得到这个字符串,
后面的部分似乎只是元素的类。您是否在询问如何将元素名
div
及其类
sbox
sw_form
组合成类似
div#sbox.sw_form
的字符串?也就是说,
f'{elem.tag}{.''.join(elem.classes)}'
?也许我的表达式中有错误,我的意思是我已经看到了结果,但我不知道如何直接得到它,我编辑了我的问题并在其中添加了更多细节。