Python 如何从<;类别';lxml.html.HtmlElement'&燃气轮机; 从pyquery导入pyquery作为pq 打印(pq)(url=)https://www.bing.com('div'))
若我在终端中运行代码,只输出这个Python 如何从<;类别';lxml.html.HtmlElement'&燃气轮机; 从pyquery导入pyquery作为pq 打印(pq)(url=)https://www.bing.com('div')),python,Python,若我在终端中运行代码,只输出这个 <div id="hp_container"><div id="bgDiv"><div id="bgImgProgLoad" data-ultra-definition-src="/th?id=OHR.AltaFloresta_... 当我在jupyterab中运行上述代码时,我得到以下结果 [<div#hp_container>, <div#
<div id="hp_container"><div id="bgDiv"><div id="bgImgProgLoad" data-ultra-definition-src="/th?id=OHR.AltaFloresta_...
当我在jupyterab中运行上述代码时,我得到以下结果
[<div#hp_container>, <div#bgDiv>, <div#bgImgProgLoad>, ...]
[,,…]
每个div标记的选择器将自动显示在结果中,如div#hp_container,
现在我只能在jupyterlab的输出中看到它们,我不知道获取每个选择器名称本身的属性或方法是什么
=================================
2021-05-15评论添加图片
我的意思是,当我输入
x
时,我可以看到选择器列表,我只是不知道如何将其转换为str列表中的“选择器”,或者更确切地说,每个元素的类都可以作为使用。元素上的class
iterable:
from pyquery import PyQuery as pq
for div in pq(url='https://www.bing.com')('div'):
print(list(div.classes))
结果:
['hpapp']
['hp_body']
['hpl']
['img_cont']
等(铸造到字符串以便打印)
如果您只是想像JupyterLab为您所做的那样显示元素名称和类:
pq中的元素的(url=)https://www.bing.com)(“div”):
打印(f'{elem.tag}{.''.join(elem.classes)}')
结果:
['hpapp']
['hp_body']
['hpl']
['img_cont']
div#hpapp
高压阀体
分区#hpl
分区(续)
等等。Thx很多,我可以使用像
pq(url=)这样的代码https://www.bing.com“)('div.sw_-sform')[0]。attrib
获取attr{'id':'sbox','class':'sw_-sform'}
并对其进行组装,但选择器已在结果中进行组装[…,…]
,我只是不知道如何得到这个字符串,
后面的部分似乎只是元素的类。您是否在询问如何将元素名div
及其类sbox
和sw_form
组合成类似div#sbox.sw_form
的字符串?也就是说,f'{elem.tag}{.''.join(elem.classes)}'
?也许我的表达式中有错误,我的意思是我已经看到了结果,但我不知道如何直接得到它,我编辑了我的问题并在其中添加了更多细节。