提取嵌入式<;span>;然后再次<;span>;使用BeautifulSoup的Python数据

提取嵌入式<;span>;然后再次<;span>;使用BeautifulSoup的Python数据,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试着从中得到“5天前” 实际数据如下所示 扎克 • 5天前 什么时候运行这个 soup.find('div',{“class”:“C(#9595)Fz(11px)D(ib)Mb(6px)}) 我明白了 Zacks 请告诉我如何获取span text ie。。“5天前”您可以直接找到您的5天前的css选择器。只需右键单击它,然后单击inspect元素。当检查工具打开时,右键单击并转到“复制”菜单,然后出现“复制css选择器” 另一个解决方案 from simplified_scrapy i

我正试着从中得到“5天前” 实际数据如下所示


扎克
•
5天前
什么时候运行这个

soup.find('div',{“class”:“C(#9595)Fz(11px)D(ib)Mb(6px)})

我明白了

Zacks


请告诉我如何获取span text ie。。“5天前”

您可以直接找到您的
5天前的css选择器。只需右键单击它,然后单击inspect元素。当检查工具打开时,右键单击并转到“复制”菜单,然后出现“复制css选择器”

另一个解决方案

from simplified_scrapy import SimplifiedDoc
html = '''
<div class="C(#959595) Fz(11px) D(ib) Mb(6px)" data-reactid="11">
<span>Zacks</span>
<i aria-hidden="true" class="Mx(4px)">•</i>
<span>5 days ago</span>
</div>
'''
doc  = SimplifiedDoc(html)
# Use <i> to locate
text = doc.getElement('div',value='C(#959595) Fz(11px) D(ib) Mb(6px)').getElement('i',value='Mx(4px)').getNext('span').text
print (text)
# Take the last one
text = doc.getElement('div',value='C(#959595) Fz(11px) D(ib) Mb(6px)').spans[-1].text
print (text)

根据上面粘贴的元素,这应该可以
soup.select('.Mb\(6px\)span')[-1]。text
from simplified_scrapy import SimplifiedDoc
html = '''
<div class="C(#959595) Fz(11px) D(ib) Mb(6px)" data-reactid="11">
<span>Zacks</span>
<i aria-hidden="true" class="Mx(4px)">•</i>
<span>5 days ago</span>
</div>
'''
doc  = SimplifiedDoc(html)
# Use <i> to locate
text = doc.getElement('div',value='C(#959595) Fz(11px) D(ib) Mb(6px)').getElement('i',value='Mx(4px)').getNext('span').text
print (text)
# Take the last one
text = doc.getElement('div',value='C(#959595) Fz(11px) D(ib) Mb(6px)').spans[-1].text
print (text)
5 days ago
5 days ago