Github BeautifulSoup部分div类匹配
我需要通过抓取从Github获取里程碑信息。 里程碑信息嵌入在两种类型的div类中:Github BeautifulSoup部分div类匹配,github,beautifulsoup,Github,Beautifulsoup,我需要通过抓取从Github获取里程碑信息。 里程碑信息嵌入在两种类型的div类中: 表格列表项目里程碑未到期和表格列表项目里程碑 如何检索这两个类中包含的信息 我有: millements=soup.find_all('div',{'class':'table list item millements'}) 但此行返回表列表项里程碑未到期的空列表 现在我正在做以下(丑陋的黑客): 有什么优雅的解决方案吗 根据问题,BeautifulSoup应该返回所有匹配的。我的问题正好相反 soup.fin
表格列表项目里程碑未到期
和表格列表项目里程碑
如何检索这两个类中包含的信息
我有:
millements=soup.find_all('div',{'class':'table list item millements'})
但此行返回表列表项里程碑未到期的空列表
现在我正在做以下(丑陋的黑客):
有什么优雅的解决方案吗
根据问题,BeautifulSoup应该返回所有匹配的。我的问题正好相反
soup.find_all('div', {'class': 'milestone'})
或使用CSS选择器:
soup.select('.milestone')
在bs4中,类
是多值属性:
它存储在列表中:[表列表项,里程碑,未到期]和[表列表项,里程碑]
您需要做的是找到共享值,比如
里程碑
我想知道,在这种情况下,[表列表项,里程碑]
对于其他列表来说是如何不常见的。使用里程碑
只会有帮助!谢谢
soup.select('.milestone')