Python 靓汤,使用时恰到好处;findAll();
我正在使用python(3.5)、selenium(3.6)和BeautifulSoup(4.6)创建一个站点。 im用于查找特定html标记的代码如下所示:Python 靓汤,使用时恰到好处;findAll();,python,html,selenium,beautifulsoup,Python,Html,Selenium,Beautifulsoup,我正在使用python(3.5)、selenium(3.6)和BeautifulSoup(4.6)创建一个站点。 im用于查找特定html标记的代码如下所示: descContainer=descContainers[0].findAll("div", {"class":"userHtml"}) 不幸的是,我不仅找到了我的目标部门: <div class="userHtml"> 但也包括以下div,其类名部分由感兴趣的类名组成: <div class="cept-thr
descContainer=descContainers[0].findAll("div", {"class":"userHtml"})
不幸的是,我不仅找到了我的目标部门:
<div class="userHtml">
但也包括以下div,其类名部分由感兴趣的类名组成:
<div class="cept-threadUpdate-html toggleSect-hide--collapsed userHtml space--b-2 space--h-2" data-lightbox-xhr="{"name":"thread_updates"}" data-handler="lightbox-xhr emoticon-preview">
有没有办法只找到精确的匹配项,而不是找到以某种方式包含所述类名的所有类?您应该看看这个问题: 答案似乎是:
descContainer = descContainers[0].find_all(lambda tag: tag.name == 'div' and
tag.get('class') == ['userHtml'])
那么更简洁易读的:
descContainers[0].select("div[class=userHtml]")