Python 如何在某些div中搜索标记,不包括其他类似命名的div?

Python 如何在某些div中搜索标记,不包括其他类似命名的div?,python,html,beautifulsoup,Python,Html,Beautifulsoup,我正在尝试清理此网站: 获取此信息:“2017年5月23日” 但是页面侧面的新闻文章的名称类似,因此我无法挑出我要查找的标签,这会扭曲我的结果。我有什么地方做错了吗 我正在努力确保我不会在页面右侧看到“datetime”标签,这些标签链接到文章和讨论板 这是我试图使用的代码 datePre = soup.find('div', id='oos_px') soup = BeautifulSoup(unicode(datePre), 'lxml') dateList = soup.find_all(

我正在尝试清理此网站:

获取此信息:“2017年5月23日”

但是页面侧面的新闻文章的名称类似,因此我无法挑出我要查找的标签,这会扭曲我的结果。我有什么地方做错了吗

我正在努力确保我不会在页面右侧看到“datetime”标签,这些标签链接到文章和讨论板

这是我试图使用的代码

datePre = soup.find('div', id='oos_px')
soup = BeautifulSoup(unicode(datePre), 'lxml')
dateList = soup.find_all('time')
endingString = str(dateList[-1])
timeStart = endingString.index('\"') + 1
timeEnd = timeStart + 10
dateString = endingString[timeStart:timeEnd]
有人告诉我名单超出范围了?它应该会生成一个结果集,我可以通过它进行搜索,对吗?我一整天都在为这个发呆,这让我发疯了哈哈。感谢所有在这里冒险的人

global dateString
soup.select(".oos_contletList time")
dateList = soup.find_all('time')
endingString = str(dateList[-1])

更新的代码应该可以工作,但仍在侧边栏的新闻网站上获取最新帖子。

我还没有用beautiful soup尝试过这一点,但下面的css选择器应该是正确的。
用铬测试选择器

for elm in soup.select(".oos_contletList time"):
    print(elm.text)

我试图使用css选择器来排除您提到的那些。如果我成功了,我会发回的。

非常感谢,让我试试你说的。这很奇怪,但它抓住的是“2017-07-19”,而不是实际内容,有什么想法吗?在我的文章中查看我的编辑以获取代码更新:)在这种情况下,您正在查找innerHTML。可能有一种很好的汤法可以做到这一点。我会用一些伪代码编辑我的答案谢谢!!你真棒。当然,让我试一下。