Html 如何使用BeautifulSoup识别各种网站中的菜单?
我想确定在网站中有主菜单的div元素 我想到的方法是: 使用BeautifulSoup解析HTML 菜单通常有最高的链接 密度,即锚定标签计数或查找带有所有li标签的ul 有联系 上述方法可能会失败,因为在各种网站中,页脚元素可能具有高链接密度,例如: 另一种方法是在div元素的id或class属性中查找关键字菜单。这是一个非常昂贵的方法,因为我们最终可能会搜索很多单词 如果你能帮我找到解决这个问题的正确方向,那就太好了。Html 如何使用BeautifulSoup识别各种网站中的菜单?,html,css,beautifulsoup,Html,Css,Beautifulsoup,我想确定在网站中有主菜单的div元素 我想到的方法是: 使用BeautifulSoup解析HTML 菜单通常有最高的链接 密度,即锚定标签计数或查找带有所有li标签的ul 有联系 上述方法可能会失败,因为在各种网站中,页脚元素可能具有高链接密度,例如: 另一种方法是在div元素的id或class属性中查找关键字菜单。这是一个非常昂贵的方法,因为我们最终可能会搜索很多单词 如果你能帮我找到解决这个问题的正确方向,那就太好了。 谢谢 这很难,因为html中的菜单没有标准化。在DOM树中搜索ul/li
谢谢 这很难,因为html中的菜单没有标准化。在DOM树中搜索ul/li,在页脚前的第一个或第二个div中使用关键字menu等-这些位置通常用于菜单。或者等待html5和nav标签