Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/css/35.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html 如何使用BeautifulSoup识别各种网站中的菜单?_Html_Css_Beautifulsoup - Fatal编程技术网

Html 如何使用BeautifulSoup识别各种网站中的菜单?

Html 如何使用BeautifulSoup识别各种网站中的菜单?,html,css,beautifulsoup,Html,Css,Beautifulsoup,我想确定在网站中有主菜单的div元素 我想到的方法是: 使用BeautifulSoup解析HTML 菜单通常有最高的链接 密度,即锚定标签计数或查找带有所有li标签的ul 有联系 上述方法可能会失败,因为在各种网站中,页脚元素可能具有高链接密度,例如: 另一种方法是在div元素的id或class属性中查找关键字菜单。这是一个非常昂贵的方法,因为我们最终可能会搜索很多单词 如果你能帮我找到解决这个问题的正确方向,那就太好了。 谢谢 这很难,因为html中的菜单没有标准化。在DOM树中搜索ul/li

我想确定在网站中有主菜单的div元素

我想到的方法是:

使用BeautifulSoup解析HTML 菜单通常有最高的链接 密度,即锚定标签计数或查找带有所有li标签的ul 有联系 上述方法可能会失败,因为在各种网站中,页脚元素可能具有高链接密度,例如:

另一种方法是在div元素的id或class属性中查找关键字菜单。这是一个非常昂贵的方法,因为我们最终可能会搜索很多单词

如果你能帮我找到解决这个问题的正确方向,那就太好了。
谢谢

这很难,因为html中的菜单没有标准化。在DOM树中搜索ul/li,在页脚前的第一个或第二个div中使用关键字menu等-这些位置通常用于菜单。或者等待html5和nav标签