Python 包含表单的网站遍历算法

Python 包含表单的网站遍历算法,python,algorithm,web,hyperlink,traversal,Python,Algorithm,Web,Hyperlink,Traversal,我成功地记录了网站的所有链接,但错过了一些只能通过表单发布才能看到的链接(例如登录) 我所做的是记录所有的链接没有登录。并采取了价值观的形式。然后我发布了数据并记录了新的链接,但在这里我错过了其他表单和链接,这些表单和链接不在发布的链接中 请建议任何有效的算法,以便我可以通过发布表单数据获取所有链接 提前感谢。一组网页中的链接可以看作是树图,因此您可以使用各种树遍历算法,如深度优先和广度优先搜索来查找所有链接。链接和相关表单数据可以保存在队列或堆栈中,具体取决于您使用的遍历算法

我成功地记录了网站的所有链接,但错过了一些只能通过表单发布才能看到的链接(例如登录)

我所做的是记录所有的链接没有登录。并采取了价值观的形式。然后我发布了数据并记录了新的链接,但在这里我错过了其他表单和链接,这些表单和链接不在发布的链接中

请建议任何有效的算法,以便我可以通过发布表单数据获取所有链接


提前感谢。

一组网页中的链接可以看作是树图,因此您可以使用各种树遍历算法,如深度优先和广度优先搜索来查找所有链接。链接和相关表单数据可以保存在队列或堆栈中,具体取决于您使用的遍历算法