C# WebCrawling动态链接
有人知道如何抓取具有动态页面/查询的网站吗?我的意思是,如果我单击某个链接,每次我尝试在web浏览器中重新加载它时,它都有不同的值。现在我的webcrawler无法下载这些页面的内容。请提供建议。您可能希望查看问题,了解如何编写爬虫程序的详细信息,或者查看包含良好爬虫程序的源代码(请参阅)。即使它是动态的或非动态的,也应该是相同的方式。事实上,爬虫只是由三件事组成的C# WebCrawling动态链接,c#,web-crawler,C#,Web Crawler,有人知道如何抓取具有动态页面/查询的网站吗?我的意思是,如果我单击某个链接,每次我尝试在web浏览器中重新加载它时,它都有不同的值。现在我的webcrawler无法下载这些页面的内容。请提供建议。您可能希望查看问题,了解如何编写爬虫程序的详细信息,或者查看包含良好爬虫程序的源代码(请参阅)。即使它是动态的或非动态的,也应该是相同的方式。事实上,爬虫只是由三件事组成的 网址 它发送到服务器的数据(如果是POST方法),然后 如果需要身份验证,则返回cookie 仅此而已 执行爬虫程序时的常见问题:
希望您能提供帮助。嗨,凯恩,谢谢您的回复,Searcharoo很有趣。不过,如果有人能指出如何做到这一点(如何从动态链接下载页面),那将大有帮助。看看Searcharoo的代码,我可能需要一些时间来理解它们的架构。