C# 如何加载动态生成的网页?

C# 如何加载动态生成的网页?,c#,html,html-agility-pack,data-scrubbing,C#,Html,Html Agility Pack,Data Scrubbing,我正在尝试加载网页,因此我可以擦洗该页面,不幸的是,该页面似乎是通过代码生成的,因此我正在寻找的标签不可用 使用以下内容加载它不起作用,因为它只加载源javascript,而不加载它生成的内容: HtmlWeb htmlWeb = new HtmlWeb(); imagepage = htmlWeb.Load(http://www.artstation.com/artist/nicotine); 如何将页面加载到浏览器中显示的页面,以便我可以将其删除以获取标记?您不能使用HtmlAgility

我正在尝试加载网页,因此我可以擦洗该页面,不幸的是,该页面似乎是通过代码生成的,因此我正在寻找的标签不可用

使用以下内容加载它不起作用,因为它只加载源javascript,而不加载它生成的内容:

HtmlWeb htmlWeb = new HtmlWeb();
imagepage = htmlWeb.Load(http://www.artstation.com/artist/nicotine);

如何将页面加载到浏览器中显示的页面,以便我可以将其删除以获取标记?

您不能使用HtmlAgilityPack进行此操作。当HAP要求服务器向您提供页面文件时,该文件的内容尚未被web浏览器解析/执行,因此其上的JavaScript尚未执行任何操作


这方面有一个解决办法。您可以使用或获取动态生成的标记的内容。这些工具具有浏览器堆栈,它将执行JavaScript。您可以找到许多其他类似的工具和大量示例。

我不确定什么是擦洗。如果您只是对获取HTML感兴趣,请在浏览器中加载网页并使用document.body.innerHTML。你也可以。你应该使用它来观察页面加载时经过的流量。除此之外,请阅读代码中的JavaScript。诚然,我认为指出这是一项道德责任,该网站看起来不像你所做的那样欢迎清理。这也似乎是,通过动态地执行,他们正在采取特定的步骤,以使其难以执行。