C# 如何从url(.NET核心控制台应用程序)获取完整的DOM html源代码?
我试图从中提取相同的html源代码,相当于您可以在web浏览器DOM中检查的完整html。但是我只能从网站上获得源代码的第一个/默认版本。我还希望得到动态创建的JavaScript、JSON文件和之后加载的ajax 我的问题是:当我在浏览器DOM(在.net核心控制台应用程序中)中检查网站内容时,如何获得相同的html代码 我尝试过类似问题的解决方案:C# 如何从url(.NET核心控制台应用程序)获取完整的DOM html源代码?,c#,dom,web-scraping,C#,Dom,Web Scraping,我试图从中提取相同的html源代码,相当于您可以在web浏览器DOM中检查的完整html。但是我只能从网站上获得源代码的第一个/默认版本。我还希望得到动态创建的JavaScript、JSON文件和之后加载的ajax 我的问题是:当我在浏览器DOM(在.net核心控制台应用程序中)中检查网站内容时,如何获得相同的html代码 我尝试过类似问题的解决方案: 使用硒和幻影但是PhantomJS不再受支持,并且不能与.NETCore一起工作(如果我错了,请纠正我) 使用WebBrowser类(Syst
- 使用硒和幻影但是PhantomJS不再受支持,并且不能与.NETCore一起工作(如果我错了,请纠正我)
- 使用WebBrowser类(System.Windows.Forms)--但您似乎只能在WinForms中使用它,或者将其添加为对普通.NETFramework控制台应用程序的引用
公共静态字符串GetHTMLSource(字符串userInputURL)
{
var pathToBrowser=@“C:\Program Files\Google\Chrome\Application\Chrome.exe”;
变量参数=
$@"
--无头
--禁用gpu
--启用日志记录
--隐藏滚动条
--延迟=10000
--转储dom
https://www.mercedes-benz.co.uk/passengercars.html?csref=mbcom_generic_pc&group=all&subgroup=all.BODYTYPE.coupe&view=BODYTYPE#modeltabs
";
var psi=new ProcessStartInfo(路径浏览器,参数)
{
UseShellExecute=false,
动词=“符文”,
重定向标准输出=真
};
进程webProcess=进程启动(psi);
返回webProcess.StandardOutput.ReadToEnd();
}
非常感谢所有的帮助