Html 是否可以通过编程方式获取网页的生成源？_Html_Dom

Html 是否可以通过编程方式获取网页的生成源？

html dom

Html 是否可以通过编程方式获取网页的生成源？,html,dom,Html,Dom,正如标题所述，我想知道是否有一种方法可以获取页面生成的HTML代码。显然，我可以使用web开发人员工具（内置浏览器或外部程序）检查页面并获取它，但我真的很想自动完成。也许使用Fiddler的API是可能的谢谢您可以用Python编写一个脚本，该脚本将接受一个变量（URL）并在下载网页的命令（如wget）后插入该变量通过谷歌搜索，我发现了解析HTML文件的方法：也许你可以设置index.HTML并使用以下方法之一：页面加载后，JavaScript不会更改“源”，更改的是从源代码生成的文档对

正如标题所述，我想知道是否有一种方法可以获取页面生成的HTML代码。显然，我可以使用web开发人员工具（内置浏览器或外部程序）检查页面并获取它，但我真的很想自动完成。也许使用Fiddler的API是可能的

谢谢

您可以用Python编写一个脚本，该脚本将接受一个变量（URL）并在下载网页的命令（如wget）后插入该变量

通过谷歌搜索，我发现了解析HTML文件的方法：也许你可以设置index.HTML并使用以下方法之一：页面加载后，JavaScript不会更改“源”，更改的是从源代码生成的文档对象模型（DOM）。正是这个DOM随后被转换为GUI，只要页面没有重新加载，它就会随着每次更改而改变

DOM不是一个HTML代码字符串，而是页面的内存层次对象表示。当DOM被更改时，浏览器不会维护其最新的平面文件表示形式，这就是为什么当您“查看源”时，您只能看到最初通过HTTP发送到浏览器的内容

在Firebug等开发工具中，页面/DOM的节点对节点表示是最接近于重新生成源代码（AFAIK）的，而无需自己构建新工具

您的意思是从页面本身的JavaScript获取页面的源代码，还是使用计算机上运行的脚本获取目标URL的源代码（如果是这样，您使用的是特定的语言）？或者，您是在专门搜索Fiddler的API吗？这会很有意思吗？@JeremyBanksᐛ 基本上，我希望能够在生成和加载任何动态内容后捕获网页的源代码，无论是通过AJAX、简单的JavaScript“用Y替换加载时的X”或任何其他方法。@DC_u我将尝试一下，看看这是否适合我的需要。我的程序将用.NET（更具体地说是c#）编写，所以也许我可以实现