Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/81.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html 是否可以通过编程方式获取网页的生成源?_Html_Dom - Fatal编程技术网

Html 是否可以通过编程方式获取网页的生成源?

Html 是否可以通过编程方式获取网页的生成源?,html,dom,Html,Dom,正如标题所述,我想知道是否有一种方法可以获取页面生成的HTML代码。显然,我可以使用web开发人员工具(内置浏览器或外部程序)检查页面并获取它,但我真的很想自动完成。也许使用Fiddler的API是可能的 谢谢 您可以用Python编写一个脚本,该脚本将接受一个变量(URL)并在下载网页的命令(如wget)后插入该变量 通过谷歌搜索,我发现了解析HTML文件的方法:也许你可以设置index.HTML并使用以下方法之一: 页面加载后,JavaScript不会更改“源”,更改的是从源代码生成的文档对

正如标题所述,我想知道是否有一种方法可以获取页面生成的HTML代码。显然,我可以使用web开发人员工具(内置浏览器或外部程序)检查页面并获取它,但我真的很想自动完成。也许使用Fiddler的API是可能的


谢谢

您可以用Python编写一个脚本,该脚本将接受一个变量(URL)并在下载网页的命令(如wget)后插入该变量

通过谷歌搜索,我发现了解析HTML文件的方法:也许你可以设置index.HTML并使用以下方法之一: 页面加载后,JavaScript不会更改“源”,更改的是从源代码生成的文档对象模型(DOM)。正是这个DOM随后被转换为GUI,只要页面没有重新加载,它就会随着每次更改而改变

DOM不是一个HTML代码字符串,而是页面的内存层次对象表示。当DOM被更改时,浏览器不会维护其最新的平面文件表示形式,这就是为什么当您“查看源”时,您只能看到最初通过HTTP发送到浏览器的内容


在Firebug等开发工具中,页面/DOM的节点对节点表示是最接近于重新生成源代码(AFAIK)的,而无需自己构建新工具

您的意思是从页面本身的JavaScript获取页面的源代码,还是使用计算机上运行的脚本获取目标URL的源代码(如果是这样,您使用的是特定的语言)?或者,您是在专门搜索Fiddler的API吗?这会很有意思吗?@JeremyBanksᐛ 基本上,我希望能够在生成和加载任何动态内容后捕获网页的源代码,无论是通过AJAX、简单的JavaScript“用Y替换加载时的X”或任何其他方法。@DC_u我将尝试一下,看看这是否适合我的需要。我的程序将用.NET(更具体地说是c#)编写,所以也许我可以实现