C# html文档比较

C# html文档比较,c#,html,html-parsing,dom,C#,Html,Html Parsing,Dom,我想比较一下Html文档是否有相同的标记和相同的排列,而不管不同的内部文本和属性值是否不同。我只想比较一下一般的标记结构。比如 <html> <head> </head> <body> <span class="my paragraph">comparison of general tag structure of html</span> </body> </html> html通用标记结构的比

我想比较一下Html文档是否有相同的标记和相同的排列,而不管不同的内部文本和属性值是否不同。我只想比较一下一般的标记结构。比如

<html>
<head>
</head> 
<body>
<span class="my paragraph">comparison of general tag structure of html</span>
</body>
</html>

html通用标记结构的比较


免费会员优惠
都一样

但是


不同的
html通用标记结构的比较

不一样,因为在标记的html结构中有一个额外的标题标记,而不管内部值和属性值是否相同。

如果您愿意使用php,有几个类似的函数将查找模式。您可以使用
file
将html文件读入数组,每一行都是数组中的另一个条目。然后对另一个html文件执行相同的操作。然后你可以去搜索第一个标记(又名:以
开头的标记)。然后去搜索另一个html文件中的相同标记,计算该标记出现的次数。冲洗并重复。我将分两个阶段进行:

第1阶段(检查是否相等):
删除标记和属性之间的所有内容,然后将结果作为(不区分大小写)字符串进行比较

如果它们不同,也应如此:

第二阶段(找出差异):

这一阶段很大程度上取决于您想要报告的差异,因此我无法给出具体的建议如何实现它。

您只想知道它们是否不同,还是还想知道差异?我认为在这两种情况下,将html文档解析为XML都会有所帮助。是的,我也想知道差异。ou应该做什么t但是有什么不同吗?我想对代码做一些修改可能会适合你的需要。哦,thanx我也想要同样的东西。这会有很大帮助。
<html>
<head>
</head> 
<body>
<span class="Mega Offer">free membership offer</span>
</body>
</html>
<html>
<head><title>Different</title>
</head> 
<body>
<span class="my paragraph">comparison of general tag structure of html</span>
</body>
</html>