C# html文档比较
我想比较一下Html文档是否有相同的标记和相同的排列,而不管不同的内部文本和属性值是否不同。我只想比较一下一般的标记结构。比如C# html文档比较,c#,html,html-parsing,dom,C#,Html,Html Parsing,Dom,我想比较一下Html文档是否有相同的标记和相同的排列,而不管不同的内部文本和属性值是否不同。我只想比较一下一般的标记结构。比如 <html> <head> </head> <body> <span class="my paragraph">comparison of general tag structure of html</span> </body> </html> html通用标记结构的比
<html>
<head>
</head>
<body>
<span class="my paragraph">comparison of general tag structure of html</span>
</body>
</html>
html通用标记结构的比较
及
免费会员优惠
都一样
但是
不同的
html通用标记结构的比较
不一样,因为在标记的html结构中有一个额外的标题标记,而不管内部值和属性值是否相同。如果您愿意使用php,有几个类似的函数将查找模式。您可以使用
file
将html文件读入数组,每一行都是数组中的另一个条目。然后对另一个html文件执行相同的操作。然后你可以去搜索第一个标记(又名:以
开头的标记)。然后去搜索另一个html文件中的相同标记,计算该标记出现的次数。冲洗并重复。我将分两个阶段进行:
第1阶段(检查是否相等):删除标记和属性之间的所有内容,然后将结果作为(不区分大小写)字符串进行比较 如果它们不同,也应如此: 第二阶段(找出差异):
这一阶段很大程度上取决于您想要报告的差异,因此我无法给出具体的建议如何实现它。您只想知道它们是否不同,还是还想知道差异?我认为在这两种情况下,将html文档解析为XML都会有所帮助。是的,我也想知道差异。ou应该做什么t但是有什么不同吗?我想对代码做一些修改可能会适合你的需要。哦,thanx我也想要同样的东西。这会有很大帮助。
<html>
<head>
</head>
<body>
<span class="Mega Offer">free membership offer</span>
</body>
</html>
<html>
<head><title>Different</title>
</head>
<body>
<span class="my paragraph">comparison of general tag structure of html</span>
</body>
</html>