C# 哪一个是最好的HTML整洁包?HTML agility pack中是否有使HTML网页整洁的选项?

C# 哪一个是最好的HTML整洁包?HTML agility pack中是否有使HTML网页整洁的选项?,c#,winforms,html-parsing,html-agility-pack,htmltidy,C#,Winforms,Html Parsing,Html Agility Pack,Htmltidy,我正在使用html agility pack来解析html表格信息。现在有一些html内容缺少结尾标记,由于缺少结尾标记,html agility pack无法正确解析信息。因此,我想在缺少结尾标记的地方插入结尾标记,以便html agility pack正确解析信息。因此,要插入缺少的结尾标记,我应该怎么做?我应该为此编写自己的代码,还是使用html-tidy-pack 如果是html tidy pack,那么哪个是最好的html tidy pack,如果可能,如何使用它?如果我的拥有自己的代

我正在使用html agility pack来解析html表格信息。现在有一些html内容缺少结尾标记,由于缺少结尾标记,html agility pack无法正确解析信息。因此,我想在缺少结尾标记的地方插入结尾标记,以便html agility pack正确解析信息。因此,要插入缺少的结尾标记,我应该怎么做?我应该为此编写自己的代码,还是使用html-tidy-pack

如果是html tidy pack,那么哪个是最好的html tidy pack,如果可能,如何使用它?如果我的拥有自己的代码,它会是什么样子


html agility pack中是否有任何选项可以使我们首先使html页面整洁,然后解析网页。

在html agility pack中,我找不到任何使html页面整洁的选项。有一个选项可以插入缺少的结束标记,但在某些html页面中有效只有。html敏捷包中的选项是

  HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
      doc.OptionFixNestedTags=true;
我也尝试过regex,但它也只适用于一些html页面

因此我发现最好的html整洁包是:

我们可以看到:如何导入dll和如何使用整洁的包,还有示例代码。这真是太棒了。它可以插入缺少的结束标记,使你的html页面整洁。


感谢大家的帮助。

我发现HTML-Tidy()能够最好地整理和清理HTML

不同的二进制文件在这里->

还有许多语言的HTML Tidy包装。我为C#使用了一个名为TidyHTML5ManagedReplack的工具

我特别需要清理格式不良的HTML,并将其与在不同浏览器中通过javascript调整的相同或类似的HTML进行比较。HTMLTidy允许我将HTML清理到正常/标准化的状态,这样我就可以将它与其他浏览器调整过的相同HTML进行比较,从而确信它很可能是相同的