用于将HTML文件读取为XML(.NET)的库
重复:。请关上用于将HTML文件读取为XML(.NET)的库,.net,html,parsing,.net,Html,Parsing,重复:。请关上 你能给我推荐一个在.NET中以XML形式读取HTML文件的库吗?实际上,我更喜欢处理XML对象而不是文本。理想情况下,它必须修复HTML格式错误。您可能需要重新考虑这一点。这两者并不相等 一个很好的例子就是自动关闭标签 XML标准表示自动关闭标记如下所示: <br/> 而html标准将非内容标记作为单个标记 <br> <link rel="..."> 在html中,使用xml语法实际上是一种违反,因为/>具有不同的含义 在.中有更多
你能给我推荐一个在.NET中以XML形式读取HTML文件的库吗?实际上,我更喜欢处理XML对象而不是文本。理想情况下,它必须修复HTML格式错误。您可能需要重新考虑这一点。这两者并不相等 一个很好的例子就是自动关闭标签 XML标准表示自动关闭标记如下所示:
<br/>
而html标准将非内容标记作为单个标记
<br>
<link rel="...">
在html中,使用xml语法实际上是一种违反,因为/>
具有不同的含义
在.中有更多关于这些问题的例子,这正是问题的关键所在-他想要一个能够阅读HTML及其所有怪癖并将其作为格式良好的XHTML公开的库。所以
被翻译成
,隐式关闭
变成显式关闭,等等。我知道这一点。否则我会使用常规的XLINQ。