C# HtmlAgilityPack td.innertext bug?

C# HtmlAgilityPack td.innertext bug?,c#,visual-studio-2010,html-agility-pack,C#,Visual Studio 2010,Html Agility Pack,我正在根据数据库中的数据构建一些表。这是从很多国际来源,所以我有编码问题,我想我得到了他们都清除。但现在我看到一些奇怪的输出,不知道为什么 这是VS2010中的一个C#应用程序。在调试中运行时,我看到类中的字符串开始: Animal and vegetable oils 1 < 5 MW <br>5-50 MW 30 <br> td.InnerHtml显示 Animal and vegetable oils 1 < 5=\"\" mw=\"\">

我正在根据数据库中的数据构建一些表。这是从很多国际来源,所以我有编码问题,我想我得到了他们都清除。但现在我看到一些奇怪的输出,不知道为什么

这是VS2010中的一个C#应用程序。在调试中运行时,我看到类中的字符串开始:

Animal and vegetable oils  1 < 5 MW <br>5-50 MW  30 <br>
td.InnerHtml显示

Animal and vegetable oils  1 < 5=\"\" mw=\"\"><br>5-50 MW  30 <br>
动植物油1<5=\“\”mw=\“\”>
5-50 mw 30

为什么要在文本中加上等号和转义引号???它并不是在所有数据中都这样做,只是在一些文件中。有什么想法吗?(注:字符串中有html分隔符未显示,如何发布以使其忽略html?尝试了“用4个空格缩进,但似乎不起作用”)

HTML Agility Pack的HTML解析器正在处理
没有想到这一点,你是对的,我应该为HTML编码。但是输出正确地显示在其他地方。问题是我得到的是添加的“=”“'显示在我文本中的单词后面。你看到有什么相关的原因了吗?在我写下这些之后,我想我意识到发生了什么。因为<没有编码,它可能假设它是一个标记的开头,然后解析每个单词,希望它们是一个没有值的参数,这就是为什么我得到=”,因为就它而言,这个单词是一个空白的标记参数。是的,这正是发生的情况。我一直在努力获得高质量的输出数据,这些数据来自于电子表格中存储的经常有缺陷的数据,有时是HTML编码的,有时不是,因为它是国际性的,所以充满了奇怪的字符。现在我只是错过了显而易见的东西哈哈。谢谢
Animal and vegetable oils  1 < 5=\"\" mw=\"\"><br>5-50 MW  30 <br>