C#删除HTML代码并合并段落

C#删除HTML代码并合并段落,c#,string,C#,String,我有以下意见: <p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc a dignissim purus. Curabitur enim nibh, tempor id lobortis tincidunt, adipiscing ac felis. Nunc interdum ullamcorper tortor non elementum. Praesent felis mauris, volutpat

我有以下意见:

<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc a dignissim purus. Curabitur enim nibh, tempor id lobortis tincidunt, adipiscing ac felis. Nunc interdum ullamcorper tortor non elementum. Praesent felis mauris, volutpat eu cursus nec, luctus vel odio.</p>

<p>Morbi elementum nunc at nulla iaculis tincidunt. Vivamus sit amet sapien vel enim lacinia ultrices sit amet ac urna. Sed semper mauris id nulla consectetur viverra. Quisque eget leo nisl. Etiam et risus sapien. Aenean vitae ante et erat tincidunt ullamcorper vel a odio. Integer hendrerit turpis et enim convallis rhoncus pharetra enim ullamcorper. Suspendisse porta mollis purus, in lacinia nunc sollicitudin vel. Nam id ligula mi.</p>
Lorem ipsum Door sit amet,是一位杰出的领导者。努克是一位贵宾。库拉比图尔·埃尼姆·尼布,临时工洛博蒂·廷西登,一只正在交配的猫科动物。非要素侵权人之间的权利。猫科动物毛里斯(mauris)的祖先、欧洲国家委员会(nec)的祖先、奥迪奥(odio)的祖先

在NallaIaculis tincidunt的Morbi elementum nunc。生活在智慧的世界里,生活在美好的世界里。塞德·森佩尔·莫里斯(semper mauris id nulla concertetur viverra)。奎斯克·埃吉特·利奥·尼索。埃蒂亚姆和圣人。我们的生活充满希望。整只圆背龟和圆背龟。在lacinia nunc sollicitudin vel中的mollis purus门悬吊。Nam id ligula mi

如果没有HTML代码(这很容易),但又没有段落组合,我如何获得输出?像这样:

Lorem ipsum dolor sit amet,是一位杰出的献身者。Nunc a 普卢斯贵人。库拉比图尔·埃尼姆·尼布,临时工, 一只正在交配的猫科动物。非要素侵权人之间的权利。 猫科动物毛里斯(mauris)的祖先、欧洲国家委员会(nec)的祖先、奥迪奥(odio)的祖先。莫比 纳拉亚库利斯廷西德努克元素。维瓦摩斯坐在智慧之谷 埃尼姆·拉西尼亚·乌尔特里斯坐在我的座位上。Sed semper mauris id nulla 维韦拉圣殿酒店。奎斯克·埃吉特·利奥·尼索。埃蒂亚姆和圣人。 我们的生活充满希望。整数 hendrerit turpis和enim convallis rhoncus pharetra和enim ullamcorper。 在lacinia nunc sollicitudin vel中的mollis purus门悬吊。不结盟运动 我是ligula mi


谢谢

只需阅读html并将

替换为
,同时删除换行符(
\r\n
),我认为您可以很容易地删除html,然后可以使用正则表达式删除多余的空白:

string input = "Lorem ipsum dolor sit amet, consectetur \r\n Morbi elementum nunc at nulla.";
string pattern = @"\s+";
string replacement = " ";
string output = Regex.Replace(input, pattern, replacement);
使用HTML解析器非常简单:

// remove the html tags
var doc = new HtmlDocument();
doc.LoadHtml(htmlString);
string result = doc.DocumentNode.InnerText;

// remove the line breaks
result = result.Replace("\r", "");
result = result.Replace("\n", "");

您好,有很多DLL可用于
HTML
-
String
转换。但是您想要一个定制的标签(将合并段落),输入中是否使用了除

之外的任何标签?