Asp.net 将样式标记、CSS、脚本和HTML标记从HTML删除为纯文本

Asp.net 将样式标记、CSS、脚本和HTML标记从HTML删除为纯文本,asp.net,regex,Asp.net,Regex,使用正则表达式,如何将样式标记、CSS、脚本和HTML标记从HTML删除为纯文本 在ASP.NET C#.中,我认为您不需要正则表达式来实现这一点,但是下面的正则表达式应该可以实现这一点, 如果运行正则表达式替换: <[^>]*> ]*> 要在正则表达式中使用它,请替换为以下内容: string myHtmlString = "<html><body>my test text</body></html>"; string m

使用正则表达式,如何将样式标记、CSS、脚本和HTML标记从HTML删除为纯文本


在ASP.NET C#.

中,我认为您不需要正则表达式来实现这一点,但是下面的正则表达式应该可以实现这一点, 如果运行正则表达式替换:

<[^>]*>
]*>
要在正则表达式中使用它,请替换为以下内容:

string myHtmlString = "<html><body>my test text</body></html>";

string myPlainTextString = Regex.Replace(myHtmlString ,"<[^>]*>",String.Empty);
string myHtmlString=“我的测试文本”;
字符串myPlainTextString=Regex.Replace(myHtmlString,]*>,string.Empty);
不过,我建议您使用类似Html Agility pack的东西-

因为它有一种称为“ConvertToPlainText”的方法使这一过程更加容易:

string myHtmlString=“我的测试文本”;
字符串myPlainTextString=ConvertTopLaintText(myHtmlString);

我不认为您正在寻找一个正则表达式来实现这一点,但是下面的正则表达式应该可以实现这一点, 如果运行正则表达式替换:

<[^>]*>
]*>
要在正则表达式中使用它,请替换为以下内容:

string myHtmlString = "<html><body>my test text</body></html>";

string myPlainTextString = Regex.Replace(myHtmlString ,"<[^>]*>",String.Empty);
string myHtmlString=“我的测试文本”;
字符串myPlainTextString=Regex.Replace(myHtmlString,]*>,string.Empty);
不过,我建议您使用类似Html Agility pack的东西-

因为它有一种称为“ConvertToPlainText”的方法使这一过程更加容易:

string myHtmlString=“我的测试文本”;
字符串myPlainTextString=ConvertTopLaintText(myHtmlString);

接受您最近的问题。@vasmay,当您的问题得到合理的答案时,单击勾号接受答案。@vasmay,是否要从.html文件中删除这些内容?接受您最近的问题。@vasmay,当您的问题得到合理的答案时,单击勾号接受答案。@vasmay,是否要从.html文件中删除这些内容?