C# 从具有条件的字符串中删除特殊字符
我有一个字符串如下-C# 从具有条件的字符串中删除特殊字符,c#,.net,C#,.net,我有一个字符串如下- “这是一个地方/h2> 你知道这是个好地方 1月14日,星期一,预订了您的机票2013011474912_AN3P703C ” 所以,我希望我的字符串如下 “这是一个地方 你知道这是个好地方。 1月14日,星期一,预订您的机票 我相信这就是你的答案 试试这个: // <summary> /// Remove HTML from string with Regex. /// </summary> public static string Strip
“这是一个地方/h2>
你知道这是个好地方
- 1月14日,星期一,预订了您的机票2013011474912_AN3P703C
”
所以,我希望我的字符串如下
“这是一个地方
你知道这是个好地方。
1月14日,星期一,预订您的机票
我相信这就是你的答案
试试这个:
// <summary>
/// Remove HTML from string with Regex.
/// </summary>
public static string StripTagsRegex(string source)
{
return Regex.Replace(source, "<.*?>", string.Empty);
}
//
///使用正则表达式从字符串中删除HTML。
///
公共静态字符串StripTagsRegex(字符串源)
{
返回Regex.Replace(source,“,string.Empty);
}
输出:
Input: <p>The <b>dog</b> is <i>cute</i>.</p>
Output: The dog is cute.
Input:这条狗很可爱
输出:这只狗很可爱。
您可以使用以下方法从任何字符串中删除HTML标记
static string StripHTML (string inputString)
{
return Regex.Replace(inputString, "<.*?>", string.Empty);
}
静态字符串StripHTML(字符串输入字符串)
{
返回Regex.Replace(inputString,“,string.Empty);
}
在您的情况下,这将完成工作
String neededString = Regex.Replace(source, "<.*?>", string.Empty);
String needString=Regex.Replace(source,”,String.Empty);
对于包含CSS的更复杂的字符串,JavaScript节点u可以使用以下命令
String neededStringRegex.Replace(subjectString, @"<(style|script)[^<>]*>.*?</\1>|</?[a-z][a-z0-9]*[^<>]*>|<!--.*?-->", "")
String needStringRegex.Replace(subjectString,@“*?| |“,”)
下载并参考,然后调用以下命令:
var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(input);
string output = htmlDoc.DocumentNode.InnerText;
这仍然不会删除格式错误的
/h2>
标记,但它应该处理比正则表达式多得多的HTML。这应该可以解决问题
string input = "This is <h2> a place</h2><p>You know its a good place!</p><ul> <li>Booked your ticket #20130114074912_AN3P703C on Monday, January 14</li></ul>";
input = Regex.Replace(input, "<.*?>", string.Empty);
string input=“这是一个地方你知道这是一个好地方!- 在1月14日(星期一)预订了你的机票;
input=Regex.Replace(输入“”,string.Empty);
这将查找包含在“”中的所有字符串,并将其替换为“”或根节点的空字符串?PS:如果你有有效的XML/HTML,可能会有帮助……链接很好,但是包含了链接页面中的一些相关内容。如果链接被破坏,只有链接的答案很容易变得无用。从该页面添加一些内容,或者至少添加要查找的组件/软件的名称。@gideon,我可以像Thorsten那样(通过输入链接和复制粘贴)给他3行,但我更希望他能看到差异并为他选择最好的。@Niranjan Kala,感谢您的编辑,以后我会这样写我的文章。除非标签中有一个
属性。。。(这也不会删除格式错误的/h2>
,尽管这可能是一个丢失的原因。)