C# 正则表达式在打开和打开之间替换Unicode;结束语

C# 正则表达式在打开和打开之间替换Unicode;结束语,c#,.net,regex,C#,.net,Regex,我需要最快的方法来替换字符串中的unicode符号,该字符串位于“标记”旁边 例如,输入字符串: <एक्सएम्ेल type = "ए"> क्सएम् </एक्सएम्ेल> क्सएम् 预期产出: <REPLACED type = "ए"> क्सएम् </REPLACED>` क्सएम् ` 不应替换标记内的值或type元素的值,只应替换标记名 这是我尝试的代码&不起作用 pri

我需要最快的方法来替换字符串中的unicode符号,该字符串位于“标记”旁边

例如,输入字符串:

<एक्सएम्ेल type = "ए"> क्सएम् </एक्सएम्ेल>
क्सएम् 
预期产出:

 <REPLACED type = "ए"> क्सएम् </REPLACED>`
क्सएम् `
不应替换标记内的值或type元素的值,只应替换标记名

这是我尝试的代码&不起作用

private static Regex _compiledUnicodeRegex = new Regex(@"<[^\u0000-\u007F]", RegexOptions.Compiled);



    public static String StripUnicodeCharactersFromString(string inputValue)
    {
        return _compiledUnicodeRegex.Replace(inputValue, "REPLACED");
    }

private static Regex\u compiledUnicodeRegex=new Regex(@"您想替换由非ASCII字符组成的一条文本,这是在您之前问过这个问题之后才做的。众所周知,Regex在这方面做得很差,它是针对正则表达式而不是标记语言的,您有没有可能使用专用的xml解析器来解析它?没有办法将其解析为xml,前面的问题是有人说这可能与其他问题重复,但字符串不是XML字符串,我需要做的只是验证字符串在之后是否为unicode(?好的,我们可以假设这与html/xml无关,所以一旦提供了解决方案,您就不会再问如何排除某些
CDATA
部分中的文本,如何只替换特定的匹配打开和关闭标记而不是所有文本出现,…?即使您的标题提到regex,您实际上也希望快速更新(性能方面)文本操作技术,不管是正则表达式还是其他什么?有趣的事实:在C#内部字符串中,所有内容都是unicode。但是,并非每个字符都是unicode,因为一些罕见的符号由多个字符表示。因此,如果我理解正确,您通常希望在第一个
?但是,您的描述与您的示例不一致。请澄清。啊,这看起来更好,当他们分发正则表达式技能时,我躲在门后。关于自动关闭标签,例如?@Gulikz,我认为这符合当前的要求。
var result = Regex.Replace(text, @"(?<=</?)[^\x00-\x7F]+", "REPLACED");