C# 计算转义字符串_C#_String - Fatal编程技术网

C# 计算转义字符串

c# string

C# 计算转义字符串,c#,string,C#,String,我在文件中有一些已经转义的字符串。因此，文件的内容如下所示： Hello\nWorld. This is\tGreat. 当我读取文件时，我将\n作为两个不同的字符而不是一个如何将转义字符串转换为非转义字符串？试试以下方法： String replaced = startstring.Replace(System.Environment.NewLine, desirevalue); 这必须仅对“\n”有效。您可以执行以下操作： string str = str.Replace(@"\n",

我在文件中有一些已经转义的字符串。因此，文件的内容如下所示：

Hello\nWorld. This is\tGreat.

当我读取文件时，我将

\n

作为两个不同的字符而不是一个

如何将转义字符串转换为非转义字符串？

试试以下方法：

String replaced = startstring.Replace(System.Environment.NewLine, desirevalue);

这必须仅对“\n”有效。

您可以执行以下操作：

string str = str.Replace(@"\n","\n");

更新：显然，这是一种变通方法，因为场景本身是“不自然的”。

Regex.Unescape

解决方案在这里不适用，因为它用于取消Regex控制字符，而不是新行等

为了支持其他相关字符，可以编写如下替换函数：

public string ReEscapeControlCharacters(string str) {
   return str.Replace(@"\n","\n").Replace(@"\r","\r").Replace(@"\t","\t");
}

你可以尝试使用

网站上还有一个条目

另请参见。

与您一样，我无法找到解决此问题的适当方法。虽然您当然可以使用String.Replace，但此解决方案的性能和速度都非常糟糕。此外，通过这种方法很难支持八进制和Unicode转义序列。更好的选择是使用简单的正则表达式解析器。这里有一个方法可以正确地取消对给定字符串的转义。它支持标准转义序列、八进制转义序列和unicode转义序列

string UnEscape(string s) {
    StringBuilder sb = new StringBuilder();
    Regex r = new Regex("\\\\[abfnrtv?\"'\\\\]|\\\\[0-3]?[0-7]{1,2}|\\\\u[0-9a-fA-F]{4}|.");
    MatchCollection mc = r.Matches(s, 0);

    foreach (Match m in mc) {
        if (m.Length == 1) {
            sb.Append(m.Value);
        } else {
            if (m.Value[1] >= '0' && m.Value[1] <= '7') {
                int i = 0;

                for (int j = 1; j < m.Length; j++) {
                    i *= 8;
                    i += m.Value[j] - '0';
                }

                sb.Append((char)i);
            } else if (m.Value[1] == 'u') {
                int i = 0;

                for (int j = 2; j < m.Length; j++) {
                    i *= 16;

                    if (m.Value[j] >= '0' && m.Value[j] <= '9') {
                        i += m.Value[j] - '0';
                    } else if (m.Value[j] >= 'A' && m.Value[j] <= 'F') {
                        i += m.Value[j] - 'A' + 10;
                    } else if (m.Value[j] >= 'a' && m.Value[j] <= 'f') {
                        i += m.Value[j] - 'a' + 10;
                    }
                }

                sb.Append((char)i);
            } else {
                switch (m.Value[1]) {
                    case 'a':
                        sb.Append('\a');
                        break;
                    case 'b':
                        sb.Append('\b');
                        break;
                    case 'f':
                        sb.Append('\f');
                        break;
                    case 'n':
                        sb.Append('\n');
                        break;
                    case 'r':
                        sb.Append('\r');
                        break;
                    case 't':
                        sb.Append('\t');
                        break;
                    case 'v':
                        sb.Append('\v');
                        break;
                    default:
                        sb.Append(m.Value[1]);
                        break;
                }
            }
        }
    }

    return sb.ToString();
}

stringunescape（字符串s）{
StringBuilder sb=新的StringBuilder（）；
正则表达式r=new正则表达式（“\\\\[abfnrtv？\”'\\\\]\\[0-3]？[0-7]{1,2}\\\\\\u[0-9a-fA-F]{4}.”；
MatchCollection mc=r.Matches（s，0）；
foreach（在mc中匹配m）{
如果（m.Length==1）{
sb.追加（m.值）；
}否则{
基于@deAtog的代码，如果（m.Value[1]>='0'&&m.Value[1]='0'&&m.Value[j]='A'&&m.Value[j]='A'&&m.Value[j]，我做了一些小的补充

支持\U00000000格式字符
稍微简化十六进制转换
string UnEscape(string s)
{
    StringBuilder sb = new StringBuilder();
    Regex r = new Regex("\\\\[abfnrtv?\"'\\\\]|\\\\[0-3]?[0-7]{1,2}|\\\\u[0-9a-fA-F]{4}|\\\\U[0-9a-fA-F]{8}|.");
    MatchCollection mc = r.Matches(s, 0);

    foreach (Match m in mc)
    {
        if (m.Length == 1)
        {
            sb.Append(m.Value);
        }
        else
        {
            if (m.Value[1] >= '0' && m.Value[1] <= '7')
            {
                int i = Convert.ToInt32(m.Value.Substring(1), 8);
                sb.Append((char)i);
            }
            else if (m.Value[1] == 'u')
            {
                int i = Convert.ToInt32(m.Value.Substring(2), 16);
                sb.Append((char)i);
            }
            else if (m.Value[1] == 'U')
            {
                int i = Convert.ToInt32(m.Value.Substring(2), 16);
                sb.Append(char.ConvertFromUtf32(i));
            }
            else
            {
                switch (m.Value[1])
                {
                    case 'a':
                        sb.Append('\a');
                        break;
                    case 'b':
                        sb.Append('\b');
                        break;
                    case 'f':
                        sb.Append('\f');
                        break;
                    case 'n':
                        sb.Append('\n');
                        break;
                    case 'r':
                        sb.Append('\r');
                        break;
                    case 't':
                        sb.Append('\t');
                        break;
                    case 'v':
                        sb.Append('\v');
                        break;
                    default:
                        sb.Append(m.Value[1]);
                        break;
                }
            }
        }
    }

    return sb.ToString();
}

stringunescape（字符串s）
{
StringBuilder sb=新的StringBuilder（）；
正则表达式r=newregex（“\\\[abfnrtv？\”'\\\]\\\[0-3]？[0-7]{1,2}\\\\\u[0-9a-fA-F]{4}\\\\\u[0-9a-fA-F]{8}.”；
MatchCollection mc=r.Matches（s，0）；
foreach（在mc中匹配m）
{
如果（m.Length==1）
{
sb.追加（m.值）；
}
其他的
{
如果（m.Value[1]>='0'&&m.Value[1]，则这将是一个解释的\n
，而不是转义的文本“斜杠enn”.Quick correction:这是System.Text.RegularExpressions.Regex.Unescape
。请修改。Regex.Unescape
在这里不适用，它仅用于取消正则表达式控件字符的显示。它是否可以包含任何C#字符串文字可以包含的内容，如Unicode转义序列？引号呢？这是一种解决方法。如何\t和其他隐藏和控制字符？他应该为所有其他字符这么做吗？显然这是一个解决办法…我正在更新答案，并提供进一步的细节谢谢，这很好，我做了一些小的改进，以支持\U00000000格式字符，并在某种程度上简化十六进制转换。我已经提交了我的版本，但请随时输入把它变成你的。