Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/268.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 如何删除字符串中的任何utf8mb4字符_C#_.net_Utf 8_Utf8mb4 - Fatal编程技术网

C# 如何删除字符串中的任何utf8mb4字符

C# 如何删除字符串中的任何utf8mb4字符,c#,.net,utf-8,utf8mb4,C#,.net,Utf 8,Utf8mb4,使用C#如何从字符串中删除utf8mb4字符(表情符号等),从而使结果完全符合utf8 大多数解决方案都涉及更改数据库配置,但不幸的是,我没有这种可能性。这应该用replacementCharacter(甚至可能是string.Empty) 考虑到utf8mb4,这是一个MySql问题。MySql中的utf8和utf8mb4之间存在差异。区别在于utf8不支持4字节utf8序列。通过查看,4字节utf8序列是那些>0xFFFF的序列,因此在utf16中需要两个char(称为代理项对)。此方法用于

使用C#如何从字符串中删除utf8mb4字符(表情符号等),从而使结果完全符合utf8


大多数解决方案都涉及更改数据库配置,但不幸的是,我没有这种可能性。

这应该用
replacementCharacter
(甚至可能是
string.Empty

考虑到
utf8mb4
,这是一个MySql问题。MySql中的utf8和utf8mb4之间存在差异。区别在于utf8不支持4字节utf8序列。通过查看,4字节utf8序列是那些>0xFFFF的序列,因此在utf16中需要两个
char
(称为代理项对)。此方法用于删除代理项对字符。当发现“耦合”(高+低代理项对)时,将替换单个
replacementCharacter
,否则将用
replacementCharactere
替换孤立(错误)高或低代理项对

public static string RemoveSurrogatePairs(string str, string replacementCharacter = "?")
{
    if (str == null)
    {
        return null;
    }

    StringBuilder sb = null;

    for (int i = 0; i < str.Length; i++)
    {
        char ch = str[i];

        if (char.IsSurrogate(ch))
        {
            if (sb == null)
            {
                sb = new StringBuilder(str, 0, i, str.Length);
            }

            sb.Append(replacementCharacter);

            // If there is a high+low surrogate, skip the low surrogate
            if (i + 1 < str.Length && char.IsHighSurrogate(ch) && char.IsLowSurrogate(str[i + 1]))
            {
                i++;
            }
        }
        else if (sb != null)
        {
            sb.Append(ch);
        }
    }

    return sb == null ? str : sb.ToString();
}
公共静态字符串RemoveSurrogatePairs(字符串str,字符串replacementCharacter=“?”)
{
如果(str==null)
{
返回null;
}
StringBuilder sb=null;
对于(int i=0;i