C# 十进制解析的更快替代方法_C#_Performance_Parsing_Decimal

C# 十进制解析的更快替代方法

c# performance parsing

C# 十进制解析的更快替代方法,c#,performance,parsing,decimal,C#,Performance,Parsing,Decimal,我注意到decimal.Parse（number，NumberStyles.AllowDecimalPoint，CultureInfo.InvariantCulture）比基于Jeffrey Sax的来自输出： 00:00:04.2313728 00:00:01.4464048 在这种情况下，Custom ParseDecimal比decimal.Parse快得多。Sax的方法之所以快，有两个原因。第一，你已经知道了。第二个原因是它能够利用n非常高效的8字节长数据类型。理解这种方法使用lon

我注意到

decimal.Parse（number，NumberStyles.AllowDecimalPoint，CultureInfo.InvariantCulture）

比基于Jeffrey Sax的来自

输出：

00:00:04.2313728
00:00:01.4464048

在这种情况下，Custom ParseDecimal比decimal.Parse快得多。

Sax的方法之所以快，有两个原因。第一，你已经知道了。第二个原因是它能够利用

非常高效的8字节长数据类型。理解这种方法使用long，也可以解释为什么（不幸的是）目前不可能对非常大的数字使用类似的方法

十进制构造函数中的前两个参数：

lo

和

mid

各使用4个字节。加在一起，这是与long相同的内存量。这意味着一旦长时间达到最大值，就没有空间继续运行

要使用类似的方法，您需要一个12字节的数据类型来代替long。这将为您提供使用

hi

参数所需的额外四个字节

Sax的方法非常聪明，但在有人编写12字节的数据类型之前，您只能依赖decimal.Parse。

谢谢您的评论，让我有了更多的见解。最后我做了如下的事情。如果输入太长，那么它将分离输入字符串，并使用long解析第一部分，使用int解析其余部分，int仍然比decimal.Parse快

这是我的最终生产代码：

public static int[] powof10 = new int[10]
{
    1,
    10,
    100,
    1000,
    10000,
    100000,
    1000000,
    10000000,
    100000000,
    1000000000
};
public static decimal ParseDecimal(string input)
{
    int len = input.Length;
    if (len != 0)
    {
        bool negative = false;
        long n = 0;
        int start = 0;
        if (input[0] == '-')
        {
            negative = true;
            start = 1;
        }
        if (len <= 19)
        {
            int decpos = len;
            for (int k = start; k < len; k++)
            {
                char c = input[k];
                if (c == '.')
                {
                    decpos = k +1;
                }else{
                    n = (n *10) +(int)(c -'0');
                }
            }
            return new decimal((int)n, (int)(n >> 32), 0, negative, (byte)(len -decpos));
        }else{
            if (len > 28)
            {
                len = 28;
            }
            int decpos = len;
            for (int k = start; k < 19; k++)
            {
                char c = input[k];
                if (c == '.')
                {
                    decpos = k +1;
                }else{
                    n = (n *10) +(int)(c -'0');
                }
            }
            int n2 = 0;
            bool secondhalfdec = false; 
            for (int k = 19; k < len; k++)
            {
                char c = input[k];
                if (c == '.')
                {
                    decpos = k +1;
                    secondhalfdec = true;
                }else{
                    n2 = (n2 *10) +(int)(c -'0');
                }
            }
            byte decimalPosition = (byte)(len -decpos);
            return new decimal((int)n, (int)(n >> 32), 0, negative, decimalPosition) *powof10[len -(!secondhalfdec ? 19 : 20)] +new decimal(n2, 0, 0, negative, decimalPosition);
        }
    }
    return 0;
}

输入：9999999999123.456789

00:00:02.7292447
00:00:00.6043730

00:00:05.3094786
00:00:01.9702198

输入：1.0

00:00:01.4212123
00:00:00.2378833

输入：0

00:00:01.1083770
00:00:00.1899732

输入：-3.3333333

00:00:06.2043707
00:00:02.0373628

如果输入仅由0-9组成。而且，还可以选择—在开始时，此自定义函数将字符串解析为十进制的速度要快得多。

是否仍应考虑负数？WillemVanOnsem Van Onsem，在我当前的用例中，我不需要负数。然而，这是一个对任何人都有用的一般问题，所以如果它支持负数，它会更好。十进制。PARSER（）是用C++编写的，在过去的20年中被编译成OS。你只能通过抄近路来加快速度。您没有明确说明您发现哪些bug是可以接受的。如果您想优化，输入值的统计分布是您的朋友。例如，如果大多数输入值是以1个字符串的形式输入的，那么您可以为这种情况编写更简单/更快的转换代码（您甚至不必处理符号字符）。如果负值不常见，则仅转换正值的代码将更快；您可能需要测试该符号一次，但如果不存在，则不必再次测试其值。我会看看你的输入值分布，看看你是否能利用它。请参阅我的实现。您不需要在长缓冲区中同时拥有所有位。

00:00:01.4212123
00:00:00.2378833

00:00:01.1083770
00:00:00.1899732

00:00:06.2043707
00:00:02.0373628