Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/154.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python pandas统计函数和boost::累加器之间的差异_Python_C++_Pandas_Boost - Fatal编程技术网

Python pandas统计函数和boost::累加器之间的差异

Python pandas统计函数和boost::累加器之间的差异,python,c++,pandas,boost,Python,C++,Pandas,Boost,对于使用pandas和boost::累加器进行的统计计算,我得到了不同的结果,我不确定原因 下面我有一个简单的例子,使用pandas计算一些回报的均值和方差 import pandas vals = [ 1, 1, 2, 1, 3, 2, 3, 4, 6, 3, 2, 1 ] rets = pandas.Series(vals).pct_change() print(f'count: {len(rets)}') print(f'mean: {rets.mean()}') pri

对于使用
pandas
boost::累加器进行的统计计算,我得到了不同的结果,我不确定原因

下面我有一个简单的例子,使用pandas计算一些回报的均值和方差

import pandas

vals = [ 1, 1, 2, 1, 3, 2, 3, 4, 6, 3, 2, 1 ]
rets = pandas.Series(vals).pct_change()

print(f'count:    {len(rets)}')
print(f'mean:     {rets.mean()}')
print(f'variance: {rets.var()}')
其输出为:

我在C++中使用等价于<代码> Boo::累加器< /COD>用于统计计算< /P>

#include <iostream>
#include <iomanip>
#include <cmath>
#include <boost/accumulators/accumulators.hpp>
#include <boost/accumulators/statistics/stats.hpp>
#include <boost/accumulators/statistics/count.hpp>
#include <boost/accumulators/statistics/mean.hpp>
#include <boost/accumulators/statistics/variance.hpp>

namespace acc = boost::accumulators;

int main()
{
    acc::accumulator_set<double, acc::stats<acc::tag::count,
                                            acc::tag::mean,
                                            acc::tag::variance>> stats;

    double prev = NAN;
    for (double val : { 1, 1, 2, 1, 3, 2, 3, 4, 6, 3, 2, 1 })
    {
        const double ret = (val - prev) / prev;

        stats(std::isnan(ret) ? 0 : ret);

        prev = val;
    }

    std::cout << std::setprecision(16)
              << "count:    " << acc::count(stats)    << '\n'
              << "mean:     " << acc::mean(stats)     << '\n'
              << "variance: " << acc::variance(stats) << '\n';

    return 0;
}
  • 为什么熊猫和熊猫之间的均值和方差不同
  • 我需要做什么才能从boost::累加器中获得结果

在pandas中,当您通过defualt执行
mean
操作时,它将删除
nan
列,如果我们将
nan
填充为0,则输出相同,因为您执行
pct\u更改
,第一项应为nan

rets.mean()
Out[67]: 0.19696969696969696

rets.fillna(0).mean()
Out[69]: 0.18055555555555555

关于
var
将自由设置为0

rets.fillna(0).var(ddof=0)
Out[86]: 0.5160108024691358

我仍然得到了一个不同的方差结果:
rets.fillna(0.var()
-->
0.5629208754208754
@SteveLorimer抱歉,只需获得时间回复
rets.fillna(0.var)(ddof=0)
您需要为0默认1tanks添加自由度!你知道有没有可能走另一条路?ie:get
ddof=1
result from
boost::Accumerators
?@SteveLorimer如果克隆boost.math的头部,可能会有所帮助,您可以使用boost/math/tools/univariate_statistics.hpp获得正确答案。
rets.mean()
Out[67]: 0.19696969696969696

rets.fillna(0).mean()
Out[69]: 0.18055555555555555
rets.fillna(0).var(ddof=0)
Out[86]: 0.5160108024691358