Python 以零表示标量结果的求和列

Python 以零表示标量结果的求和列,python,pandas,numpy,bigdata,Python,Pandas,Numpy,Bigdata,我用标量对pandasdataframe的一列求和,结果是一列充满了零。奇怪的是,有时它会返回零,有时它不会。如果有人告诉我,我不会相信,这就是为什么我制作了一个视频来展示这个结果: 谁能给我解释一下这个黑魔法吗?我对熊猫失去了信任,我真的需要它来工作 好的,通过这段代码,我可以得到一个类似的错误: import pandas as pd import numpy as np from pdb import set_trace as pdb for _ in xrange(100):

我用标量对
pandas
dataframe的一列求和,结果是一列充满了零。奇怪的是,有时它会返回零,有时它不会。如果有人告诉我,我不会相信,这就是为什么我制作了一个视频来展示这个结果:

谁能给我解释一下这个黑魔法吗?我对熊猫失去了信任,我真的需要它来工作

好的,通过这段代码,我可以得到一个类似的错误:

import pandas as pd
import numpy as np
from pdb import set_trace as pdb

for _ in xrange(100):
    data = np.random.randint(1,100000,1000000)
    df = pd.DataFrame(data,columns=['column'])
    scalar = np.random.randint(1,100000)
    df.column += scalar
    if df.column.max()==0:
        pdb()
我的数据变量充满了零。是内存问题吗?如果我的数据较小,则不会发生这种情况,但我需要以安全的方式处理大数据

>> print pandas.__version__
0.17.1
>> print numpy.__version__
1.10.1

Python 2.7.11 |Anaconda 2.4.1 (64-bit)

问题在于我的
numexpr=2.4.4
版本更新为
numexpr=2.4.6
修复了问题。Github问题:

请发布代码来重现您的问题。这种情况发生在我自己无法传输的巨大数据集上。我将尝试使用一些合成数据集。但正如您所看到的,代码很简单,df['column']+scalar@FabioLamannaI无法重现您的错误,对我来说,它工作正常,并且我获得了一个没有零值的数据帧。你可以发布你的python、numpy、pandas版本吗?人们能解释一下为什么他们对这个投反对票吗?这是一个严重的问题。。!我不能复制这个。我猜是你的电脑/安装上的东西。