python中的ZScore计算值与预期值不同

python中的ZScore计算值与预期值不同,python,Python,处理数据集,尝试使用zscore扩展数据 Zscore公式为(值-平均值)/std,在这种情况下,因为我们的第一次观察值为10000(在Avg_Mthly_Expense列中),而平均值为4850,std为2877.59545 根据公式,zscore应该是1.78968,但是当使用zscore库时,不确定为什么zscore使用python笔记本中的zscore包计算1.886498 请参阅所附图像,其中描述了数据集,并在应用zscore后缩放了数据集。zscore疏散时为1.886498,而不是

处理数据集,尝试使用zscore扩展数据

Zscore公式为(值-平均值)/std,在这种情况下,因为我们的第一次观察值为10000(在Avg_Mthly_Expense列中),而平均值为4850,std为2877.59545

根据公式,zscore应该是1.78968,但是当使用zscore库时,不确定为什么zscore使用python笔记本中的zscore包计算1.886498

请参阅所附图像,其中描述了数据集,并在应用zscore后缩放了数据集。zscore疏散时为1.886498,而不是1.78968

查看jupyter笔记本中的图像


这可能取决于您如何计算标准差,因为它取决于
var
(方差)


在方差公式中,您可以除以
n
n-1
(取决于所需的估计器);我认为差异是

< P>熊猫描述方法计算STD,考虑数据作为样本而不是整个种群,而在ZSCORE中计算标准偏差时,将数据视为总人口,默认DDOF为零。将自由度设为1,可将其视为样本,并与描述方法相匹配。
custDataScaled=custDataAttr.apply(zscore,ddof=1)

Hello@YambdaJamba。你能给问题加上相关的代码吗?也许可以将问题简化为演示问题并添加示例数据的最小示例?请随时查看我正在使用熊猫的标准描述方法来显示平均值和标准偏差。数据中只有10条记录,可能是使用不同的方法来描述函数,以计算平均值或标准偏差,这可能与zscore的计算方法不同。我也没有挑战性,但我想了解为什么它不同。我使用熊猫的标准描述方法来显示平均值和标准偏差。数据中只有10条记录,可能是使用不同的方法来描述函数,以计算平均值或标准偏差,这可能与zscore的计算方法不同。我也不是在挑战,但我想了解为什么不同。然后你需要检查熊猫是如何计算他们的性病的