Python Numpy Bincount()与组合浮点和整数数组

Python Numpy Bincount()与组合浮点和整数数组,python,arrays,pandas,numpy,statistics,Python,Arrays,Pandas,Numpy,Statistics,我正试图写一个程序来收集股票交易的统计数据。我有一个价格数组和一个对应的数组,每个价格下的交易数量。我早些时候问了一个问题,得到了一些很好的答案,让我走上了正确的道路。现在我发现了新的问题 阵列的外观如下所示: price = [229.0, 229.3, 229.0, 229.1, 228.9, 229.0, 229.1] tradesize = [400, 800, 450, 65, 2, 600, 150] 228.9, 2 229.0, 1450 229.1, 215 229.3, 8

我正试图写一个程序来收集股票交易的统计数据。我有一个价格数组和一个对应的数组,每个价格下的交易数量。我早些时候问了一个问题,得到了一些很好的答案,让我走上了正确的道路。现在我发现了新的问题

阵列的外观如下所示:

price = [229.0, 229.3, 229.0, 229.1, 228.9, 229.0, 229.1]
tradesize = [400, 800, 450, 65, 2, 600, 150]
228.9, 2
229.0, 1450
229.1, 215
229.3, 800
我尝试了多种方法来获得模式和中位数,但成功率很低。我一直和熊猫一起遇到路障,然后换成了一个numpy阵列。首先,我试图通过使用价格作为数据帧中的索引,并通过以下方式获得其他列的总和,从而获得各个价格点的总和:

newarray = groupby['price'].sum()
这给了我一个很好的数组,看起来像这样:

price = [229.0, 229.3, 229.0, 229.1, 228.9, 229.0, 229.1]
tradesize = [400, 800, 450, 65, 2, 600, 150]
228.9, 2
229.0, 1450
229.1, 215
229.3, 800
这很有效,但我在提取价格栏时不断遇到问题

我的下一个想法是使用
np.bincount()
计算每个价格点的交易数量。我遇到了
TypeError的问题:无法根据“safe”规则将数组数据从dtype('float64')强制转换为dtype('int64')。当我将price更改为整数时,它工作得很好,但是舍入错误使代码基本上无用

我不确定如果不计算每个价格点的销售额,我是否能得到我需要的数据。例如,我查看了
np.argmax()
,但很快意识到这只给出了第一个最高的交易规模,如果合并交易增加了更高的价值,那么就真的失败了,比如上面示例中的229.3和229.0点

我没有使用任何特定的方法,因为我从CSV文件中提取数据作为pandas数据帧,从中获取各种信息,将其转换为pandas数组,最后从新数组中获取各种信息。每种方法似乎都提供了一个比另一个更适合一个数据点的小功能。如果有帮助的话,我正在处理数以万计的数据点,因此内存利用率和速度是一个值得关注的问题


我感谢任何帮助,并提前感谢所有人

仅供参考:
bincount
是为整数数组设计的,实际上只适用于相对较小的整数数组。通常,只要我问一个问题,我就会找到答案。我将price列设置为dataframe中的索引,并运行:
new=self.df.groupby(['price']).sum()mode=new['tradesize'].idxmax()
,似乎有答案。我不认为循环这个并确保在点击列中的第一个之后没有任何其他最大值隐藏会太困难