Python 有哪些算法&;数据结构对调整(金融)异步系统有用吗?
我正在审核两个交易系统之间的一些财务数据。这两个数据集由事务列表组成。各有,Python 有哪些算法&;数据结构对调整(金融)异步系统有用吗?,python,pandas,financial,Python,Pandas,Financial,我正在审核两个交易系统之间的一些财务数据。这两个数据集由事务列表组成。各有, 时间戳 特殊事务ID(不在系统之间共享) 交易记录值(项目名称、项目值、总计、调整) 数据不完善;10-20%的数据不一致 我用熊猫拼凑出了一个解决这个问题的办法。 一个简单的pandas.merge()太贪婪,会产生许多错误的匹配。一个好的匹配取决于数据集中的几个条件 除了熊猫,还有什么其他选择? 当我研究这个问题时,我发现一些答案表明操作会导致我担心数据丢失或重复 将其转化为一个更好的Stackoverflow
- 时间戳
- 特殊事务ID(不在系统之间共享)
- 交易记录值(项目名称、项目值、总计、调整)李>
pandas.merge()
太贪婪,会产生许多错误的匹配。一个好的匹配取决于数据集中的几个条件
除了熊猫,还有什么其他选择?
当我研究这个问题时,我发现一些答案表明操作会导致我担心数据丢失或重复
将其转化为一个更好的Stackoverflow问题:在两个独立系统之间匹配活动时,哪些流行算法或数据结构有用?
- 不会改变原始数据集的东西
- 不会从原始数据集中删除项目
- 假设每个条目都有一个匹配项,该匹配项在其他数据集中存在或缺失
merge\u asof()
对“关闭”匹配进行合并,可以匹配到最近的大于或小于。你试过了吗?merge\u asof()
对“关闭”匹配进行合并,可以匹配到最近的大于或小于。你试过了吗?