Python 有哪些算法&;数据结构对调整(金融)异步系统有用吗?

Python 有哪些算法&;数据结构对调整(金融)异步系统有用吗?,python,pandas,financial,Python,Pandas,Financial,我正在审核两个交易系统之间的一些财务数据。这两个数据集由事务列表组成。各有, 时间戳 特殊事务ID(不在系统之间共享) 交易记录值(项目名称、项目值、总计、调整) 数据不完善;10-20%的数据不一致 我用熊猫拼凑出了一个解决这个问题的办法。 一个简单的pandas.merge()太贪婪,会产生许多错误的匹配。一个好的匹配取决于数据集中的几个条件 除了熊猫,还有什么其他选择? 当我研究这个问题时,我发现一些答案表明操作会导致我担心数据丢失或重复 将其转化为一个更好的Stackoverflow

我正在审核两个交易系统之间的一些财务数据。这两个数据集由事务列表组成。各有,

  • 时间戳
  • 特殊事务ID(不在系统之间共享)
  • 交易记录值(项目名称、项目值、总计、调整)
数据不完善;10-20%的数据不一致

我用熊猫拼凑出了一个解决这个问题的办法。 一个简单的
pandas.merge()
太贪婪,会产生许多错误的匹配。一个好的匹配取决于数据集中的几个条件

除了熊猫,还有什么其他选择? 当我研究这个问题时,我发现一些答案表明操作会导致我担心数据丢失或重复

将其转化为一个更好的Stackoverflow问题:在两个独立系统之间匹配活动时,哪些流行算法或数据结构有用?

  • 不会改变原始数据集的东西
  • 不会从原始数据集中删除项目
  • 假设每个条目都有一个匹配项,该匹配项在其他数据集中存在或缺失
merge\u asof()
对“关闭”匹配进行合并,可以匹配到最近的大于或小于。你试过了吗?
merge\u asof()
对“关闭”匹配进行合并,可以匹配到最近的大于或小于。你试过了吗?