django ORM合并数据
我遇到了一个问题,我找不到一个优雅的方法来解决它 我们有一个应用程序,可以监控音频输入,并尝试根据声音指纹分配匹配项 应用程序每隔几秒钟获取一个样本,然后进行查找并将时间戳结果存储在数据库中 指纹识别并不总是准确的,因此分配“错误”项目的情况时有发生。因此,数据看起来像:django ORM合并数据,django,orm,merge,Django,Orm,Merge,我遇到了一个问题,我找不到一个优雅的方法来解决它 我们有一个应用程序,可以监控音频输入,并尝试根据声音指纹分配匹配项 应用程序每隔几秒钟获取一个样本,然后进行查找并将时间戳结果存储在数据库中 指纹识别并不总是准确的,因此分配“错误”项目的情况时有发生。因此,数据看起来像: timestamp foreign_id my comment -------------------------------------------------- 12:00:00
timestamp foreign_id my comment
--------------------------------------------------
12:00:00 17
12:00:10 17
12:00:20 17
12:00:30 17
12:00:40 723 wrong match
12:00:50 17
12:01:00 17
12:01:10 17
12:01:20 None no match
12:01:30 17
12:01:40 18
12:01:50 18
12:02:00 18
12:02:10 18
12:02:20 18
12:02:30 992 wrong match
12:02:40 18
12:02:50 18
因此,我正在寻找一种定期“清理”数据的方法
有人能想出一个好办法来实现这一点吗?在给定的示例中,应将外来id为723的条目更正为17等,并在可能的情况下,设置一个关于应考虑来回多少条条目的阈值
不确定我的问题是否足够清楚,但欢迎任何意见 多次检查数据库中是否存在外来id,然后检查这些时间是否接近 为什么不在使用数据时忽略“坏”数据