Python 如何确定多个外键中SQL插入的顺序?

Python 如何确定多个外键中SQL插入的顺序?,python,django,Python,Django,我最近刚开始使用Django,还没有停止使用python/Django,但我目前正在努力解决一个逻辑问题 情况(简化): (真正的用例由成百上千个这样的类组成,是的,它是一团乱,它清楚地证明了一个糟糕的数据库设计,但我不能改变这一点) 我在每个类上都创建了动态模型表单。一般用途是检索excel文件并将其插入字段验证等中的正确模型表单中。每个excel文件都有多个映射到类的表,第一行(标题)描述模型字段,所有其他行表示数据 数据完全未排序,因此通常不中断外键序列的插入顺序是A=>B=>C=>D。但

我最近刚开始使用Django,还没有停止使用python/Django,但我目前正在努力解决一个逻辑问题

情况(简化):

(真正的用例由成百上千个这样的类组成,是的,它是一团乱,它清楚地证明了一个糟糕的数据库设计,但我不能改变这一点)

我在每个类上都创建了动态模型表单。一般用途是检索excel文件并将其插入字段验证等中的正确模型表单中。每个excel文件都有多个映射到类的表,第一行(标题)描述模型字段,所有其他行表示数据

数据完全未排序,因此通常不中断外键序列的插入顺序是A=>B=>C=>D。但在这种情况下,整个序列可能类似于D=>B=>C=>A。当我验证第一个表D时,问题就出现了,因为相关的外键尚未定义,所以没有验证

问题是,如何添加所有数据并在之后验证引用完整性

提前谢谢


谢谢你的帮助

实际上,所有主键都是从根模型派生的,根模型保存所有子表的映射表。我在第一篇文章中没有提到这一点,因为我想让情况保持简单。话虽如此,我不能改变这一点(混乱!),也不能在类映射到任何现有(混乱!)数据库时重新设计它们。为了完成这个混乱,每个字段都被设置为“NOTNULL”

我的第二个想法是首先填充一个映射表(目前还不知道如何做),然后根据该表对传入的数据进行排序。听起来像是胡闹,很肮脏,我自己也不喜欢这个主意,我希望有更聪明的方法

你对这个问题的数学解答有什么建议吗?这就像在任意数据上生成一棵树

更新:

我做了两个函数来解决这个问题,还没有测试错误处理

validate_tables:查找与给定应用程序相关的所有表,并将嵌套列表(self.found_字段)保存在dict中(child:[parent,parent,(…])

gen_序列:写入一个列表(self.sequence),并将正确的序列映射到对象_名称

欢迎批准

这是我当前的解决方案(获取想法的片段)


您需要定义自己的主键,我假定您有一个合适的字段,否则不会发生此问题,并且允许ForeignKey为null。困难的部分将是稍后在Django中建立引用完整性

相反,我会有两个字段,一个是虚拟主键,另一个是当前外键为空:

class A(models.Model):
    foo = models.CharField(max_length=255)

class B(models.Model):
    bar = models.CharField(max_length=255)
    foo =  models.ForeignKey(A, null=True)
    foo_key =  models.CharField()
然后,在数据导入之后,找到所有具有foo_键的“B”对象,建立关系并将foo_键设置为null


这是我在将大量数据从以前的GAE项目导入PostgreSQL数据库时使用的机制。

这是一次性导入吗?或者你会定期这样做?这会定期发生。哎哟。是的,我会考虑要么按照我的建议去做,要么先使用外键,然后再使用更松散的连接(即总是查找值)。此外,在紧急情况下,您可以使用模型继承形式的巨型查找表,使用基本对象建立连接,然后稍后实例化细节
    def validate_tables(self):
        app = get_app("testdata")
        self.sequence = []
        self.found_fields = {}
        for model in get_models(app):
            hits = []
            for local_field in model._meta.local_fields:
                if isinstance(local_field, models.ForeignKey):
                    hits.append(local_field.related.parent_model._meta.object_name)
            self.found_fields.update({model._meta.object_name: hits})
        if self.gen_sequence():
            return True
        else:
            raise self.sequence_errors


    def gen_sequence(self, unresolved=None):

        if unresolved:
            self.found_fields = unresolved
            unresolved = {}
        else:
            unresolved = {}

        for model in self.found_fields:
            if ((all(parent in self.sequence for parent in self.found_fields[model]) 
                 and self.sequence)
                or not self.found_fields[model]):
                self.sequence.append(model)
            else:
                unresolved.update({model: self.found_fields[model]})

        if unresolved == self.found_fields:
            self.sequence_errors = unresolved
            return False
        elif not unresolved:
            return self.gen_sequence
        else:
            return self.gen_sequence(unresolved)
class A(models.Model):
    foo = models.CharField(max_length=255)

class B(models.Model):
    bar = models.CharField(max_length=255)
    foo =  models.ForeignKey(A, null=True)
    foo_key =  models.CharField()