Python 数组fileld postgres中最常见的单词
我有一个模型,里面有一个数组字段。此字段包含每个实体的一些单词。模型如下:Python 数组fileld postgres中最常见的单词,python,django,postgresql,counter,aggregate-functions,Python,Django,Postgresql,Counter,Aggregate Functions,我有一个模型,里面有一个数组字段。此字段包含每个实体的一些单词。模型如下: class Entity(models.Model): words = ArrayField( models.CharField(max_length=255, blank=True), null=True, blank=True ) 我想积累这个模型的所有对象的列表,并找到这些数组中出现的100个最常见的单词。在Postgresql中有什么方法可以做到这
class Entity(models.Model):
words = ArrayField(
models.CharField(max_length=255, blank=True),
null=True,
blank=True
)
我想积累这个模型的所有对象的列表,并找到这些数组中出现的100个最常见的单词。在Postgresql中有什么方法可以做到这一点,或者有效的方法是什么?如果近似答案足够好,并且表格统计数据相当准确,您可以使用Postgresql收集的数组元素统计数据来解决您的问题 假设表名为
public.entity
,属性为words
,此查询将生成所需的结果:
SELECT mce.elem
FROM pg_stats s
CROSS JOIN LATERAL
unnest(most_common_elems::text::text[],
most_common_elem_freqs) mce(elem, freq)
WHERE s.schemaname = 'public'
AND s.tablename = 'entity'
AND s.attname = 'words'
AND mce.elem IS NOT NULL
ORDER BY mce.freq DESC
LIMIT 100;
Django中是否有解决方案,而不是执行原始查询?我不知道Django,但我怀疑没有什么东西不能读取整个表并计算所有内容。