Mongodb/python统计包含不同值的不同行

Mongodb/python统计包含不同值的不同行,python,mongodb,distinct,Python,Mongodb,Distinct,我的问题是: 我有一个mongodb数据库,有+100万个条目,我必须统计不同的条目 每个条目都有一个由通信号和文档号组成的文档id,下面是一个示例:EGNG9876543219876543219-000.pdf 由4个大写字母和19位数字组成的部分是通信号码 问题是,对于每个通信号码,都有多个文档(“000.pdf”部分) 我试着这样做: docIds=list(collection.find({}, {"doc_id" : 1,"_id":0})) comIds=[] for i in ra

我的问题是:

我有一个mongodb数据库,有+100万个条目,我必须统计不同的条目

每个条目都有一个由通信号和文档号组成的文档id,下面是一个示例:EGNG9876543219876543219-000.pdf

由4个大写字母和19位数字组成的部分是通信号码

问题是,对于每个通信号码,都有多个文档(“000.pdf”部分)

我试着这样做:

docIds=list(collection.find({}, {"doc_id" : 1,"_id":0}))
comIds=[]
for i in range (docIds.count("doc_id")):
    comIds.append(docIds[i][:-8])
print(len(set(comIds)))

我想知道mongodb中是否有一种方法可以计算有多少不同的通信号码。

如果您可以共享triedI添加的代码,那就太好了:)