Python 如何在每种类型的元素至少有4个(或每种类型有x个)的条件下获得数组的组合?
我试图编写一个python函数来获取输入数组长度n的所有组合,其中每种类型的特定元素至少有4个(或某些#x)(下面的示例) 输出=组合列表,其中每种类型的元素至少有4个(即,如果这些元素存在,则一周中的每一天有4个(如果为0,则无关紧要)) 对于itertools.组合中的组合(输入_数组,12): 例如,从输入数组中,n=12的有效输出如下所示Python 如何在每种类型的元素至少有4个(或每种类型有x个)的条件下获得数组的组合?,python,combinations,Python,Combinations,我试图编写一个python函数来获取输入数组长度n的所有组合,其中每种类型的特定元素至少有4个(或某些#x)(下面的示例) 输出=组合列表,其中每种类型的元素至少有4个(即,如果这些元素存在,则一周中的每一天有4个(如果为0,则无关紧要)) 对于itertools.组合中的组合(输入_数组,12): 例如,从输入数组中,n=12的有效输出如下所示 out = ['m1','m2','m3','m4,','t3','t4,'t5','t6','w1','w2','w3','w4'] 而它生成的无
out = ['m1','m2','m3','m4,','t3','t4,'t5','t6','w1','w2','w3','w4']
而它生成的无效输出将是
out = ['m1','m2','m3','t2','t3','t4,'t5','t6','w1','w2','w3','w4']
是否有更有效的方法生成每种类型至少有4个的组合(即,4个条目带有“m”,4个条目带有“t”,4个条目带有“w”)。现在,我只是简单地将所有组合循环为
它来了,如果它通过了检查,我将它放入一个数组中,但是对于较大的输入数组,这可能需要很长时间。如果有组合以外的其他方法也可以使用
编辑以澄清其他需求,我意识到我没有提供一些关键信息
任何输入数组最多可以有七种不同类型的元素。这使我变得更复杂,因为当我只需要12个元素时(如果存在,每种类型至少有4个),另外,必须参照每个元素类型的原始输入数组保留顺序(这是一个奖励,如果做不到,那就是okay)
例子
输入可以是=[m1、m2、m3、m4、m5、m6、m7、m8、m9、m10、m11、m12、t1、t2、t3、t4、w1、w2、w3、w4、f1、f2、f3、f4]
有效输出:
[m1、m2、m3、m4、m5、m6、m7、m8、m9、m10、m11、m12](可以是一种类型,因为其他类型不存在)
[m5、m6、m7、m8、m9、m10、m11、m12、t1、t2、t3、t4](或按顺序每种类型至少4个)
[m4、m5、m6、m7、w1、w2、w3、w4、f1、f2、f3、f4](如果存在,每种类型至少有4个,但可能缺失)
等等
无效:
[m4、m6、m5、m7、w1、w2、w3、w4、f1、f2、f3、f4](故障)
[m4、m5、m6、m7、m8、w1、w2、w3、w4、f1、f2、f3](不是每种类型的4个)您可以对生成器使用递归:
import re, collections
data = ['m1','m2','m3','m4','m5','m6','t1','t2','t3','t4','t5','t6','w1','w2','w3','w4','w5','w6']
def combo(d, c = []):
if len(c) == 12:
yield c
else:
for i in d:
_count1 = collections.Counter([re.findall('^[a-zA-Z]+', j)[0] for j in c])
_count2 = collections.Counter([re.findall('^[a-zA-Z]+', j)[0] for j in c+[i]])
if i not in c:
if len(c) < 11 or all(b >= 4 for b in _count2.values()):
if re.findall('^[a-zA-Z]+', i)[0] in _count1:
if int(re.findall('\d+$', i)[0])-1 == int(re.findall('\d+$', c[-1])[0]) and re.findall('^[a-zA-Z]+', i)[0] == re.findall('^[a-zA-Z]+', c[-1])[0]:
yield from combo(d, c+[i])
else:
yield from combo(d, c+[i])
result = combo(data)
for _ in range(10): #first 10 results from generator
print(next(result))
编辑:过滤出类似的结果:
r, result = [], combo(data)
for _ in range(40):
r.append(next(result))
new_r = [a for i, a in enumerate(r) if all(sorted(a) != sorted(k) for k in r[:i])]
print(f'{len(r)} => {len(new_r)}')
输出:
['m1', 'm2', 'm3', 'm4', 'm5', 'm6', 't1', 't2', 't3', 't4', 't5', 't6']
['m1', 'm2', 'm3', 'm4', 'm5', 'm6', 'w1', 'w2', 'w3', 'w4', 'w5', 'w6']
['m1', 'm2', 'm3', 'm4', 't1', 't2', 't3', 't4', 'w1', 'w2', 'w3', 'w4']
['m1', 'm2', 'm3', 'm4', 't1', 't2', 't3', 't4', 'w2', 'w3', 'w4', 'w5']
['m1', 'm2', 'm3', 'm4', 't1', 't2', 't3', 't4', 'w3', 'w4', 'w5', 'w6']
['m1', 'm2', 'm3', 'm4', 't2', 't3', 't4', 't5', 'w1', 'w2', 'w3', 'w4']
['m1', 'm2', 'm3', 'm4', 't2', 't3', 't4', 't5', 'w2', 'w3', 'w4', 'w5']
['m1', 'm2', 'm3', 'm4', 't2', 't3', 't4', 't5', 'w3', 'w4', 'w5', 'w6']
['m1', 'm2', 'm3', 'm4', 't3', 't4', 't5', 't6', 'w1', 'w2', 'w3', 'w4']
['m1', 'm2', 'm3', 'm4', 't3', 't4', 't5', 't6', 'w2', 'w3', 'w4', 'w5']
40 => 22
我建议您首先将数据分为不同类型:
from itertools import combinations
a = ['a1', 'a2', 'a3', 'a4', 'a5']
b = ['b1', 'b2', 'b3', 'b4', 'b5', 'b6']
c = ['c1', 'c2', 'c3', 'c4']
然后,您可以生成每个种子的所有可能组合:
comb_a = combinations(a, 3)
comb_b = combinations(b, 4)
comb_c = combinations(c, 2)
for i, j, k in zip(list(comb_a), list(comb_b), list(comb_c)):
print(i+j+k)
您好,感谢您抽出时间回答。你能看看我的编辑吗?我对我的需求做了一些澄清(我真的不确定我所要求的是否可行)。我并不总是知道每种类型需要多少(因为它可以是0、4或任何大于4的数字)。这限制了我使用你的方法,我相信。你好,谢谢你花时间回答。你能看看我的编辑吗,我对我的需求做了一些澄清(我真的不确定我所要求的是否可行)@user3794422没问题,请看我最近的编辑。哇,这太棒了。这基本上解决了这个问题,我只是想知道,有没有办法强制执行它,使相同类型的元素仍然是顺序的?例如,它是您的第三个输出示例,它显示了我想要排除的w1、w2、w3、w5,但是w2、w3、w4、w5(或者大于4但仍然是连续的?)是可以的。不过,谢谢您的回答。@user3794422请查看我最近的编辑,我更新了解决方案以反映this@user3794422很乐意帮忙!
comb_a = combinations(a, 3)
comb_b = combinations(b, 4)
comb_c = combinations(c, 2)
for i, j, k in zip(list(comb_a), list(comb_b), list(comb_c)):
print(i+j+k)