将组合置乱,而不将可迭代(itertools.Companies)转换为列表

2022-03-23 00:00:00 python itertools combinations shuffle

问题描述

下面的简单代码给出了长度为3的200个元素的可能组合。

from itertools import combinations
comb = combinations( range(200), 3 )

我想以随机顺序获取组合,以便挑选前N个组合。但是,如果我将comb转换为列表并按如下方式对其进行置乱,则可能会出现内存错误,因为该列表可能包含太多元素:

comb = list(comb) # This might be huge and give a memory error 
random.shuffle(comb)
N = 10
comb = comb[:10] # get only the first N random combinations

有没有其他方法可以获得N个随机组合?(即,不是以itertools生成的顺序。组合)。


解决方案

C(200, 3) = 1313400可能的组合。正如您还提到的,由于combinatorial explosion,这个数字很容易失控。例如,如果选择4个元素而不是3个元素,则组合的数量将大约增加50倍(64684950)。您可以随机构建可能的组合,而不是从这些组合中随机选择。

要构建这些组合,可以使用随机库中的random.sample。random.sample(range(200), 3)将随机生成这1313400个组合中的一个。如果您再次调用它,它将生成另一个组合。

有两个问题:

  1. 顺序在random.sample([1,2,3]不同于[1,3,2])中很重要。在组合中,情况并非如此。要解决此问题,您可以使用sorted()
  2. random.sample将独立生成接下来的3个数字。因此,在不同迭代中生成的组合可能是相同的。虽然本例(≈0.0000343)不太可能出现这种情况,但您可以使用集合来存储组合,以便只存储唯一的组合。

以下将生成10种不同的组合:

import random
combs = set()
N = 10
while len(combs) < N:
    combs.add(tuple(sorted(random.sample(range(200), 3))))

相关文章