Python 如何控制高斯混合中的进程数

Python 如何控制高斯混合中的进程数,python,performance,scikit-learn,Python,Performance,Scikit Learn,没有的n_作业参数。 同时,只要我适合这个模型 from sklearn.mixture import GaussianMixture as GMM gmm = GMM(n_components=4, init_params='random', covariance_type='full', tol=1e-2, max_iter=100, n_init=1) gmm.fit(X, y) 它跨越1

没有的
n_作业
参数。 同时,只要我适合这个模型

from sklearn.mixture import GaussianMixture as GMM
gmm = GMM(n_components=4,
          init_params='random',
          covariance_type='full',
          tol=1e-2,
          max_iter=100,
          n_init=1)
gmm.fit(X, y)
它跨越16个进程,使用我的16个CPU机器的全部CPU能力。我不希望它这样做

相比之下,has
n_jobs
参数在进行多次初始化时控制多处理(
n_init
>1)。这里突然出现了多处理


我的问题是它从何而来以及如何控制它?

您正在观察基本代数运算方面的并行处理,请加速/

修改此参数并不像设置
n_jobs
参数那么简单,这取决于您正在使用的实现

常见的候选者是ATLAS、OpenBLAS和Intel的MKL

我建议先检查使用哪一个,然后采取相应的行动:

import numpy as np
np.__config__.show()
可悲的是,这些东西会变得很糟糕。例如,MKL的有效环境可以如下所示:

对于ATLAS,您似乎在定义它

根据,这同样适用于OpenBLAS

经过OP测试,您似乎可以为设置环境变量,甚至对开源候选Atlas和OpenBLAS(其中编译时间限制是可选的)的行为进行修改:


哇!我检查了numpy正在使用的活动BLAS库,然后使用
export-OMP\u-NUM\u-THREADS=“4”设置变量在运行脚本之前完成了这项任务。非常感谢你@塔拉什ypka和哪一个正在使用?MKL?或者这对其他一些候选者有用吗?输出是这样的
libraries=['openblas','openblas']
export MKL_NUM_THREADS="2"
export MKL_DOMAIN_NUM_THREADS="MKL_BLAS=2"
export OMP_NUM_THREADS="1"
export MKL_DYNAMIC="FALSE"
export OMP_DYNAMIC="FALSE"
export OMP_NUM_THREADS="4";