Scikit learn 什么是;n“U特性”;及;中心“;参数是指SciKit中的make_blobs?

Scikit learn 什么是;n“U特性”;及;中心“;参数是指SciKit中的make_blobs?,scikit-learn,Scikit Learn,我已经阅读了有关SciKit中make\u blobs函数中的n\u功能和中心参数的文档。然而,我所看到的每一个解释对我来说都不是那么清楚,因为我对SciKit和数学是新手。我想知道这两个参数是怎么做的:n_功能,中心在make_blob中的作用如下 make_blobs(n_samples=50, n_features=2, centers=2, random_state=75) 提前感谢。生成blobs函数是sklearn.datasets.samples\u generator的一部分。

我已经阅读了有关
SciKit
make\u blobs
函数中的
n\u功能
中心
参数的文档。然而,我所看到的每一个解释对我来说都不是那么清楚,因为我对
SciKit
和数学是新手。我想知道这两个参数是怎么做的:
n_功能
中心
make_blob
中的作用如下

make_blobs(n_samples=50, n_features=2, centers=2, random_state=75)

提前感谢。

生成blobs函数是
sklearn.datasets.samples\u generator
的一部分。包中的所有方法,帮助我们生成数据样本或数据集。在scikit了解的机器学习中,数据集用于评估机器学习模型的性能。这是一个关于如何评估以下项目的示例:

现在,正如您所提到的,
n_features
决定了生成的数据集将有多少列或特性。在机器学习中,特征对应于数字特征数据。例如,在中,有4个特征(萼片长度、萼片宽度、花瓣长度和花瓣宽度),因此数据集中有4个数字列。因此,通过在
make_blob
中增加
n_features
,我们添加了更多的特性,从而增加了生成数据集的复杂性

至于
中心
,通过可视化生成的数据集更容易理解。我使用
matplotlib
来帮助我们:

from sklearn.datasets.samples_generator import make_blobs
import matplot

# plot 1
X, y = make_blobs(n_features=2, centers=1)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.savefig('centers_1.png')
plt.title('centers = 1')

# plot 2    
X, y = make_blobs(n_features=2, centers=2)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.title('centers = 2')

# plot 3
X, y = make_blobs(n_features=2, centers=3)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.title('centers = 3')

plt.show()


如果运行上面的代码,您可以很容易地看到,
中心
对应于数据中生成的类的数量。它使用中心作为一个术语,因为属于同一类的样本往往聚集在一个中心(坐标)附近。

到目前为止,您对
生成blob
有什么了解?编辑:据我所知,我只知道生成blob函数实际上是生成blob的,通过我分配的几个样本,它给了我一个由两个元素组成的元组,这两个元素都是样本。我知道功能会给我提供另一列示例,但我不知道拥有另一列示例意味着什么。更重要的是,我不知道中心是什么意思。另外,我对元组的第二个元素感到困惑。这到底是什么意思?我想这帮了大忙!非常感谢。可视化为我点击,非常感谢!
from sklearn.datasets.samples_generator import make_blobs
import matplot

# plot 1
X, y = make_blobs(n_features=2, centers=1)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.savefig('centers_1.png')
plt.title('centers = 1')

# plot 2    
X, y = make_blobs(n_features=2, centers=2)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.title('centers = 2')

# plot 3
X, y = make_blobs(n_features=2, centers=3)
plt.figure()
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.title('centers = 3')

plt.show()