Apache spark 为MLlib数据理解spark数据

Apache spark 为MLlib数据理解spark数据,apache-spark,apache-spark-mllib,Apache Spark,Apache Spark Mllib,我正在阅读SparkML数据中使用的二进制分类。我阅读了Spark的JavaCode,我也知道二进制分类,但我无法理解这些数据是如何生成的。例如 此链接是二进制分类的示例如果我想生成这些类型的数据,如何生成?通常,第一列是类标签(在本例中为0/1),其他列是特征值 例如,要自己生成数据,可以使用随机生成器。 但这取决于你正在解决的问题 如果需要下载数据集以应用分类算法,可以使用存储库,例如:UCI机器学习存储库

我正在阅读SparkML数据中使用的二进制分类。我阅读了Spark的JavaCode,我也知道二进制分类,但我无法理解这些数据是如何生成的。例如
此链接是二进制分类的示例如果我想生成这些类型的数据,如何生成?

通常,第一列是类标签(在本例中为
0/1
),其他列是特征值

例如,要自己生成数据,可以使用随机生成器。 但这取决于你正在解决的问题

如果需要下载数据集以应用分类算法,可以使用存储库,例如:UCI机器学习存储库