Pyspark 如何使用Spark流数据帧进行PCA

Pyspark 如何使用Spark流数据帧进行PCA,pyspark,spark-streaming,pca,apache-spark-ml,Pyspark,Spark Streaming,Pca,Apache Spark Ml,只是想知道,我们如何在分布式模式下对流数据进行主成分分析?如果可以,它在数学上是否足够有效 以前有人这样做过吗?你们能分享一下你们的经验吗?Spark是否提供了任何API来在Spark流模式下执行相同的操作

只是想知道,我们如何在分布式模式下对流数据进行主成分分析?如果可以,它在数学上是否足够有效

以前有人这样做过吗?你们能分享一下你们的经验吗?Spark是否提供了任何API来在Spark流模式下执行相同的操作