Apache flink FLink中的主成分分析

Apache flink FLink中的主成分分析,apache-flink,Apache Flink,有没有办法在ApacheFlink中使用PCA 当我在谷歌上搜索我的研究时,我认为找不到实现的代码 如果是,我应该自己开发吗 谢谢。你到底想做什么?训练一个模特?是否应用现有的?实际上没有限制。简单地说,Flink是一个流媒体框架。应用于数据的操作取决于您自己,而不取决于框架(Flink)。我认为这将适用于Flink批处理模式(处理有界数据集),对吗 这项(暂停?)工作正在进行中。尽管根据调查结果,它似乎还没有准备好进入黄金时段 不知道这是否有用,但您可以了解Mahout如何实现其分布式PCA版

有没有办法在ApacheFlink中使用
PCA

当我在谷歌上搜索我的研究时,我认为找不到实现的代码

如果是,我应该自己开发吗


谢谢。

你到底想做什么?训练一个模特?是否应用现有的?实际上没有限制。简单地说,Flink是一个流媒体框架。应用于数据的操作取决于您自己,而不取决于框架(Flink)。

我认为这将适用于Flink批处理模式(处理有界数据集),对吗

这项(暂停?)工作正在进行中。尽管根据调查结果,它似乎还没有准备好进入黄金时段


不知道这是否有用,但您可以了解Mahout如何实现其分布式PCA版本。这为您提供了该算法的大致概述,因为它是使用Mahout的R-ish语法编写的,可以转换为Spark作业。

我的意思是,我有现有的pca框架,但它只在单机上工作,而不是在分布式机器上工作。考虑到这一点,我假设当我使用现有的pca框架时,它似乎不能很好地工作,因为flink是分布式机器?训练一个模特?还是使用现有的?我的场景是训练一个模型。对。但是我没有关于Flinkt的任何参考资料,我所知道的地方都没有。Spark有一个分布式的实现。也许你可以采纳一些想法。你为什么要用弗林克?训练一个模型是你可能想要用一个定义良好的训练集和测试集来做的事情。听起来更像是一种批处理方法——因此,它可能值得仔细研究一下spark。