Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
可以在本地机器上使用Sparkyr绕过R';什么是内存限制?_R_Rstudio_Sparklyr - Fatal编程技术网

可以在本地机器上使用Sparkyr绕过R';什么是内存限制?

可以在本地机器上使用Sparkyr绕过R';什么是内存限制?,r,rstudio,sparklyr,R,Rstudio,Sparklyr,我需要在不适合我的计算机内存的数据上安装GLMs。通常为了解决这个问题,我会对数据进行采样,拟合模型,然后在内存不足的不同样本上进行测试。这一直是R对我的主要限制,这就是为什么安装GLM的SAS是首选,因为它不会遇到不适合内存的数据 我一直在尝试在本地机器上用R解决这个问题,想知道Sparkyr是否可以用来解决内存问题?我意识到Spark应该用于集群环境等,但坦率地说,SparkyR可以用于处理本地机器上的数据,否则这些数据将无法放入其内存中吗 Spark和SparkyR在分配负载方面非常有效,

我需要在不适合我的计算机内存的数据上安装GLMs。通常为了解决这个问题,我会对数据进行采样,拟合模型,然后在内存不足的不同样本上进行测试。这一直是R对我的主要限制,这就是为什么安装GLM的SAS是首选,因为它不会遇到不适合内存的数据


我一直在尝试在本地机器上用R解决这个问题,想知道Sparkyr是否可以用来解决内存问题?我意识到Spark应该用于集群环境等,但坦率地说,SparkyR可以用于处理本地机器上的数据,否则这些数据将无法放入其内存中吗

Spark和SparkyR在分配负载方面非常有效,但不太可能用一个Spark实例解决您的问题。如果您搜索与内存不足glm和R相关的内容,您可能会更幸运地使用H2O

,您将遇到
ff
包和
biglm
包。您可以开始阅读文档并寻找示例。谢谢您的建议。我现在确实看过了。也许我还没有完全了解他们的工作原理,但ff和“大”R包家族似乎大多是解决方案,无法与其他R包(如Tidyverse)无缝集成,因此我认为没有一个修复方案“只起作用”。