Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/shell/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
直接在install.packages(“SparkyR”)下工作与在R上工作的区别_R - Fatal编程技术网

直接在install.packages(“SparkyR”)下工作与在R上工作的区别

直接在install.packages(“SparkyR”)下工作与在R上工作的区别,r,R,我刚才在看那篇文章 但是我不确定直接在install.packages(“Sparkyr”)packages下使用R有什么区别 你能让我知道吗,我很困惑SparkyR软件包为你提供了一个非常类似于tidy和dplyr在R中为你提供的环境。但是你直接使用spark,然后你必须使用spark上下文来运行你的命令。文件如下: 看看这里SparkyR帮助您使用R和(通用)dplyrSyntaxThank,这里有疑问。链接告诉我们“SparkR提供了一个分布式数据帧实现,支持选择、过滤、聚合等操作”,但即

我刚才在看那篇文章 但是我不确定直接在
install.packages(“Sparkyr”)
packages下使用R有什么区别


你能让我知道吗,我很困惑SparkyR软件包为你提供了一个非常类似于
tidy
dplyr
在R中为你提供的环境。但是你直接使用spark,然后你必须使用spark上下文来运行你的命令。文件如下:


看看这里
SparkyR
帮助您使用R和(通用)
dplyr
SyntaxThank,这里有疑问。链接告诉我们“SparkR提供了一个分布式数据帧实现,支持选择、过滤、聚合等操作”,但即使没有在R中安装spark,这些操作仍然存在,对吗?是的,这些操作仍然存在于base R中。主要的区别在于,当您尝试在
spark
特定RDD或其他对象上工作时,您将不得不使用spark-specific
函数。我建议您使用
spark
特定函数来处理RDD,因为这些函数具有更大的支持和更好的文档。或者,如果您可以选择使用
pyspark
scala
则将其用于spark.Cool。我正在读几篇文章。我的理解是,我们应该首先在Spark cluster中加载excel数据,然后我们需要在R中连接Spark,对吗?我不是编程背景,也不难理解。这取决于您是否已经在env中设置了
spark上下文
,或者让spark cluster在
hdInsights
上运行,那么您只需要在数据帧或RDD上运行
R
命令。