Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/291.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Teradata中的R-用户如何在Teradata Vantage上执行他的R代码?_Python_R_Teradata - Fatal编程技术网

Python Teradata中的R-用户如何在Teradata Vantage上执行他的R代码?

Python Teradata中的R-用户如何在Teradata Vantage上执行他的R代码?,python,r,teradata,Python,R,Teradata,Teradata为针对Vantage平台执行R代码提供了什么? 有教程吗 结合Vantage使用R和Python |第1部分:概述: A:客户端选项 “TDPLYR”R附加库(免费下载。TelaDist.com)建立在“DPLYR”基础上,专门用于与VANTAGE服务器的交互。除了“dplyr”提供的功能外,它还为Vantage systems新引入的机器学习引擎(MLE)组件中的大约100多个分析功能以及Vantage systems的高级SQL引擎(ASQLE;前Teradata数据库)组件

Teradata为针对Vantage平台执行R代码提供了什么?
有教程吗

结合Vantage使用R和Python |第1部分:概述:

A:客户端选项

“TDPLYR”R附加库(免费下载。TelaDist.com)建立在“DPLYR”基础上,专门用于与VANTAGE服务器的交互。除了“dplyr”提供的功能外,它还为Vantage systems新引入的机器学习引擎(MLE)组件中的大约100多个分析功能以及Vantage systems的高级SQL引擎(ASQLE;前Teradata数据库)组件中的9个分析功能提供R包装。面向客户的Teradata R软件包“tdplyr”因此能够直接使用数据库中的数据进行数据争用和无缝的数据库内分析,从而使客户无需将任何数据从数据库移动到客户机并返回

“tdplyr”文件可在以下网址找到:

“tdplyr”的分析在“R和Python与Vantage”TechBytes系列的第2部分中进行了演示,网址为:

B:在节点选项中

Teradata还通过脚本表操作符(STO;自Teradata数据库v.15.00)和EXEC表操作符(EXEC;自Teradata数据库v.15.10)为R用户提供节点内解决方案。这两种方法都使用户能够在每个ASQLE节点上运行的R解释器实例上的数据库中自带R脚本并执行它们。由于数据库体系结构的性质,此方法最适合并有效用于:

a) 模型评分任务,其中R脚本只需要一行数据作为输入,就可以使用给定模型对其进行评分;由于这个原因,评分任务在所有节点上都非常有效地进行,这就是所谓的“令人尴尬的并行”任务

b) 通过将一个数据表按某些特征划分来拟合多个模型;在这个场景中,每个AMP(ASQLE数据库处理单元)处理单个分区的所有数据,这导致以并行方式同时拟合所有模型

更复杂的情况是,用户希望使用整个数据库中的数据拟合模型;通常,这些任务包括两个步骤的操作,第一步是执行从每个AMP(“映射”阶段)接收部分结果的脚本,第二步是第二个脚本需要使用这些部分答案以产生最终结果(“减少”阶段)。这种方法将编程责任交给用户(与MLE分析函数不同,MLE分析函数在从客户机拟合模型时无缝地向用户执行这一系列步骤)。 EXEC的内存处理限制为每安培3.5 GB

B.1:ExecR

用户可以将他们的R脚本直接带到exec中,但是脚本与数据库交互的数据输入和输出部分需要使用exec中所谓的FNC函数进行适当的修改。这些是Teradata构建的R函数,用于执行这些数据和元数据传输任务。有关详细的EXEC文档,请访问:

B.2:脚本


脚本表运算符(STO):在这种方法中,脚本通过脚本的标准输入从单个表接收数据,需要为R正确解释输入数据类型,并通过脚本的标准输出将结果发送到数据库(或SQL接口)。因此,在这种方法中,在将脚本上载到数据库并通过STO执行之前,需要相应地组合R脚本数据输入和输出段。除此之外,脚本的一个实例在每个数据库AMP上的R解释器上运行,就像它在客户机上运行一样

这超出了堆栈溢出问题的范围。你可能会发现通过互联网搜索来寻找答案会更成功。