Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/eclipse/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
AzureML:针对一个子集而不是整个数据集的实验_R_Azure Machine Learning Studio - Fatal编程技术网

AzureML:针对一个子集而不是整个数据集的实验

AzureML:针对一个子集而不是整个数据集的实验,r,azure-machine-learning-studio,R,Azure Machine Learning Studio,几天前,我在AzureML会议上写了一段代码来解决“内存不足”的问题。所以我试着把代码分成三个不同的代码,这部分奏效了。它仍然是(我认为)受内存问题影响的一部分 我已经创建了一个实验,我在这篇文章中发表了这个实验 有一个模块只考虑我的数据集的一个样本,它确实可以工作。这意味着代码应该正常工作。如果删除采样代码(从顶部开始的第二个模块) 如果直接连接原始数据集,则会出现以下情况 产生以下错误: 有人有办法了解Azure崩溃的地方吗 谢谢你 Andrea非常感谢您发布了这个示例——这确实有助于

几天前,我在AzureML会议上写了一段代码来解决“内存不足”的问题。所以我试着把代码分成三个不同的代码,这部分奏效了。它仍然是(我认为)受内存问题影响的一部分

我已经创建了一个实验,我在这篇文章中发表了这个实验

有一个模块只考虑我的数据集的一个样本,它确实可以工作。这意味着代码应该正常工作。如果删除采样代码(从顶部开始的第二个模块)

如果直接连接原始数据集,则会出现以下情况

产生以下错误:

有人有办法了解Azure崩溃的地方吗

谢谢你


Andrea

非常感谢您发布了这个示例——这确实有助于理解这个问题。我怀疑您想修改脚本中的
gsub()
调用,方法是在每个调用中添加参数“
fixed=TRUE
”。(此功能的文档为。)

似乎发生的情况是,在完整数据集中的某个地方——而不是在子采样数据集中——有一些文本最终被包含在
df[i,“names”]
中,作为“
(艺术)。
”。您的脚本将其填充到“
\\b(艺术)。
gsub()
函数尝试将其解释为正则表达式而不是简单字符串,然后抛出一个错误,因为它不是有效的正则表达式:它包含一个左括号,但没有右括号。我相信您实际上不想要
gsub()
首先将输入解释为正则表达式,并指定
gsub(…,fixed=TRUE)
将纠正这一错误


我相信,当您添加示例/分区模块时,此错误消失的原因是,有问题的输入值在子采样时被丢弃。我不认为这是Azure ML上可用资源的问题。(注意:我还不能确认修复程序是否有效;我进行了建议的更新并开始运行实验,但尚未成功完成。)

谢谢Mewahl!不过,我不明白为什么在运行od AzureML时同样的代码会起作用(例如,在RStudio上,我没有遇到这样的问题).无论如何,我用过'myWord Anyways,现在我试过用file_poliszato[,column]啊,很抱歉--你说得对,如果你想容纳所有形式的单词边界,就需要正则表达式。(我只是用空格替换了“\b”;我误解了符号的用法。)不过,我担心,除了《艺术》之外,还有其他案例DF$名称中的标点符号会导致意外的正则表达式:有些甚至会导致意外的匹配行为,即使没有抛出错误。对于您的用例,是否有可能用空格替换有问题的标点符号或以其他方式删除它?请考虑我以前删除了标点和括号。(在将数据集添加到AzureML之前)所以我发现了一个数据集,这让我有点惊讶。不管怎样,我在等着看“(art.”是否是唯一的一个….!好的,我已经做了检查,我上传的文件实际上有括号。我已经删除了括号并“运行”代码…我所能做的就是希望!)