R 未能通过复制/dput功能创建可复制的示例
我试图使用R 未能通过复制/dput功能创建可复制的示例,r,import,reproducible-research,R,Import,Reproducible Research,我试图使用dput()创建一个具有大型数据库的可复制示例。数据库需要很大,因为可复制的示例涉及移动平均数。我发现实现这一点的方法包括@Ricardo Saporta在这里共享的函数repeact复制基于dput()(此处代码) 还请注意,我使用pastebin方法创建了这个可复制的示例。出于我的目的,该方法不会取代dput()方法,因为每当尝试导入某些列之间有空格的数据时(例如,带有日期时间戳的数据帧),该方法都会失败 EDIT:经过进一步的故障排除后,发现当行参数与包含4列或更多列的数据帧一起
dput()
创建一个具有大型数据库的可复制示例。数据库需要很大,因为可复制的示例涉及移动平均数。我发现实现这一点的方法包括@Ricardo Saporta在这里共享的函数repeact
<代码>复制基于dput()
(此处代码)
还请注意,我使用pastebin方法创建了这个可复制的示例。出于我的目的,该方法不会取代dput()
方法,因为每当尝试导入某些列之间有空格的数据时(例如,带有日期时间戳的数据帧),该方法都会失败
EDIT:经过进一步的故障排除后,发现当行
参数与包含4列或更多列的数据帧一起使用时,复制
如上所述失败。我们必须找到一个替代方案
如果有人对此感兴趣,请使用以下链接运行上面的代码,所有链接都包含不同数量的列:
1) 100x5:
2) 100x4:
3) 100x4:
4) 100x3:
5) 100x3:
6) 100x1:如果您只是尝试
dput()
数据集的前100行,那么您只需在运行dput()
之前对数据进行子集设置即可。似乎不需要使用链接函数
dput(droplevels(head(data, 100))) ## or dput(droplevels(data[1:100,]))
我应该这样做
然而,奇怪的是,您尝试的repearchave()
不起作用。为此,我会在github页面上提交一个问题。你可能会得到一个更有建设性的答案
感谢@David Arenburg提醒我关于
droplevels()
。如果我们有factor列,则此操作非常有用。“剩余”级别将被删除。如果您只是尝试dput()
数据集的前100行,那么您只需在运行dput()之前对数据进行子集设置即可。似乎不需要使用链接函数
dput(droplevels(head(data, 100))) ## or dput(droplevels(data[1:100,]))
我应该这样做
然而,奇怪的是,您尝试的repearchave()
不起作用。为此,我会在github页面上提交一个问题。你可能会得到一个更有建设性的答案
感谢@David Arenburg提醒我关于droplevels()
。如果我们有factor列,则此操作非常有用。“剩余”级别将被删除。尝试为SO问题生成一个可复制的示例。使用行=100时出现相同问题。谢谢Richarddput()
不允许指定行数。至少在它的文档中没有提到它。它的输出是开头几行和结尾几行。我需要输出整个数据库,而不是一个样本。太棒了!想把这个作为答案吗?通过直接询问如何获取dput()
以输出完整的数据库,我会节省大量时间。尝试为SO问题生成一个可复制的示例。使用rows=100
也会遇到同样的问题。谢谢Richarddput()
不允许指定行数。至少在它的文档中没有提到它。它的输出是开头几行和结尾几行。我需要输出整个数据库,而不是一个样本。太棒了!想把这个作为答案吗?通过直接询问如何获取dput()
以输出完整的数据库,我会节省大量时间。现在我意识到replicate
vsdput()
的一个好处是,第一次输出一行上的所有内容,而dput()
在共享之前需要进行大量编辑。这是一个皮蒂replicate
有这个小错误。我现在意识到replicate
与dput()
相比的一个好处是,第一行输出所有内容,而dput()
在共享之前需要大量编辑。它是一个皮蒂复制品
有那个小bug。
dput(droplevels(head(data, 100))) ## or dput(droplevels(data[1:100,]))