R 简化数据

R 简化数据,r,ggplot2,data-cleaning,R,Ggplot2,Data Cleaning,我有一个csv,它有两列数据,我想绘制其中的两行来比较值的差异。但是,在生成数据时,我需要较大的样本量,因此文件包含一百万个条目。在我对R绘图渲染一无所知的情况下,我决定读入所有数据,然后绘制百万条点线 我已经问了好几个问题,但没有看到任何符合我需要的。此外,我目前正试图从中收集信息,但难以理解 我想做的是在我的数据中使用每10行中的一行,并使用它们作为数据来绘制10万个项目应该比1百万个项目好得多,对吗?。最好的方法是什么。这实际上是简化数据的最佳方法吗?有更好的方法替代我的方法吗 样本数据:

我有一个csv,它有两列数据,我想绘制其中的两行来比较值的差异。但是,在生成数据时,我需要较大的样本量,因此文件包含一百万个条目。在我对R绘图渲染一无所知的情况下,我决定读入所有数据,然后绘制百万条点线

我已经问了好几个问题,但没有看到任何符合我需要的。此外,我目前正试图从中收集信息,但难以理解

我想做的是在我的数据中使用每10行中的一行,并使用它们作为数据来绘制10万个项目应该比1百万个项目好得多,对吗?。最好的方法是什么。这实际上是简化数据的最佳方法吗?有更好的方法替代我的方法吗

样本数据:

OptionA, OptionB
1,0,
23,0,
4,0,
5,1,
20091,0,

在示例函数中,有更好的方法可以做到这一点,但要每10行获取一次,假设您的数据称为数据:

就这么简单。1:10000生成从1到100000的数字列表。然后这些数字乘以10,得到10,20。。。1000000这些是行和,后面没有任何内容表示所有列。因此,每10行和所有列就有一个结果


我希望这会有所帮助。

若您提供了一个小样本数据和要运行的代码,那个么帮助您会更容易。首先,如果您的数据帧是df,并且您希望随机抽样10%的行:df[sample1:nrowdf,floornrowdf/10,]。@eipi10添加了抽样数据,但对于代码,我不知道如何准确运行它,这就是为什么我说我在这里看了这些问题,在这里看了这个pdf开始,但仍然有点困惑,例如,plotdf[sample1:nrowdf,floornrowdf/10,cOptionA,OptionB]将随机绘制10%的数据。@eipi10啊,这很有意义。对R来说还是很新,出于某种原因无法想到sample这个词。好的,这对我正在寻找的单词很有帮助。或者df[seqfrom=1,to=nrowdf,by=10,]
data[(1:100000)*10,]