R 简化数据_R_Ggplot2_Data Cleaning

R 简化数据

R 简化数据,r,ggplot2,data-cleaning,R,Ggplot2,Data Cleaning,我有一个csv，它有两列数据，我想绘制其中的两行来比较值的差异。但是，在生成数据时，我需要较大的样本量，因此文件包含一百万个条目。在我对R绘图渲染一无所知的情况下，我决定读入所有数据，然后绘制百万条点线我已经问了好几个问题，但没有看到任何符合我需要的。此外，我目前正试图从中收集信息，但难以理解我想做的是在我的数据中使用每10行中的一行，并使用它们作为数据来绘制10万个项目应该比1百万个项目好得多，对吗？。最好的方法是什么。这实际上是简化数据的最佳方法吗？有更好的方法替代我的方法吗样本数据：

我有一个csv，它有两列数据，我想绘制其中的两行来比较值的差异。但是，在生成数据时，我需要较大的样本量，因此文件包含一百万个条目。在我对R绘图渲染一无所知的情况下，我决定读入所有数据，然后绘制百万条点线

我已经问了好几个问题，但没有看到任何符合我需要的。此外，我目前正试图从中收集信息，但难以理解

我想做的是在我的数据中使用每10行中的一行，并使用它们作为数据来绘制10万个项目应该比1百万个项目好得多，对吗？。最好的方法是什么。这实际上是简化数据的最佳方法吗？有更好的方法替代我的方法吗

样本数据：

OptionA, OptionB
1,0,
23,0,
4,0,
5,1,
20091,0,

在示例函数中，有更好的方法可以做到这一点，但要每10行获取一次，假设您的数据称为数据：

就这么简单。1:10000生成从1到100000的数字列表。然后这些数字乘以10，得到10，20。。。1000000这些是行和，后面没有任何内容表示所有列。因此，每10行和所有列就有一个结果

我希望这会有所帮助。

若您提供了一个小样本数据和要运行的代码，那个么帮助您会更容易。首先，如果您的数据帧是df，并且您希望随机抽样10%的行：df[sample1:nrowdf，floornrowdf/10，]。@eipi10添加了抽样数据，但对于代码，我不知道如何准确运行它，这就是为什么我说我在这里看了这些问题，在这里看了这个pdf开始，但仍然有点困惑，例如，plotdf[sample1:nrowdf，floornrowdf/10，cOptionA，OptionB]将随机绘制10%的数据。@eipi10啊，这很有意义。对R来说还是很新，出于某种原因无法想到sample这个词。好的，这对我正在寻找的单词很有帮助。或者df[seqfrom=1，to=nrowdf，by=10，]

data[(1:100000)*10,]