R 来自数据帧的数据摘要
我还有一个关于从我正在使用的大型数据框架中进行数据挖掘的问题,前几行如下:R 来自数据帧的数据摘要,r,data-mining,dataframe,R,Data Mining,Dataframe,我还有一个关于从我正在使用的大型数据框架中进行数据挖掘的问题,前几行如下: Assay Genotype Sample Result 1 001 G 1 0 2 001 A 2 1 3 001 G 3 0 4 001 NA 4 NA 5 002
Assay Genotype Sample Result
1 001 G 1 0
2 001 A 2 1
3 001 G 3 0
4 001 NA 4 NA
5 002 T 1 0
6 002 G 2 1
7 002 T 3 0
8 002 T 4 0
9 003 NA 1 NA
10 003 G 2 1
11 003 G 3 1
12 003 T 4 0
总的来说,我将处理2000个样本,每个样本进行168次分析
我想根据这些数据生成一个汇总表,告诉我每个“结果”有多少个“样本”。“结果”1、0或NA只有3个选项。我希望结果具有如下数据框(使用上述数据):
正如我前面提到的,有168种不同的分析,它们不是简单地以数字序列标记的,因此分析ID必须从原始数据框中提取。
在理想情况下,我还希望看到在数字旁边(或在不同的表格中)列出每个“结果”的样本百分比 试试看
table(df$Assay, df$Result,useNA="ifany")
类似于@MYaseen208,但添加了NA列:
> table(df[, c('Assay', 'Result')], useNA='ifany')
Result
Assay 0 1 <NA>
1 2 1 1
2 3 1 0
3 0 0 1
>表格(df[,c('Assay','Result')],useNA='ifany')
结果
化验0 1
1 2 1 1
2 3 1 0
3 0 0 1
请参阅:
?表
这很接近,但只告诉我1和0的数量,而不是NA的数量。非常快的更新(+1)。无论如何,我不会删除我非常相似的答案,因为我认为保留标题更优雅:)
> table(df[, c('Assay', 'Result')], useNA='ifany')
Result
Assay 0 1 <NA>
1 2 1 1
2 3 1 0
3 0 0 1