R 分组数据问题;不收集某一类别的观察结果
我试图将电子表格中一列R中的数据分为三类:鳕鱼、黑线鳕和鳕鱼。然而,出于某种原因,Haddock不起作用,他说这个子集没有观测值,而事实上应该有51个——其他两个类别的子集很好,所有观测值都考虑在内。原因可能是什么?电子表格看起来不错,似乎没有任何明显的问题,但有什么我可以忽略的吗 谢谢 编辑: 好的,这是数据集的一部分R 分组数据问题;不收集某一类别的观察结果,r,excel-2010,spreadsheet,subset,R,Excel 2010,Spreadsheet,Subset,我试图将电子表格中一列R中的数据分为三类:鳕鱼、黑线鳕和鳕鱼。然而,出于某种原因,Haddock不起作用,他说这个子集没有观测值,而事实上应该有51个——其他两个类别的子集很好,所有观测值都考虑在内。原因可能是什么?电子表格看起来不错,似乎没有任何明显的问题,但有什么我可以忽略的吗 谢谢 编辑: 好的,这是数据集的一部分 OpCode Species DistanceFromCoast SA_F1_280714_C4_1 Atlantic cod
OpCode Species DistanceFromCoast
SA_F1_280714_C4_1 Atlantic cod 583.69
SA_F1_280714_C4_1 Haddock 583.69
SA_F1_280714_C4_1 Whiting 583.69
SA_F1_290714_C2_10 Atlantic cod 892.51
SA_F1_290714_C2_10 Haddock 892.51
SA_F1_290714_C2_10 Whiting 892.51
SA_F1_280714_C4_6 Haddock 1080.5
SA_F1_280714_C4_6 Whiting 1080.5
SA_F1_280714_C4_6 Atlantic cod 1080.5
SA_F1_280714_C4_7 Whiting 1030.59
SA_F1_280714_C4_7 Haddock 1030.59
SA_F1_280714_C4_7 Atlantic cod 1030.59
也许变量的
类中有一些东西。试一试
str(dat)
'data.frame': 12 obs. of 3 variables:
$ OpCode : Factor w/ 4 levels "SA_F1_280714_C4_1",..: 1 1 1 4 4 4 2 2 2 3 ...
$ Species : Factor w/ 3 levels "Atlantic Cod",..: 1 2 3 1 2 3 2 3 1 3 ...
$ DistanceFromCoast: num 584 584 584 893 893 ...
分组操作应该可以正常工作
library(dplyr)
dat %>% group_by(Species) %>%
summarise(Ave.Dist = mean(DistanceFromCoast))
# Species Ave.Dist
# 1 Atlantic Cod 896.8225
# 2 Haddock 896.8225
# 3 Whiting 896.8225
要使用ggplot2
按组绘制图形,需要在aes
中指定分组选项(即颜色、形状、组等)
一些示例数据可能会有帮助..您如何读取这些文件?您的read.table
或read.csv
语句将有助于检查Haddock的类别到底包含什么,当列中的值为“Haddock”或“Haddock”(不是空格)时,您可能正在检查“Haddock”。你到底是如何对数据进行子集划分的?你能给我们一些代码和示例值吗?Michal,我正在使用read.csv函数读取文件Colin,该列的标题是“物种”,因此它和子类之间没有重叠谢谢你的建议(如果我有足够的代表,我会给你一个投票)。虽然可以使用此函数对这三个物种进行分类并绘制图表吗?这就是这个数据集的部分问题所在
library(ggplot2)
ggplot(dat, aes(x=Species, y=DistanceFromCoast, fill=Species)) + geom_bar(stat="identity")