R 分组数据问题;不收集某一类别的观察结果

R 分组数据问题;不收集某一类别的观察结果,r,excel-2010,spreadsheet,subset,R,Excel 2010,Spreadsheet,Subset,我试图将电子表格中一列R中的数据分为三类:鳕鱼、黑线鳕和鳕鱼。然而,出于某种原因,Haddock不起作用,他说这个子集没有观测值,而事实上应该有51个——其他两个类别的子集很好,所有观测值都考虑在内。原因可能是什么?电子表格看起来不错,似乎没有任何明显的问题,但有什么我可以忽略的吗 谢谢 编辑: 好的,这是数据集的一部分 OpCode Species DistanceFromCoast SA_F1_280714_C4_1 Atlantic cod

我试图将电子表格中一列R中的数据分为三类:鳕鱼、黑线鳕和鳕鱼。然而,出于某种原因,Haddock不起作用,他说这个子集没有观测值,而事实上应该有51个——其他两个类别的子集很好,所有观测值都考虑在内。原因可能是什么?电子表格看起来不错,似乎没有任何明显的问题,但有什么我可以忽略的吗

谢谢

编辑:

好的,这是数据集的一部分

OpCode                 Species      DistanceFromCoast
SA_F1_280714_C4_1   Atlantic cod    583.69
SA_F1_280714_C4_1   Haddock         583.69
SA_F1_280714_C4_1   Whiting         583.69
SA_F1_290714_C2_10  Atlantic cod    892.51
SA_F1_290714_C2_10  Haddock         892.51
SA_F1_290714_C2_10  Whiting         892.51
SA_F1_280714_C4_6   Haddock         1080.5
SA_F1_280714_C4_6   Whiting         1080.5
SA_F1_280714_C4_6   Atlantic cod    1080.5
SA_F1_280714_C4_7   Whiting         1030.59
SA_F1_280714_C4_7   Haddock         1030.59
SA_F1_280714_C4_7   Atlantic cod    1030.59

也许变量的
类中有一些东西。试一试

str(dat)
'data.frame':   12 obs. of  3 variables:
 $ OpCode           : Factor w/ 4 levels "SA_F1_280714_C4_1",..: 1 1 1 4 4 4 2 2 2 3 ...
 $ Species          : Factor w/ 3 levels "Atlantic Cod",..: 1 2 3 1 2 3 2 3 1 3 ...
 $ DistanceFromCoast: num  584 584 584 893 893 ...
分组操作应该可以正常工作

library(dplyr)
dat %>% group_by(Species) %>%
  summarise(Ave.Dist = mean(DistanceFromCoast))
#        Species Ave.Dist
# 1 Atlantic Cod 896.8225
# 2      Haddock 896.8225
# 3      Whiting 896.8225
要使用
ggplot2
按组绘制图形,需要在
aes
中指定分组选项(即颜色、形状、组等)


一些示例数据可能会有帮助..您如何读取这些文件?您的
read.table
read.csv
语句将有助于检查Haddock的类别到底包含什么,当列中的值为“Haddock”或“Haddock”(不是空格)时,您可能正在检查“Haddock”。你到底是如何对数据进行子集划分的?你能给我们一些代码和示例值吗?Michal,我正在使用read.csv函数读取文件Colin,该列的标题是“物种”,因此它和子类之间没有重叠谢谢你的建议(如果我有足够的代表,我会给你一个投票)。虽然可以使用此函数对这三个物种进行分类并绘制图表吗?这就是这个数据集的部分问题所在
library(ggplot2)
ggplot(dat, aes(x=Species, y=DistanceFromCoast, fill=Species)) + geom_bar(stat="identity")