在R中创建与

在R中创建与,r,R,我在excel电子表格中输入了7个不同的变量到R中。它们都是大小为3331的列。它们是: 'Tribe' - there are 8 of them 'Month' - when the sampling was carried out 'Year' - the year when the sampling was carried out 'ID" - an identifier for each snail 'Weight' - weight of a snail in grams 'Leng

我在excel电子表格中输入了7个不同的变量到R中。它们都是大小为3331的列。它们是:

'Tribe' - there are 8 of them
'Month' - when the sampling was carried out
'Year' - the year when the sampling was carried out
'ID" - an identifier for each snail
'Weight' - weight of a snail in grams
'Length' - length of a snail shell in millimetres
'Width' - width of a snail shell in millimetres
在这个案例中,8个不同的部落被要求记录一种疑似濒危物种蜗牛的数据,看看它们是否变得越来越稀有,或者在大小或重量上是否在变化。 这种情况在1993年至1998年期间发生的频率不同

我想知道如何为数据创建一个新的变量,这样,如果我输入名称(蜗牛)#那么它将列出7个给定的变量以及我添加的任何变量

数据集仅限于我希望添加新变量的点。例如,知道每个月蜗牛的数量

这取决于我使用-部落、月份、年份和ID。如果根据给定月份的费率列出ID(蜗牛识别码),那么我将能够将它们相加,以查看计数是否有任何变化。我试过:

count=c(Tribe,Year,Month,ID)
count
但是,在做了这样的事情之后,R有一个很大的列表,它的大小是数据集的4倍。我希望能够创建一个列大小为n=3331的给定新变量

或者我想创建一个更简单的变量,这样我就可以看到一个部落是否在任何给定的月份收集。我不知道该怎么做


我看了其他论坛并搜索了一下,但在我的情况下,我看不到任何有助于我的东西。谢谢你的帮助。谢谢

我猜您需要在单个结构中组织变量,例如
data.frame
。 有关帮助文件,请参见
?data.frame

要开始,您可以执行以下操作:

snails <- data.frame(Tribe,Year,Month,ID)
snails
# or for just the first few rows
head(snails)
…查看每个部落收集的蜗牛记录数量。或者

table(snails$Tribe,snails$Year)
…每年查看每个部落的趋势。
$
字符将允许您以当前使用自由浮动变量的相同方式访问data.frame中的命名变量(列)。起初,这似乎需要做更多的工作,但当您需要进行更复杂的分析时,它将获得巨大的回报

例如,如果只想分析部落“1”中的权重,可以执行以下操作:

snails$Weight[snails$Tribe==1]
# mean of these weights
mean(snails$Weight[snails$Tribe==1])

我可以解释的事情还有很多,但是如果你在这里阅读像Quick-R这样的优秀网站,可能会更好:让你做一些更高级的分析和绘图。

你能举个例子说明你想要的新变量是什么样的吗?从你的问题来看,我不太确定你想要什么。例如:部落、月份、年份、身份证、体重、长度、宽度。其中n=8。提供一个专栏,将部落划分为他们取样的月份。-下面的答案其实很有帮助,谢谢。这给了我很多需要研究和理解的信息。@Luke-没问题,欢迎来到R世界。作为未来的指针,一般来说,Stackoverflow问题都是简短、具体的问题,而不是一系列的问题。不过我知道从R开始是什么感觉,所以我很高兴它起了作用。
table(snails$Tribe,snails$Year)
snails$Weight[snails$Tribe==1]
# mean of these weights
mean(snails$Weight[snails$Tribe==1])