R 从原始数据获取信息
我正在研究一个关于食道癌的数据框架。 我需要找到一列NCASE的总和,但仅在基于alchgp列的特定条件下,特别是只有在alchgp表示“120+”时才添加NCASER 从原始数据获取信息,r,indexing,conditional-operator,R,Indexing,Conditional Operator,我正在研究一个关于食道癌的数据框架。 我需要找到一列NCASE的总和,但仅在基于alchgp列的特定条件下,特别是只有在alchgp表示“120+”时才添加NCASE 我使用head(esoph,88)访问数据我创建了一个样本数据集,并提出了一种可能适用于更复杂情况的方法。评论中建议的索引方法也有效 library(tidyverse) df <- tribble(~alchgp, ~ncases, '120+', 30, '100
我使用head(esoph,88)访问数据我创建了一个样本数据集,并提出了一种可能适用于更复杂情况的方法。评论中建议的索引方法也有效
library(tidyverse)
df <- tribble(~alchgp, ~ncases,
'120+', 30,
'100', 40,
'80', 10,
'120+', 35)
f <- function(alchgp, ncases) {
sum(ncases[alchgp == "120+"])
}
df %>%
summarise(sum_gt120 = f(alchgp, ncases)) %>%
pull
#65
sum(df$ncases[df$alchgp == "120+" ])
#65
库(tidyverse)
df%
拉
#65
总和(df$ncases[df$alchgp==“120+”)
#65
sum(数据$ncase[data$alchgp==“120+”])
sum(esoph$ncase[esoph$alchgp==“120+”])
。如果我是正确的,我建议您阅读关于R索引和提取的内容,在。如果错误,请编辑您的问题并提供更多详细信息。您应该学习适用的计算机科学术语以进行有用的搜索。“数据科学”过于笼统,无法有效过滤问题和答案。它可能应该被当作一个标签。