R函数根据另一组值计算data.table列中的值_R_Data.table

R函数根据另一组值计算data.table列中的值

R函数根据另一组值计算data.table列中的值,r,data.table,R,Data.table,我有由不同测试问题（如Q1、Q2、Q3）的答案组成的列，我想写一个函数来评估这些答案，并为每个测试问题（1或0）创建带有分数的新列，其中“id”表示不同的个人 id Q1 Q2 Q3 1 4 3 3 2 7 3 7 3 8 5 6 4 8 2 8 5 4 6 8 6 4 6 6 7 4 6 5 8 4 6 8 9

我有由不同测试问题（如Q1、Q2、Q3）的答案组成的列，我想写一个函数来评估这些答案，并为每个测试问题（1或0）创建带有分数的新列，其中“id”表示不同的个人

  id    Q1  Q2  Q3
   1    4   3   3
   2    7   3   7
   3    8   5   6
   4    8   2   8
   5    4   6   8
   6    4   6   6
   7    4   6   5
   8    4   6   8
   9    4   6   6

我想要的输出是

 id Q1 Q2 Q3 Q1_score Q2_score Q3_score
  1  4  3  3        1        0        0
  2  7  3  7        0        0        0
  3  8  5  6        0        0        0
  4  8  2  8        0        0        1
  5  4  6  8        1        1        1
  6  4  6  6        1        1        0
  7  4  6  5        1        1        0
  8  4  6  8        1        1        1
  9  4  6  6        1        1        0

我已经在下面定义了正确的答案和新的列名，但我似乎无法找到像“对于第一个问题'Q1'，如果答案等于'answers'中的第一个值，则返回1或0”。。。然后“对于第二个问题‘Q2’，如果答案等于第二个值……”，等等

我们使用除第一列以外的所有列指定

.SDcols

，使用

映射

将相应的

列表

元素（即列）与

答案

中的相应值进行比较，将其转换为

整数

，并使用

粘贴

将其分配给新列

library(data.table)
dt[, paste0(names(dt)[-1], "_score") :=
        Map(function(x,y) as.integer(x==y), .SD, answers), .SDcols = -1]
dt
#    id Q1 Q2 Q3 Q1_score Q2_score Q3_score
#1:  1  4  3  3        1        0        0
#2:  2  7  3  7        0        0        0
#3:  3  8  5  6        0        0        0
#4:  4  8  2  8        0        0        1
#5:  5  4  6  8        1        1        1
#6:  6  4  6  6        1        1        0
#7:  7  4  6  5        1        1        0
#8:  8  4  6  8        1        1        1
#9:  9  4  6  6        1        1        0

从

> quiz
  id Q1 Q2 Q3
1  1  4  3  3
2  2  7  3  7
3  3  8  5  6
4  4  8  2  8
5  5  4  6  8
6  6  4  6  6
7  7  4  6  5
8  8  4  6  8
9  9  4  6  6

您希望将Q列提取到矩阵中，然后通过转置、逐列比较（因为R按列顺序存储矩阵）进行逐行比较，然后再转置回来

然后，您可以通过添加0将其转换为数字，使用快速的

paste0

修复名称，然后

cbind

将其粘贴到原始名称上。这里有一个解决方案：

> resp =  t(t(quiz[,2:4]) == c(4,6,8))+0
> colnames(resp)=paste0(colnames(resp),"_score")
> cbind(quiz, data.frame(resp))
  id Q1 Q2 Q3 Q1_score Q2_score Q3_score
1  1  4  3  3        1        0        0
2  2  7  3  7        0        0        0
3  3  8  5  6        0        0        0
4  4  8  2  8        0        0        1
5  5  4  6  8        1        1        1
6  6  4  6  6        1        1        0
7  7  4  6  5        1        1        0
8  8  4  6  8        1        1        1
9  9  4  6  6        1        1        0

我恐怕我的

数据表知识很差，但你可以用R基中的mapply（）
来实现。类似于dt[，newcols]
> resp =  t(t(quiz[,2:4]) == c(4,6,8))+0
> colnames(resp)=paste0(colnames(resp),"_score")
> cbind(quiz, data.frame(resp))
  id Q1 Q2 Q3 Q1_score Q2_score Q3_score
1  1  4  3  3        1        0        0
2  2  7  3  7        0        0        0
3  3  8  5  6        0        0        0
4  4  8  2  8        0        0        1
5  5  4  6  8        1        1        1
6  6  4  6  6        1        1        0
7  7  4  6  5        1        1        0
8  8  4  6  8        1        1        1
9  9  4  6  6        1        1        0