R 从多值字段中选择一个值
编程新手。目前正在使用R。拉入具有多值字段的员工数据平面文本文件。R 从多值字段中选择一个值,r,multivalue,R,Multivalue,编程新手。目前正在使用R。拉入具有多值字段的员工数据平面文本文件。EmployeeClass变量的值选项可以是:A,B,C,D,E。可以选择多个位置,可以有空值,可以多次选择一个位置(如果它们具有相同类型的多个位置),并且可以按任意顺序选择。EmployeeClass变量是一个列表 Data[Employee1, EmployeeClass] [A, B, C, D, E] Data[Employee2, EmployeeClass] [B, D, [blank], E] Data[Empl
EmployeeClass
变量的值选项可以是:A
,B
,C
,D
,E
。可以选择多个位置,可以有空值,可以多次选择一个位置(如果它们具有相同类型的多个位置),并且可以按任意顺序选择。EmployeeClass
变量是一个列表
Data[Employee1, EmployeeClass]
[A, B, C, D, E]
Data[Employee2, EmployeeClass]
[B, D, [blank], E]
Data[Employee3, EmployeeClass]
[C, B, A]
Data[Employee4, EmployeeClass]
[B, D, D, C]
Data[Employee5, EmployeeClass]
[E]
在这一点之前,数据无法调整,该表有41000多个观察值。我试图将变量降到每个观察值的一个值,因此我需要根据其他三列信息中的标准选择正确的变量,有效地为每个员工定义一个“主要”类
Data[Employee1, EmployeeClass]
[C]
Data[Employee2, EmployeeClass]
[D]
Data[Employee3, EmployeeClass]
[A]
Data[Employee4, EmployeeClass]
[B]
Data[Employee5, EmployeeClass]
[E]
最简单的编码方式是什么?我尝试了tidyr和grepl,但有些进展甚至没有进展。任何帮助都将不胜感激
编辑:我可能不太清楚。让我重新措辞。我对程序的编码没有问题,而且因为所需的逻辑有许多排列,所以为了简洁起见,如果我这样做的话,可能会更容易。我只是在寻找一个函数或包,它可以解析由逗号分隔的字符串,然后应用逻辑返回一个可理解的值。此字符串的长度并不总是与列中的其他观察值相同,字符串中的某些值可能为空,并且字符串中的值序列不严格按升序或降序计算
到目前为止,我发现的大多数函数都要求所有观测值的场长度相等。是否有一个功能可以处理这些需求,或者我最好走另一条路?谢谢 请使用
dput
显示示例,以便我们了解其结构。我们还需要了解标准。对不起,我可能不清楚。请参见上面的编辑。