将Stata值标签从单独的文件读入R
我有一个Stata数据集(.dta文件),其中包含一个变量RGA(这是一个MWE,我实际上有很多变量)。此变量采用3个因子值:1、2和3。这些因素是指有意义的东西(所谓的“价值标签”),这些因素与其价值标签之间的关联在一个单独的.txt Stata文件中,在这里完全复制:将Stata值标签从单独的文件读入R,r,import,stata,r-haven,R,Import,Stata,R Haven,我有一个Stata数据集(.dta文件),其中包含一个变量RGA(这是一个MWE,我实际上有很多变量)。此变量采用3个因子值:1、2和3。这些因素是指有意义的东西(所谓的“价值标签”),这些因素与其价值标签之间的关联在一个单独的.txt Stata文件中,在这里完全复制: . label define RGA_l 1 "meaning of 1" 2 "meaning of 2" 3 "meaning of 3" . label
. label define RGA_l
1 "meaning of 1"
2 "meaning of 2"
3 "meaning of 3"
. label values RGA RGA_l
我通过
haven
包将.dta文件加载到R中。我希望能够轻松访问R中RGA的值标签,尤其是能够快速将RGA的值与其值标签匹配,以生成可读的输出。如何将这个单独的.txt文件读入R,以便与我的数据集相匹配?我不知道导入的列类型是什么(请尝试在数据帧上使用str()
)但这里是如何在R中创建因子的。因子
函数有些混乱,因为因子本身实际上没有标签,它们只有级别,但参数仍然称为标签
set.seed(100)
df 1意味着1
#>2意义1
#>3意义2
#>4意义1
#>5意义2
#>6意义2
#>7意义3
#>8意义2
#>9意义2
#>10意义1
由(v0.2.0)于2018年5月30日创建。谢谢!然而,我的问题是如何从.txt文件自动导入值标签。按照您的建议手动设置它们是不切实际的,因为我有500多个变量要标记它们的值。这个.txt文件肯定是由Stata命令组成的,所以我希望有人用R编写了一个解析器来读取它。我认为,编辑这个问题来反映这一点是很好的。请参阅,这似乎表明它创建了
标记的
类向量,这些向量可以转换为带有as_factor
的因子(假设stata文件中的列已标记,即您已经运行了该do文件)。