在R中,如果许多响应包含多个类别,那么处理分类数据的最佳方法是什么?
我正在使用一个数据集,其中受访者通过选择R中的一个或多个种族类别来表示他们的种族。在我的数据集中,这些类别记录如下:1=亚洲人,2=阿拉伯人,3=黑人,4=拉丁美洲人,5=美洲土著人,6=太平洋岛民/夏威夷土著人,7=白人,8=其他人,9=不愿意回答。许多受访者表示有多个类别。例如:在R中,如果许多响应包含多个类别,那么处理分类数据的最佳方法是什么?,r,categorical-data,R,Categorical Data,我正在使用一个数据集,其中受访者通过选择R中的一个或多个种族类别来表示他们的种族。在我的数据集中,这些类别记录如下:1=亚洲人,2=阿拉伯人,3=黑人,4=拉丁美洲人,5=美洲土著人,6=太平洋岛民/夏威夷土著人,7=白人,8=其他人,9=不愿意回答。许多受访者表示有多个类别。例如: race如果您包含一个简单的示例输入和所需的输出,可以用来测试和验证可能的解决方案,那么它将更容易帮助您。如何在原始数据中实际输入多个值? [1] "Asian" "
race如果您包含一个简单的示例输入和所需的输出,可以用来测试和验证可能的解决方案,那么它将更容易帮助您。如何在原始数据中实际输入多个值?
[1] "Asian" "Arab" "American Indian" "1,5"
[1] "Asian" "Arab" "American Indian" "Asian,White"
race_text <- stringr::str_replace_all(race, c('1'='Asian', '2'='Arab',
'3'='Black', '4'='Latinx', '5'='American Indian',
'6'='Pacific Islander/Native Hawaiian',
'7'='White', '8'='Other/None', '9'='Prefer Not to Answer'))
> race_text
[1] "Asian" "Arab" "American Indian" "Asian,American Indian"