当缺少自然分隔符时,如何将长字符串转换为数据帧?(R)
我正在寻找一种解决方案,它采用上面的字符串并创建一个包含8列的数据帧。这可能是一项非常复杂的任务。我将非常乐意听取关于如何更接近解决这一问题的任何建议。我在下面提供了一个代码示例当缺少自然分隔符时,如何将长字符串转换为数据帧?(R),r,string,split,R,String,Split,我正在寻找一种解决方案,它采用上面的字符串并创建一个包含8列的数据帧。这可能是一项非常复杂的任务。我将非常乐意听取关于如何更接近解决这一问题的任何建议。我在下面提供了一个代码示例 library(tibble) string <- "Organisationsnummer Företag (huvudorg) Anordnare (enhet) Utbildning Sunkod Kommunkod Medverkande org Ansökningsomgång\n02120
library(tibble)
string <- "Organisationsnummer Företag (huvudorg) Anordnare (enhet) Utbildning Sunkod Kommunkod Medverkande org Ansökningsomgång\n0212000212 Arboga Kommun Arboga kommun, Vuxenutbildningen Specialistundersköterska inom demens 415723rb 1984 Arboga Kommun, Socialförvaltningen Yrkeshögskoleutbildning 2018\n0212000156 Borås Kommun Borås Stad – Borås Yrkeshögskola Autoingenjör 525523af 1490 Rebel Walls Yrkeshögskoleutbildning 2019"
DF <- tibble(Organisationsnummer = c("0212000212", "0212000156"),
'Företag (huvudorg)' = c("Arboga Kommun", "Borås Kommun"),
'Anordnare (enhet)' = c("Arboga kommun, Vuxenutbildningen", "Borås Stad – Borås Yrkeshögskola"),
Utbildning = c("Specialistundersköterska inom demens", "Autoingenjör"),
Sunkod = c("415723rb", "525523af"),
Kommunkod = c("1984", "1490"),
'Medverkande org' = c("Arboga Kommun, Socialförvaltningen", "Rebel Walls"),
Ansökningsomgång = c("Yrkeshögskoleutbildning 2018", "Yrkeshögskoleutbildning 2019"))
库(TIBLE)
你有可以使用的模式吗?比如括号或域?然后,您可以构建规则,如“如果单词被识别为域,则它属于前面的单词”以strsplit(string,\\n”)
开头。一种方法是在strsplit之后的所有行之间循环,并以某种系统的方式为每行添加七个分隔符吗?您有可以使用的模式吗?比如括号或域?然后,您可以构建规则,例如“如果单词被识别为域,那么它属于前面的单词”以strsplit(string,\\n“)
开头。一种方法是循环strsplit之后的所有行,并以某种系统的方式为每行添加七个分隔符吗?