从JSON中删除无效字符,使其对R中的jsonlite有效
我尝试了以下方法来删除无效字符,并允许使用jsonlite的fromJSON将其转换为DF:从JSON中删除无效字符,使其对R中的jsonlite有效,json,r,Json,R,我尝试了以下方法来删除无效字符,并允许使用jsonlite的fromJSON将其转换为DF: freshDeskData <- extractHTMLStrip(freshDeskData, asText=TRUE) freshDeskData <- gsub("\r?\n|\r|<.*?>", " ", freshDeskData) freshDeskData <- gsub("[\001-\026]*", "", freshDeskData,
freshDeskData <- extractHTMLStrip(freshDeskData, asText=TRUE)
freshDeskData <- gsub("\r?\n|\r|<.*?>", " ", freshDeskData)
freshDeskData <- gsub("[\001-\026]*", "", freshDeskData, fixed=TRUE)
freshDeskData <- iconv(freshDeskData, "UTF-8")
freshDeskDataToDF <- jsonlite::fromJSON(paste(readLines(textConnection(freshDeskData)), collapse=""), flatten=TRUE)
freshDeskDataClean <- do.call(cbind, lapply(freshDeskDataToDF, clean))
freshDeskDataClean <- data.frame(freshDeskDataClean)
问题:在DF的JSON/列中有一个键,它包含HTML内容,这有时会造成问题。它包含用户插入的数据,虽然从API返回的JSON中的HTML是有效的JSON(可以由JSON编辑器在线解析),但jsonlite不知何故没有正确解析它并卡住它。有没有更合适的方法来处理这个问题
此外,我不介意完全删除/覆盖包含HTML内容的特定键description
的值中的任何内容
有没有办法在R中实现这一点
lexical error:
invalid character in string