R 导入缺少文本限定符的txt文件

R 导入缺少文本限定符的txt文件,r,csv,data-import,R,Csv,Data Import,我有一些文本文件(csv格式),其中缺少一些文本限定符,如下面(AMM)的第二行、第五列: 我通过循环代码中的列,找到了不一致的行:(只需将上面的内容保存在txt中) 库(plyr) a我认为答案必须根据源.csv文件定制。例如,如果它是上面的内容,那么就无法预测哪一列应该包含哪种类型的值,或者给定行上应该包含多少列。这将使它变得困难,因为“莫斯科,俄罗斯”是模棱两可的(可能是“莫斯科”,“俄罗斯”)。@JamesPringle-hi谢谢。我很担心。。。我同意用上述方法和上述数据可能是不可能的。

我有一些文本文件(csv格式),其中缺少一些文本限定符,如下面(AMM)的第二行、第五列:

我通过循环代码中的列,找到了不一致的行:(只需将上面的内容保存在txt中)

库(plyr)

a我认为答案必须根据源.csv文件定制。例如,如果它是上面的内容,那么就无法预测哪一列应该包含哪种类型的值,或者给定行上应该包含多少列。这将使它变得困难,因为“莫斯科,俄罗斯”是模棱两可的(可能是“莫斯科”,“俄罗斯”)。@JamesPringle-hi谢谢。我很担心。。。我同意用上述方法和上述数据可能是不可能的。我要求的其实是一种(完全)不同的方式。我尝试使用
read.table(path,fill=T)
,但是
r3.0.1
导入了
0行
df…在这些情况下,我使用了
read.table(*,fill=FALSE)
,注意到了它所显示的行号,并手动修复了文件。重复此操作,直到成功读取整个文件。希望这样的行不会太多……您的数据真的有那么糟糕吗?从上面共享的示例行中,任何程序如何能够猜测需要导入多少列?我建议看一下,但我怀疑即使是这样的脚本在这种情况下也能起到帮助作用……如果你的问题真的只是缺少引号,也许可以用这样的东西提前确定你的问题:
x
"A",4,"","","HIGH STREET, 22","","","L6","3AA"
"B",2957136105,98,"M12ASE7569",AMM",1,,,"F",,20010514,"CR"
"C","T","UNKNOWN","",19000101
"D",4
library(plyr)
a <- readLines(path) # 
a <- rbind.fill(lapply(a, function(x) read.table(text=x, sep=",", as.is=T, quote="")))
> which(sapply(gregexpr("\"", a[,5]), length)==1 & grepl("\"", a[,5]))
[1] 1 2