在R中读取不完全正确的.csv文件
我有以下格式的.csv文件:在R中读取不完全正确的.csv文件,r,csv,dataframe,R,Csv,Dataframe,我有以下格式的.csv文件: A, B, C ... 2.0, 4.0, 2.0^ ... 7.3, 1.3, 6.8^ ... 式中,^表示以“,”开头的符号的任意组合,例如,,,,,d..k3.4,,,,,,2,3f,,,,,,行尾始终存在。我希望我的输出框架是: A B C ... 2.0 4.0 2.0 ... 7.3 1.3 6.8 ... 如何将此文件读入框架 你的例子不清楚。你应该给我们看你文本文件的2到3行 假设
A, B, C
...
2.0, 4.0, 2.0^
...
7.3, 1.3, 6.8^
...
式中,^表示以“,
”开头的符号的任意组合,例如,,,,,d..k3.4,,,,,,2,3f,,,,,
,行尾始终存在。我希望我的输出框架是:
A B C
...
2.0 4.0 2.0
...
7.3 1.3 6.8
...
如何将此文件读入框架 你的例子不清楚。你应该给我们看你文本文件的2到3行 假设您的文件如下所示:
TEXT <- 'A, B, C
2.0, 4.0, 2.0,,,,,d..k3.4,,,,2,3f,,,
7.3, 1.3, 6.8,,,,,,2,3f,,,'
例如,试试这个
read.table(filename,sep=',,fill=TRUE)
?是的,但我还需要将第一行header@midas第一个没有足够的列作为hedar。我的意思是只有3个字母。@midas列名称可以在事实之后手动添加。是的,但概念上它们是标题。在每一行中,我有3个分开的数值。但在第三个值之后,而不是新行的符号,我有一些垃圾和新行的符号。可以将此文件读入frame吗?@midas为什么不在您的问题中添加预期的“frame”(我猜您指的是data.frame)?
dat <- read.table(text=TEXT,header=FALSE,sep=',',fill=TRUE)
dat <- dat[,colSums(is.na(dat))<nrow(dat)]
(dat <- dat[-1,])
V1 V2 V3 V8 V9 V10 V12 V13
2 2.0 4.0 2.0 d..k3.4 NA 2 3f
3 7.3 1.3 6.8 2 3f NA