R 导入其中某些列具有包含空格的字符串的数据集
我有一个数据集,如下所示:R 导入其中某些列具有包含空格的字符串的数据集,r,dataframe,read.table,R,Dataframe,Read.table,我有一个数据集,如下所示: ID Message 1 . 2 . 3 Click_screen 4 Blank screen 5 . 6 . 7 . 实际数据集有48列和50000行 使用read.table()导入此数据集是有问题的,因为字符串“Blank screen”
ID Message
1 .
2 .
3 Click_screen
4 Blank screen
5 .
6 .
7 .
实际数据集有48列和50000行
使用read.table()导入此数据集是有问题的,因为字符串“Blank screen”在两个子字符串之间有一个空格。例如,我收到一条错误消息,如:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 4 did not have 48 elements
我想知道是否有什么方法可以在R中绕过这个问题,而不是在Excel中更改原始数据集
编辑:只是为了添加,我尝试将“填充”设置为TRUE,但收到以下错误消息:
Error in read.table(file.choose(), header = T, fill = T) :
duplicate 'row.names' are not allowed
这取决于您的本地分隔符,但请尝试此选项
read.table(fileName,fill=TRUE,header=FALSE,sep =';')
如果文件是空格分隔的(与制表符分隔相反),则可能需要read.fwf以及字段宽度向量。
如果文件是以制表符分隔的,您可能需要读取.table(sep='\t',…)。是否尝试使用选项fill=TRUE读取?它给了我以下错误消息:read.table(file.choose(),header=t,fill=t)中出错:重复的“row.names”不允许在没有header的情况下尝试,hedaer=Fsep=“\t”该技巧与agstudy的建议fill=TRUE结合使用。谢谢