Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
.csv文件中的多行在R中的元素数不相同_R_Csv_Skip - Fatal编程技术网

.csv文件中的多行在R中的元素数不相同

.csv文件中的多行在R中的元素数不相同,r,csv,skip,R,Csv,Skip,我正在尝试将一个非常大的.csv文件读入R OrigTotalPumping <- read.table("/Users/Larry/Desktop/OrigTotalPumping/MasterOrigFt3.csv", header=F, sep=",") 及 我如何设置它,使它可以在这个文件中读取,尽管存在此问题?不要跳过它,但最好将此代码放在循环和trycatch块下。并对已发布的记录执行错误处理。 如何在R中进行t

我正在尝试将一个非常大的.csv文件读入R

OrigTotalPumping <- read.table("/Users/Larry/Desktop/OrigTotalPumping/MasterOrigFt3.csv", 
                               header=F, sep=",")


我如何设置它,使它可以在这个文件中读取,尽管存在此问题?

不要跳过它,但最好将此代码放在循环和trycatch块下。并对已发布的记录执行错误处理。 如何在R中进行trycatch:
以下是链接,用于您是否可以像这样使用
awk
预处理文件,以创建一个已清理的文件,其中每行有7个字段

awk 'NF==7' original.csv > cleaned.csv
或者,如果字段分隔符是逗号

awk -F',' 'NF==7' original.csv > cleaned.csv
或者,基于@Spacedman的想法,您可以使用
awk
只显示没有7个字段的“不满意”行

awk -F',' 'NF!=7 {print "Line " NR $0}' yourfile.csv | more

你知道到底是什么导致了这个问题吗?你知道为什么这行比其他行短吗?为什么不给csv中定义的列数一个try to colclasses参数。你可以用
扫描(“MasterOrigFt3.csv”,“character”,skip=19436,n=1,sep=“\n”)
@MrFlick no我不知道;这个文件太大了,我甚至无法打开它进行查看。@user3736201这就是为什么Flick建议你
scan
只扫描坏行。R这样做应该没有问题。类似地,您可以使用
txt将所有“坏”行分配给
baddies
,听起来棒极了!字段分隔符是逗号,但我得到了一个空文件,请从您的文件中获取几行,并将它们编辑到您的问题中。让他们像这样
head-3 yourfile.csv>sample.csv
更好,你可以使用
awk
查看失败的行:
awk'NR==19437'original.csv
awk'NR>19400'original.csv;更多
并找出它是否缺少逗号、引用逗号等(
awk
中的
NR
“记录编号”)。如果必须手动进行编辑,一个半正式的文本编辑器应该能够读取一个大的CSV文件进行编辑。@spaced这是一个很好的建议,谢谢,我已经编辑过(对的修改)这是我的答案,所以所有人都可以看到,没有拖网的意见。这是否为你的工作?如果是这样,你能考虑接受它作为你的答案-点击空心滴答(勾选)旁边的选票计数?如果不是,请说什么不起作用,以便我,或其他人可以帮助你进一步。谢谢你。
awk -F',' 'NF==7' original.csv > cleaned.csv
awk -F',' 'NF!=7 {print "Line " NR $0}' yourfile.csv | more