Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/selenium/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将CSV文件读入带有不完整引号、字符串中的逗号和异常字符的R时出现问题_R_String_Csv - Fatal编程技术网

将CSV文件读入带有不完整引号、字符串中的逗号和异常字符的R时出现问题

将CSV文件读入带有不完整引号、字符串中的逗号和异常字符的R时出现问题,r,string,csv,R,String,Csv,我正在尝试将一个大的CSV文件读入R。该文件位于,ReadMe声明编码为UTF-8,应该有1561039行和68列。我尝试了几种不同的方法读入数据,但无法读入完整的数据集。我认为可能会出现一些问题,因为:(I)字符串中有不完整的引号,(ii)字符串中有逗号和sep=“,”(因此我不能使用quote=“)来处理引号问题),以及(iii)有箭头等不寻常的字符 以下是我读取数据的各种尝试以及产生的警告: aid <- read.csv("AidDataCoreFull_ResearchRelea

我正在尝试将一个大的CSV文件读入R。该文件位于,ReadMe声明编码为UTF-8,应该有1561039行和68列。我尝试了几种不同的方法读入数据,但无法读入完整的数据集。我认为可能会出现一些问题,因为:(I)字符串中有不完整的引号,(ii)字符串中有逗号和
sep=“,”
(因此我不能使用
quote=“
)来处理引号问题),以及(iii)有箭头等不寻常的字符

以下是我读取数据的各种尝试以及产生的警告:

aid <- read.csv("AidDataCoreFull_ResearchRelease_Level1_v3.0.csv"),header=T, encoding="UTF-8")
> dim(aid)
[1] 9960   68
辅助仪表盘集成模块(aid) [1] 9960 68 警告信息: 在扫描中(file=file,what=what,sep=sep,quote=quote,dec=dec,: 带引号字符串中的EOF

aid <- read.table("AidDataCoreFull_ResearchRelease_Level1_v3.0.csv"),header=T,sep=",",encoding="UTF-8")
> dim(aid)
[1] 9960   68
辅助仪表盘集成模块(aid) [1] 9960 68 警告信息: 1:在扫描中(file=file,what=what,sep=sep,quote=quote,dec=dec,: 带引号字符串中的EOF 2:在扫描中(file=file,what=what,sep=sep,quote=quote,dec=dec,: 读取的项目数不是列数的倍数

aid <- read.csv("AidDataCoreFull_ResearchRelease_Level1_v3.0.csv"),header=F,skip=1,quote="",encoding="UTF-8")
> dim(aid)
[1] 10956    72
辅助仪表盘集成模块(aid) [1] 10956 72 这一次没有警告消息,但在读取的整行附近没有位置,现在列太多

tx <- readLines("AidDataCoreFull_ResearchRelease_Level1_v3.0.csv",encoding="utf-8",skipNul=T)
> length(tx)
[1] 9961
tx长度(tx)
[1] 9961
警告信息: 在阅读行(“AidDataCoreFull\u ResearchRelease\u Level1\u v3.0.csv”)中: 在“AidDataCoreFull\u ResearchRelease\u Level1\u v3.0.csv”上发现不完整的最后一行


我找不到在完整CSV中读取的命令组合,也无法在excel中打开它以查看和整理数据。任何帮助都将不胜感激!

尝试使用readr::read\u CSV。它比base read.CSV更易于调试,它会告诉您
问题(aid)
哪里出了问题。(参考:)谢谢!该函数非常有用,在详细说明发现的问题时,实际上已经读取了整个数据集,这就是我所需要的-非常棒!尝试使用readr::read_csv。它比base read.csv更易于调试,它会告诉您
问题(aid)
(参考:)谢谢!这个函数非常有用,而且实际上已经阅读了整个数据集,同时详细说明了所发现的问题,这就是我所需要的——太棒了!