R 找出是否引用了CSV中的文本

R 找出是否引用了CSV中的文本,r,csv,data.table,R,Csv,Data.table,我有两个大的CSV文件,其中包含相同的数据。但是,它们的文件大小略有不同。我猜这是因为在使用data.table的fwrite()生成这些文件时使用了不同的引号参数 如何在R中确定CSV文件中的文本条目是否被引号包围?由于文件大小的原因,我无法在记事本++中打开它们。您不必解析整个文件!阅读前几行,了解结构: fread("pathtofile.csv", nrows= 10, ## read first 10 lines header = TRUE,

我有两个大的CSV文件,其中包含相同的数据。但是,它们的文件大小略有不同。我猜这是因为在使用data.table的fwrite()生成这些文件时使用了不同的引号参数


如何在R中确定CSV文件中的文本条目是否被引号包围?由于文件大小的原因,我无法在记事本++中打开它们。

您不必解析整个文件!阅读前几行,了解结构:

fread("pathtofile.csv", 
       nrows= 10,      ## read first 10 lines
       header = TRUE,  ## if the csv contains a header
       sep = "," )     ## specfiy the separator; "," for comma separated

readLines('file.csv',n=2)
将读取文件的前两行。

终端中的
head file.csv-n2
将显示文件的前两行,可能会有所帮助。()使用
fread
和sep=“”,阅读前几行,例如:
fread(“/temp.csv”,sep=“”,nrows=2,header=FALSE)
这不提供问题的答案。若要评论或要求作者澄清,请在其帖子下方留下评论。-@据我所知,问题是
如何在R中确定CSV文件中的文本条目是否被引号包围
,在大多数情况下,读取第一行
n
可以快速确定文本值在文件中的实际外观。我真的怀疑OP是否为给定文件查找函数
getQuoteType()
。如果你认为有必要,我会删除这个答案。至于要求作者澄清的问题——在评论了关于一般解决方案的建议后,编辑了一个问题,即首选R中的解决方案,没有进一步沟通,这对解决方案的进一步开发没有吸引力。但这只是我的观点,我在这方面没有足够的经验,所以,也许这是常见的:)好的,我会解释得更好。这出现在一个审查队列中,所以有人将其标记为VLQ。我认为你应该在回答中添加你的第一条评论。实际上,它非常简洁,为那些已经知道如何解决问题的人提供了一个答案。