R 找出是否引用了CSV中的文本
我有两个大的CSV文件,其中包含相同的数据。但是,它们的文件大小略有不同。我猜这是因为在使用data.table的fwrite()生成这些文件时使用了不同的引号参数R 找出是否引用了CSV中的文本,r,csv,data.table,R,Csv,Data.table,我有两个大的CSV文件,其中包含相同的数据。但是,它们的文件大小略有不同。我猜这是因为在使用data.table的fwrite()生成这些文件时使用了不同的引号参数 如何在R中确定CSV文件中的文本条目是否被引号包围?由于文件大小的原因,我无法在记事本++中打开它们。您不必解析整个文件!阅读前几行,了解结构: fread("pathtofile.csv", nrows= 10, ## read first 10 lines header = TRUE,
如何在R中确定CSV文件中的文本条目是否被引号包围?由于文件大小的原因,我无法在记事本++中打开它们。您不必解析整个文件!阅读前几行,了解结构:
fread("pathtofile.csv",
nrows= 10, ## read first 10 lines
header = TRUE, ## if the csv contains a header
sep = "," ) ## specfiy the separator; "," for comma separated
readLines('file.csv',n=2)
将读取文件的前两行。终端中的head file.csv-n2
将显示文件的前两行,可能会有所帮助。()使用fread
和sep=“”,阅读前几行,例如:fread(“/temp.csv”,sep=“”,nrows=2,header=FALSE)
这不提供问题的答案。若要评论或要求作者澄清,请在其帖子下方留下评论。-@据我所知,问题是如何在R中确定CSV文件中的文本条目是否被引号包围
,在大多数情况下,读取第一行n
可以快速确定文本值在文件中的实际外观。我真的怀疑OP是否为给定文件查找函数getQuoteType()
。如果你认为有必要,我会删除这个答案。至于要求作者澄清的问题——在评论了关于一般解决方案的建议后,编辑了一个问题,即首选R中的解决方案,没有进一步沟通,这对解决方案的进一步开发没有吸引力。但这只是我的观点,我在这方面没有足够的经验,所以,也许这是常见的:)好的,我会解释得更好。这出现在一个审查队列中,所以有人将其标记为VLQ。我认为你应该在回答中添加你的第一条评论。实际上,它非常简洁,为那些已经知道如何解决问题的人提供了一个答案。