R读取列中带有逗号的csv

R读取列中带有逗号的csv,r,csv,read.csv,R,Csv,Read.csv,更新2020-5-14 使用来自的不同但相似的数据集时,我发现read\u csv似乎工作正常。不过,我还没有用原始数据尝试过 虽然由于我的问题不正确,这些回复没有帮助解决问题,但单的回复最符合我发布的原始问题,因此我接受了他的回答 更新2020-5-12 我认为我原来的问题是不正确的。正如评论中提到的,数据是引用的。虽然更改分隔符使R中的11582行看起来与excel中的11583行相同,但这并不意味着它是“正确的”。可能是由于不正确的编码或其他原因导致了某些不正确的行切换,从而导致某些列被替

更新2020-5-14

使用来自的不同但相似的数据集时,我发现
read\u csv
似乎工作正常。不过,我还没有用原始数据尝试过

虽然由于我的问题不正确,这些回复没有帮助解决问题,但单的回复最符合我发布的原始问题,因此我接受了他的回答

更新2020-5-12

我认为我原来的问题是不正确的。正如评论中提到的,数据是引用的。虽然更改分隔符使R中的11582行看起来与excel中的11583行相同,但这并不意味着它是“正确的”。可能是由于不正确的编码或其他原因导致了某些不正确的行切换,从而导致某些列被替换。如果我用notepad++打开数据,excel中11583行的实例位于11596行


原始问题

我正试图从R中读取
listings.csv
。我下载了文件并编写了代码
read.csv('listing.csv')
。第一列,列
id
,应该是数字。然而,它表明:

listing$id[1:10]
 [1] 2015  2695  3176  3309  7071  9991  14325 16401 16644 17409
13129 Levels: Ole Berl穩n!,16736423,Nerea,Mitte,Parkviertel,52.55554132116211,13.340658248460871,Entire home/apt,36,6,3,2018-01-26,0.16,1,279\n17312576,Great 2 floor apartment near Friederich Str MITTE,116829651,Selin,Mitte,Alexanderplatz,52.52349354926847,13.391003496971203,Entire home/apt,170,3,31,2018-10-13,1.63,1,92\n17316675,80簡 m of charm in 3 rooms with office space,116862833,Jon,Neuk繹lln,Schillerpromenade,52.47499080234379,13.427509313575928...
我认为这是因为在第二列中有带逗号的值。例如,使用MiCrosoft excel打开文件时,我可以看到第二列中的一个值是
Ole,Ole…


当某些值包含逗号时,如何将csv文件正确读入R?

由于您可以访问Excel中的数据,因此可以在Excel中使用逗号(,)以外的分隔符“另存为”。首先进入控制面板->区域和语言->其他设置,您可以更改“列表分隔符”。除逗号外,最常见的是管道符号(|)。在R中,当您读取_csv时,请将分隔符指定为“|”。

由于您可以访问Excel中的数据,因此可以在Excel中使用逗号(,)以外的分隔符“另存为”。首先进入控制面板->区域和语言->其他设置,您可以更改“列表分隔符”。除逗号外,最常见的是管道符号(|)。在R中,当您读取_csv时,将分隔符指定为“|”。

您可以试试这个吗

你可以试试这个吗


lsitings如果您不需要第二列中的信息,那么您可以在导入到R之前删除它(在Excel中)。调用
scan
read.csv
函数也可以使用
colClasses
参数省略不需要的列。但是,来自data.table包的
fread
函数使用
drop
参数更简单:

library(data.table)
listings <- fread("listings.csv", drop=2)
库(data.table)

清单如果您不需要第二列中的信息,那么您可以在导入到R之前删除它(在Excel中)。调用
scan
read.csv
函数也可以使用
colClasses
参数省略不需要的列。但是,来自data.table包的
fread
函数使用
drop
参数更简单:

library(data.table)
listings <- fread("listings.csv", drop=2)
库(data.table)

在您链接到的文件的列表中,第2列中包含逗号的行用引号括起来,因此此处不应存在任何问题。在您链接到的文件中,第2列中包含逗号的行用引号括起来,因此此处不应存在任何问题。谢谢。有些列包含
|
,因此我最终使用
{
作为分隔符。这确实有帮助!你好,Sara。在StackExchange网站上,“接受”是一种常见的礼仪提供给您的最佳答案。如果您可以接受任何答案,请接受。是的,我已经接受了最符合我原始问题的答案,并添加了一些更新,以防人们对我的错误问题感到困惑。谢谢。有些专栏包含
|
,因此我最终使用了
{
作为分隔符。这确实有帮助!你好,Sara。在StackExchange网站上,“接受”是一种常见的礼仪提供给您的最佳答案。如果您可以接受任何答案,请接受。是的,我已经接受了最适合我原始问题的答案,并添加了一些更新,以防人们对我的错误问题感到困惑。