在R中读取CSV文件时遇到问题

在R中读取CSV文件时遇到问题,r,csv,R,Csv,我是R的新手。 我有一个24MB的CSV文件。用操作系统Yoswmite,4GB内存在我的MacBook Air上读到RStudio。R版本3.1.1(2014-07-10)。查看视图(df)的内容是可以的。正在尝试应用筛选器。不要得到任何点击。正在尝试从字符转换为数字。R在完成铸造的列中将所有字符替换为NA!这里发生了什么?似乎R无法读取单元格的内容。关于编码有什么问题吗? 这就是我所做的: 首先是总结: R代码: eiendommer <- read.csv("eiendommer.c

我是R的新手。 我有一个24MB的CSV文件。用操作系统Yoswmite,4GB内存在我的MacBook Air上读到RStudio。R版本3.1.1(2014-07-10)。查看视图(df)的内容是可以的。正在尝试应用筛选器。不要得到任何点击。正在尝试从字符转换为数字。R在完成铸造的列中将所有字符替换为NA!这里发生了什么?似乎R无法读取单元格的内容。关于编码有什么问题吗? 这就是我所做的: 首先是总结:

R代码:

eiendommer <- read.csv("eiendommer.csv",  sep = ";", quote = "",  encoding="UTF-8", stringsAsFactors = FALSE)
View(eiendommer)# I can view the content of the csv file
filtereiendommer <- filter(eiendommer, kommune == "0101")# no match
filtereiendom <- eiendommer [eiendommer$kommune == "0101",]#no match
utvalg <- eiendommer[160567:161934,]#manual selection of rows do work             utvalgsortert <- arrange(utvalg, desc(jordbruksareal), desc(skogareal))# works
View(utvalgsortert)
##Try to transform columns from character to number. 
transformedEiendom <- transform(sortertEiendom, jordbruksareal = as.numeric(jordbruksareal),
                       skogareal = as.numeric(skogareal) )
#This result in NA where it earlier was characters with lengt 1-3:"646", "18", "2" 
负责人:


看起来您已经指定了
quote=“”
,实际上您应该指定的位置,也许
quote='”
或者只是默认值可以工作

请参见下面的示例

d <- data.frame(x='a',y='"a"',stringsAsFactors=FALSE)
d 
#   x   y
# 1 a "a"

d挪威Kommune Nummer面临的一个挑战是以0开头的,如Halden“0101”

#准备数据
kommune=代表(“0101”,6)

jordbruksareal这导致我在文件中出现问题:

;"BLOMSTERHAGEN\"";
将其更改为:

;"BLOMSTERHAGEN";
修复了问题。不,我可以这样读取.csv:

eiendommer <- read.csv("eiendommer.csv",  sep = ";", encoding="UTF-8", stringsAsFactors = FALSE)

eiendommer Hei CodeR,你的问题不是如何读取CSV文件,而是如何将对象从一个类转换到另一个类。好的,如果我没有听错的话:我所有的数据都有引号(“”),这是因为read.CSV中的引号语句?我这样做是为了读取文件。之前我收到了这样一条消息:警告消息:in scan(文件,what,nmax,sep,dec,quote,skip,nlines,na.strings,:EOF在引号字符串中当在read.csv中包含quotes语句时,我能够读取该文件。谢谢。在这里我找到了有关引号的提示:
;"BLOMSTERHAGEN\"";
;"BLOMSTERHAGEN";
eiendommer <- read.csv("eiendommer.csv",  sep = ";", encoding="UTF-8", stringsAsFactors = FALSE)