R从拆分函数的因子中删除NA值
我正在使用split函数将data.frame分为三类(C、Q或S)。现在,当我执行split函数时,我注意到变量中现在有4个列表(C、Q、S和空字符串) 我认为这与NA值或空字符串有关。如何正确地筛选此项? 目前,我的代码如下所示:R从拆分函数的因子中删除NA值,r,R,我正在使用split函数将data.frame分为三类(C、Q或S)。现在,当我执行split函数时,我注意到变量中现在有4个列表(C、Q、S和空字符串) 我认为这与NA值或空字符串有关。如何正确地筛选此项? 目前,我的代码如下所示: # Read the data from the CSV file. train.csv <- read.csv("train.csv") # Create some handy variables ship.embarked <- split(tr
# Read the data from the CSV file.
train.csv <- read.csv("train.csv")
# Create some handy variables
ship.embarked <- split(train.csv, train.csv$Embarked)
ship.pclass <- split(train.csv, train.csv$Pclass)
#从CSV文件中读取数据。
train.csv如果我们需要删除”
,转换为字符
,使用nzchar
返回一个逻辑向量,根据该向量对行进行子集,并使用droplevels
删除未使用的级别
train.csv <- droplevels(train.csv[nzchar(as.character(train.csv$Embarked)),])
train.csv您可以检查?is.na
或na.omit
等您能给我举个例子吗?当我使用?is.na
时,我只得到了一个列表,而不是预期的三个。我的意思是train.csv-Hmm,似乎对我来说不起作用。仍然返回相同的数据集,相同的4个列表。您可以检查str(train.csv)
,还可以查看NA
是真实的NA还是某个字符串。如果您有空白字符串“
,则train.csv