Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何将包含许多不同字符串的列转换为两级因子列?_R - Fatal编程技术网

R 如何将包含许多不同字符串的列转换为两级因子列?

R 如何将包含许多不同字符串的列转换为两级因子列?,r,R,假设我收集了一个车库销售的样本,在这个样本中有一个名为Additional Description的列,由于它的可选性,一些条目是空的,而其他条目是填的。如果我把它变成一个因子列,我会得到大约5000个不同的水平。相反,我更想知道是否有一个额外的描述有助于车库销售或没有 因此,我想将空行转换为因子属性N,将非空行转换为因子属性Y。那么,我可以用什么方法来转换数据以满足我的需要呢 例如: 数据的外观: str(data) $ Additional Description: chr NA NA N

假设我收集了一个车库销售的样本,在这个样本中有一个名为Additional Description的列,由于它的可选性,一些条目是空的,而其他条目是填的。如果我把它变成一个因子列,我会得到大约5000个不同的水平。相反,我更想知道是否有一个额外的描述有助于车库销售或没有

因此,我想将空行转换为因子属性N,将非空行转换为因子属性Y。那么,我可以用什么方法来转换数据以满足我的需要呢

例如:

数据的外观:

str(data)
$ Additional Description: chr  NA NA NA "New Products" "Outdoor Sale" ...
我希望数据的外观:

str(data)
$ Additional Description: Factor w/ 2 levels "N","Y": 1 1 1 1 1 1 1 1 1 1 ...

请试着给出一个例子,每当你张贴一个问题。 如果希望将空行设为N,将非空行设为Y,请尝试以下操作:

df$Additional.Description.New[!is.na(df$Additional.Description)] = "Y"
df$Additional.Description.New[is.na(df$Additional.Description)] = "N"

请给出数据和预期输出的示例。df$newcol您需要发布问题中的数据,而不是在链接、下载或图片中。请阅读并相应编辑您的问题。此外,这个问题与RStudio无关,因此请不要将标签添加回RStudio。不仅需要简化示例,因为很难以避免误解的方式描述数据。回答问题的人免费投入时间帮助他人。准备样本数据也需要时间,如果你希望别人帮助,你应该愿意自己做这部分工作。示例补充道,这是我第一次提交和使用此网站。所以请原谅我不知道确切的指导方针,我的错。