数据质量-检查字符列中的所有值是否都是R中的数字
我希望在许多系统生成的表上执行数据质量。检查之一是查看字符列中的所有值是否仅为数字。我想知道这个检查是真的数字列。以下表为例,我想确定两列(代码和年龄)是仅由数值组成的字符列 表格结构 列名 数据类型 名称 性格 类型 性格 代码 性格 会员身份证 整数 收款日期 日期 年龄 性格 高度 双重的数据质量-检查字符列中的所有值是否都是R中的数字,r,data-quality,R,Data Quality,我希望在许多系统生成的表上执行数据质量。检查之一是查看字符列中的所有值是否仅为数字。我想知道这个检查是真的数字列。以下表为例,我想确定两列(代码和年龄)是仅由数值组成的字符列 表格结构 列名 数据类型 名称 性格 类型 性格 代码 性格 会员身份证 整数 收款日期 日期 年龄 性格 高度 双重的 我们可以在select本身中构造条件 library(dplyr) iris %>% select(where(~ all(varhandle::check.numeric(.))))
我们可以在
select
本身中构造条件
library(dplyr)
iris %>%
select(where(~ all(varhandle::check.numeric(.))))
尚不清楚是类型不匹配的
数值
列,还是具有某些字符元素的列,因此被转换为类
字符
。如果是前者,则添加一个类型。在之前转换,选择,然后仅获取数字列
df %>%
type.convert(as.is = TRUE) %>%
select(where(is.numeric))
谢谢你这是完美的,非常简单,非常感谢!