数据质量-检查字符列中的所有值是否都是R中的数字

数据质量-检查字符列中的所有值是否都是R中的数字,r,data-quality,R,Data Quality,我希望在许多系统生成的表上执行数据质量。检查之一是查看字符列中的所有值是否仅为数字。我想知道这个检查是真的数字列。以下表为例,我想确定两列(代码和年龄)是仅由数值组成的字符列 表格结构 列名 数据类型 名称 性格 类型 性格 代码 性格 会员身份证 整数 收款日期 日期 年龄 性格 高度 双重的 我们可以在select本身中构造条件 library(dplyr) iris %>% select(where(~ all(varhandle::check.numeric(.))))

我希望在许多系统生成的表上执行数据质量。检查之一是查看字符列中的所有值是否仅为数字。我想知道这个检查是真的数字列。以下表为例,我想确定两列(代码和年龄)是仅由数值组成的字符列

表格结构

列名 数据类型 名称 性格 类型 性格 代码 性格 会员身份证 整数 收款日期 日期 年龄 性格 高度 双重的
我们可以在
select
本身中构造条件

library(dplyr)
iris %>%
   select(where(~ all(varhandle::check.numeric(.)))) 

尚不清楚是类型不匹配的
数值
列,还是具有某些字符元素的列,因此被转换为
字符
。如果是前者,则添加一个
类型。在
之前转换
,选择
,然后仅获取数字列

df %>%
   type.convert(as.is = TRUE) %>%
   select(where(is.numeric))

谢谢你这是完美的,非常简单,非常感谢!