R 使用基于ID变量的因子值填充缺少的值_R_Missing Data - Fatal编程技术网

R 使用基于ID变量的因子值填充缺少的值

r

R 使用基于ID变量的因子值填充缺少的值,r,missing-data,R,Missing Data,我想根据ID变量，用正确的因子值填充以下是变量： ID <- c(1,1,1,2,2,2,3,3,3) Gender_NA <- c("m",NA,"m",NA,"f",NA,"m","m",NA) Gender <- c("m","m","m","f","f","f","m","m","m") ID来自library（zoo）的na.locf函数可用于将na元素替换为相邻的非na先前元素。使用data.table，我们将“data.frame”转换为“data.tabl

我想根据

ID

变量，用正确的因子值填充

以下是变量：

ID <- c(1,1,1,2,2,2,3,3,3)
Gender_NA <- c("m",NA,"m",NA,"f",NA,"m","m",NA)
Gender  <- c("m","m","m","f","f","f","m","m","m")

ID来自library（zoo）
的na.locf
函数可用于将na
元素替换为相邻的非na先前元素。使用data.table
，我们将“data.frame”转换为“data.table”，按“ID”分组，我们用前面的非NA替换NA元素，如果第一个元素是NA，它将不会被替换，我们可以使用第二个NA.locf
选项fromLast=TRUE
将剩余的NA替换为后续的非NA元素
library(zoo)
library(data.table)
setDT(Data_have)[, Gender := na.locf(na.locf(Gender_NA, 
            na.rm=FALSE),fromLast=TRUE), by = ID][, Gender_NA := NULL]
Data_have
#    ID Gender
#1:  1      m
#2:  1      m
#3:  1      m
#4:  2      f
#5:  2      f
#6:  2      f
#7:  3      m
#8:  3      m
#9:  3      m

或者，在按ID
分组时，我们可以使用na.omit（）
忽略所有NAs，并按如下方式选择第一个元素：
setDT(Data_have)[, Gender := na.omit(Gender_NA)[1L], by =  ID][, Gender_NA := NULL]


或者使用与dplyr相同的方法：
library(dplyr)
Data_have %>% 
     group_by(ID) %>%
     transmute(Gender= first(na.omit(Gender_NA)))
#    ID Gender
#   (dbl) (fctr)
#1     1      m
#2     1      m
#3     1      m
#4     2      f
#5     2      f
#6     2      f
#7     3      m
#8     3      m
#9     3      m

下面是我如何使用数据。表：
require(data.table) # v1.9.6+
dt = data.table(ID, Gender_NA)
# Gender_NA is of character type

答案如下：
dt[is.na(Gender_NA), Gender_NA := na.omit(dt)[.SD, Gender_NA, mult="first", on="ID"]]

require(data.table) # v1.9.6+
dt = data.table(ID, Gender_NA)
# Gender_NA is of character type

dt[is.na(Gender_NA), Gender_NA := na.omit(dt)[.SD, Gender_NA, mult="first", on="ID"]]




[amazon cloudformation]相关文章推荐



                                                        
Amazon cloudformation 使用现有VPC/NAT的中层云形成模板
amazon-cloudformation 
Amazon cloudformation 启动时引导EC2实例以安装awslogs
amazon-cloudformation 
Amazon cloudformation 使用AWS机密管理器'；云层形成的秘密
amazon-cloudformation 
Amazon cloudformation AWS Fargate-实例启动时运行状况检查失败
amazon-cloudformation 
Amazon cloudformation 如何诊断；属性参数的值必须是具有字符串（或简单类型）属性的对象；
amazon-cloudformation 
                                       





随机文章推荐



                                                        
如何在NetSuite上列出配送方式？
netsuite 
NetSuite自定义-选择ItemFulfillment“；“包装”；作为列表/记录作为自定义记录字段
netsuite 
如何为Netsuite中的所有角色部署RESTlet脚本？
netsuite 
如何在NetSuite中查找与客户退款相关的客户存款
netsuite 
Netsuite 对suitelet 2.0中form.addButton的操作
netsuite 
Netsuite 如何访问记录的状态'；使用SuiteScript的工作流？
netsuite 
Netsuite Suitescript打印输出对象内容
netsuite 
Netsuite SuiteScript hmac sha256
netsuite 
NetSuite当前在哪个版本的javascript上运行SuiteScripts？
netsuite 
Netsuite 如何为乞力马扎罗扩展OrderWizard.confirmation.module？
netsuite 
Netsuite 使用套件脚本在net suite中完成日志显示
netsuite 
Netsuite 导出数据的附件大小限制？
netsuite 
NetSuite：使用HTTPS模块从NetSuite页面获取响应，使用管理员身份验证
netsuite 
Netsuite 从销售订单套件脚本2.0中删除项目组
netsuite 
NetSuite错误代码：您只能在此字段中输入数字
netsuite


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
高数据分辨率r编程中大圆距离的计算
									R
							 
使用R中的if条件对向量执行变换
									R
							 									If Statement
							 
如何绘制不带'；t在R中与Y轴相交？
									R
							 
根据“a”计算百分比；列表“；，R
									R
							 
R 在降价输出中折叠文本和图像
									R
							 
R 根据目标向量对df列进行排序（但名称仅部分匹配）
									R
							 									Matrix
							 									Vector
							 
R 按30分钟的间隔创建时间序列
									R
							 
如果行中的值与R中的最后一行匹配，则替换该行中的值
									R
							 									Dataframe
							 
如何从R中定义的范围生成随机数
									R
							 									Random
							 
R data.table—高效地操作大型数据集
									R
							 									Matrix
							 
R .SD的行数
									R
							 
从每一行中提取相似的数字，形成R中的新数据帧
									R
							 
R 仅打印到切割的簇，而不是每个叶
									R
							 									Plot
							 
R 中位数替换，需要数字数据
									R
							 
R：按日期时间将forecast:：tsclean（）的输出与原始数据帧关联
									R
							 									Dataframe
							 
R 需要有限的xlim值（建筑预测中的错误）
									R
							 									Plot
							 
R 将命令循环到整个目录
									R
							 									File
							 									Loops
							 
R 将日期转换为月份和月份的虚拟日期
									R
							 									Date
							 
R 按组填写缺少的日期行
									R
							 									Date
							 
如何使用dplyr计算到目前为止在组中遇到的不同值的数量
									R
							 
R使用ifelse函数为多个数据帧创建新列
									R
							 
R 多分类支持向量机中如何利用交叉验证确定代价
									R
							 
County R中同一列中相同单词的频率
									R
							 									Dataframe
							 
R将变量转换为新列
									R
							 
R 图基'；s测试结果框图
									R
							 
R GGplot地图比例个性化
									R
							 
如何在mlr中使用mlr中的软件包（如glmnet）？
									R
							 
在R中重新配置普查数据集
									R
							 
dataframe的My R Summary（）未正确计算字符串
									R
							 
在循环中创建R数据帧
									R
							 									Dataframe
							 									Loops
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Alfresco
Logging
Soap
Cmake
Go
Aws Lambda
Ip
Search
Haskell
Signalr
Webpack
Web Scraping
Fullcalendar
C++
Android Studio
Sql Server 2008 R2
Sugarcrm
Xamarin
Entity Framework 4
Octave
Compression
Mediawiki
Three.js
Material Ui
Perforce
Github
Resharper
Neural Network
Cakephp
Composer Php
Blackberry
D
Apache Kafka
Libgdx
Checkbox
Google App Maker
Codeigniter
Vagrant
Active Directory
Process
If Statement
Tinymce
Path
Visual Studio
Ide
Project Management
Doctrine Orm
Nosql
Electron
C
Wordpress
Vaadin
Asp.net Mvc 5
Itext
Windows Store Apps
Telegram
Sharepoint
Responsive Design
Virtualbox
Netlogo
Jwt
Wix
Graphql
C# 4.0
Ember.js
Laravel
Python 3.x
Udp
Firefox Addon
Mono
Cron
Antlr4
Erlang
File Upload
Netbeans
Sapui5
Ios8
E Commerce
Charts
Ios6
Optimization
Ftp
Pentaho
Amazon Web Services
Cryptography
Atom Editor
Lucene
Batch File
Graphics
Spring Security
Database
Lisp
Mariadb
Twitter Bootstrap
Web
Glsl
Google Maps Api 3
Windbg
Mongodb
Ssas
Vmware
Sphinx
Teamcity
Linkedin
Terminal
Pagination
Snmp
Mdx
Curl
Tridion
Unit Testing
Rest
Dynamics Crm 2011
Cmd
Kendo Ui
Blazor
Cocoa
Mercurial
Google Cloud Platform
Struts2
Memory Management
Bluetooth
Ruby On Rails 3.2
Coldfusion
Django Models
Coding Style
Tomcat
Lambda
Math
Com
Content Management System
Cassandra
Grid
Drools
Windows Runtime
Mapreduce
Anaconda
Zsh
Autodesk Forge
Monitoring
Asp.net Mvc 4
Xna
Passwords
Sorting
Security
Docker Compose
Network Programming
Reporting Services
Combobox
Tsql
Windows Phone 7
Jsf 2
Scala
Angularjs
Gulp
Embedded
Windows Installer
Winapi
Scrapy
3d
Woocommerce
Layout
Spring Batch
Solr
Yocto
Install4j
Plsql
Routes
Programming Languages
Pine Script
Visual Studio Code
Json
For Loop
Cloud
Sed
Input
Matplotlib
Cocos2d Iphone
Html
Junit
Data Structures
Windows Phone 8.1
Next.js
Requirejs
Spring Integration
Activemq
Bison
Ms Office
Rdf
Jsp
Exchange Server
Oracle
Meteor
Bootstrap 4
Tfs
Sencha Touch 2
Tensorflow
Log4net
Cucumber
Wxpython
Nestjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网