R 确定如何将大型数据集中的列快速分类为因素_R_Apply_R Caret_Categorical Data_Data Cleaning - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 确定如何将大型数据集中的列快速分类为因素_R_Apply_R Caret_Categorical Data_Data Cleaning - Fatal编程技术网

R 确定如何将大型数据集中的列快速分类为因素

r

R 确定如何将大型数据集中的列快速分类为因素,r,apply,r-caret,categorical-data,data-cleaning,R,Apply,R Caret,Categorical Data,Data Cleaning,这里没有好的例子，因为我正在使用的数据集是巨大的但如果我有一个200300something列数据集，我希望有某种规则来快速分类并将其中一些列转换为因子。是否有一些快速的R代码来做这件事原因是我没有时间逐列地完全理解或解释数据，但如果我看到5000行中只有4个唯一的值，我假设这是分类数据任何人都有快速的代码片段或方法来执行此操作吗？假设df指的是您的数据帧： ## Find all columns with less than 5 unique values cols <- appl

这里没有好的例子，因为我正在使用的数据集是巨大的

但如果我有一个200300something列数据集，我希望有某种规则来快速分类并将其中一些列转换为因子。是否有一些快速的R代码来做这件事

原因是我没有时间逐列地完全理解或解释数据，但如果我看到5000行中只有4个唯一的值，我假设这是分类数据

任何人都有快速的代码片段或方法来执行此操作吗？

假设

df

指的是您的数据帧：

## Find all columns with less than 5 unique values
cols <- apply(df, 2, FUN = function(x) length(unique(x))) < 5

## Convert columns with less than 5 unique values to factor
df[cols] <- lapply(df[cols], factor)

##查找唯一值小于5的所有列
cols假设df
引用您的数据帧：
## Find all columns with less than 5 unique values
cols <- apply(df, 2, FUN = function(x) length(unique(x))) < 5

## Convert columns with less than 5 unique values to factor
df[cols] <- lapply(df[cols], factor)

##查找唯一值小于5的所有列
科尔斯




[reactjs]相关文章推荐



                                                        
Reactjs 如何在react using material ui中使用模型？
reactjsmaterial-ui 
Reactjs 试剂：未使用元注释组件函数调用组件挂载挂钩
reactjs 
Reactjs React的状态如何工作？
reactjs 
Reactjs 反应/支柱类型和流量
reactjs 
Reactjs 当列表数据是较大数据集的一部分时，如何在react中呈现列表
reactjs 
ReactJS图像上载不工作
reactjs 
Reactjs 使用react jss和Ezyme时，如何测试组件方法？
reactjstestingmaterial-ui 
Reactjs 反应组件在我的状态下没有收到我的道具
reactjs 
Reactjs 单页应用程序在SSR中的工作原理（React）
reactjsnext.js 
如何在带有url的reactjs中添加json文件作为资源？
reactjsnpm 
Reactjs 在React中动态创建组件，并将其存储在状态变量中以显示在对话框中
reactjstypescript 
是什么导致ReactJS页面对账示例中的输入框文本未重新排序？
reactjs 
Reactjs spfx web部件sharepoint online的全球可用性
reactjssharepoint 
Reactjs 在React/Redux中，如何处理竞争条件Ajax响应？
reactjsredux 
Reactjs 在package.json中使用本地路径依赖项会导致TypeScript错误
reactjstypescriptnpm 
Reactjs 生成-React.js后代理不工作
reactjsproxy 
Reactjs 新产品管理“；“建立”；不为我的react工作+；网页包项目
reactjsnpmwebpack 
Reactjs 当我将对象作为道具传递时，纯组件的工作原理与普通组件类似？
reactjsreact-native 
Reactjs 如何呈现来自全局函数的通知-React
reactjs 
Reactjs 数组索引不起作用时响应动态变量名
reactjsreact-native 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
在R中加载evd包时出错
									R
							 									Installation
							 
R:xts复杂查询
									R
							 
R：如何计算1,5*IQR晶须的值
									R
							 									Statistics
							 
R 如何向多面板晶格图形添加点？
									R
							 
如何将数字向量转换为R中的字符串？
									R
							 
R 公式中因子变量名称的安全廉价扩展
									R
							 
R 按小组对意见进行编号
									R
							 
绘制ROC曲线并计算特定截止信息下R的AUC
									R
							 
R 如何在其中一个变量上使用过滤器进行tapply
									R
							 
R中naivebayes中带数值预测器的奇怪结果
更新：
									R
							 									Machine Learning
							 
用IGRAPHE在R？
									R
							 									Graph
							 
R 推荐标签未给出topN列表
									R
							 
R 使用合并函数从xts对象获取最大值
									R
							 									Merge
							 
R 将多行分类为一个变量
									R
							 
使用R将列表元素与数据帧匹配
									R
							 									List
							 									Dataframe
							 
R 选择受约束的不相关子集
									R
							 									Algorithm
							 									Performance
							 
R 合并具有相同ID变量的行
									R
							 									Merge
							 
使用R从公司网络连接到特定webservice API时出现超时错误
									R
							 									Web Services
							 									Proxy
							 
IE 11中未呈现FlexR仪表板
									R
							 									Internet Explorer
							 
R ggplot颜色条小于和大于平均值
									R
							 
R 替换列中出现少于x次的值
									R
							 									Dataframe
							 
R 在ggplot2中的组级别应用函数
短版
									R
							 
R 每行i和i+的切换顺序；使用每秒i（i=1,3,5，…）在列中输入1
									R
							 									Sorting
							 
R：将包含类似Excel的相对引用的函数应用于其他列
									R
							 
排除dataframe中至少有一个零值Ctrl或Mn命名列的行
									R
							 									Dataframe
							 
在R中将数据帧转换为列表
									R
							 									List
							 									Dataframe
							 
R 如何将图例添加到组合图中？
									R
							 
从列表中提取ARIMA对象并存储在R中的数据帧中
									R
							 
R将变量传递到自定义函数purrr
									R
							 
Pivot_多变量函数（tidyr包）
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Programming Languages
Monitoring
Tsql
Cobol
Spring
Azure Devops
Spring Batch
Unix
Openerp
Stripe Payments
Geometry
Julia
Ios8
Llvm
Protocol Buffers
Vba
Visual Studio 2015
Ldap
Powerbi
Oracle
.net
Iis
Akka
Atom Editor
Network Programming
Routes
Mpi
Openlayers
Apache Flex
Spring Boot
Android Studio
Linq
Jsf 2
Sbt
Calendar
Search
Lambda
Aurelia
Wordpress
Amazon S3
Mvvm
Kendo Ui
Cloud Foundry
Deployment
Import
Java Me
Kubernetes
Matplotlib
Localization
Keras
Sphinx
Math
Aws Lambda
Gremlin
Dependency Injection
Rabbitmq
Kernel
EmptyTag
Uwp
Liferay
Inno Setup
Fortran
Memory
Android
File Upload
Vuejs2
Hibernate
Generics
Alfresco
Bots
Clearcase
Ip
Rss
Pointers
Speech Recognition
Ecmascript 6
Microsoft Graph Api
Corda
Spring Security
Blackberry
X86
Twitter
Gitlab
Google Api
Stm32
Typo3
Symfony1
Coding Style
Codeigniter
Wpf
Sapui5
Server
Replace
Discord
Python 3.x
Magento
Ms Access
.net 4.0
Sed
Jasmine
Graphics
Enums
Ajax
Sitecore
Asp.net Mvc 4
Aem
Multithreading
Ionic Framework
Shell
Ios6
Sql Server 2008 R2
Sockets
Excel Formula
Angular Material
Django
Extjs
Virtualbox
Directx
Imagemagick
Asp.net Mvc 3
Jdbc
Sas
Cucumber
Twig
Azure Ad B2c
Web
Swift2
Apache Zookeeper
Dojo
Phpunit
Join
Ios
Devexpress
Jira
Swiftui
Ruby On Rails 3
Angular6
Vue.js
Smalltalk
Phantomjs
Android Layout
Stored Procedures
Instagram
Snowflake Cloud Data Platform
Robotframework
Db2
Dns
Install4j
Vb.net
Jms
Antlr
Hive
File Io
Flash
C
Windows 10
Variables
Transactions
Actionscript 3
Appium
Azure Service Fabric
Cocoa Touch
Google Analytics
Dotnetnuke
Tkinter
Dll
Ansible
Intellij Idea
Teamcity
Sencha Touch
Layout
C# 3.0
Drop Down Menu
3d
Data Binding
Asterisk
Gwt
D3.js
Doctrine
Notepad++
Sublimetext3
Gradle
Apache
Google Calendar Api
Knockout.js
Curl
Google App Maker
Asp.net Web Api
Plone
C++
Database Design
Magento2
Serial Port
Active Directory
Debian
Firefox
Arangodb
Neo4j
Session
Pyspark
Docusignapi


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网