R 将分类/群集任务中的文本值更改为int_R_Dataframe_Cluster Analysis_Data Manipulation - Fatal编程技术网

R 将分类/群集任务中的文本值更改为int

r dataframe

R 将分类/群集任务中的文本值更改为int,r,dataframe,cluster-analysis,data-manipulation,R,Dataframe,Cluster Analysis,Data Manipulation,任务是使用dataset在R中进行聚类，其中包含分类文本值（如“蓝色”、“红色”）。虽然k-means算法只接受数值，所以我需要将文本类别转换为int类别。有什么单线解决方案吗？或者其他什么 Attribute1 Attribute2 Attribute1 Attribute2 Instance1 "blue" "red" => Instance1 1 2 Instance2

任务是使用dataset在R中进行聚类，其中包含分类文本值（如“蓝色”、“红色”）。虽然k-means算法只接受数值，所以我需要将文本类别转换为int类别。有什么单线解决方案吗？或者其他什么

         Attribute1 Attribute2                     Attribute1 Attribute2
Instance1  "blue"     "red"         =>  Instance1       1          2
Instance2  "green"    "blue"            Instance2       3          1

a[，1]因此，在进行聚类分析时，我们希望使我们的聚类尽可能彼此远离。我所考虑的有问题的方法
太过直截了当，效果会很差（如果实现的话）。好的解决方案是应用一些可以处理混合数据类型的距离度量。
评论中提到的是gower，它是通用的。二元类别也存在Jaccard距离。
高尔解决方案（R）的示例：
库（集群）
gower.dissimility.mtrx你不能这样做，如果你将“蓝色”、“红色”转换为1,2，你是在暗示某种顺序，我猜不是这样的？你应该做一个热编码，或者尝试gower距离进行聚类，例如，是的，非常感谢。这正是我所期待的，它帮助了我：）
x_num <- as.numeric(x)

library(cluster)
gower.dissimilarity.mtrx <- daisy(DataFrame, metric = c("gower"))




[dataframe]相关文章推荐



                                                        
Dataframe 对Deedle数据帧的子数据帧进行切片的最佳方法是什么？
dataframef# 
根据引用键重命名dataframe中的列
dataframe 
Pyspark dataframe：交叉表或其他使行标签成为新列的方法
dataframepyspark 
Dataframe 如何使用fread将google sheets URL CSV加载到全局环境中
dataframe 
Spark Dataframe-如何根据ID和日期仅保留每个组的最新记录？
dataframedateapache-sparkpyspark 
Dataframe 将数据帧集合合并为一个大数据帧
dataframejulia 
Dataframe Light（）在spark中有什么用途？下面两段代码返回相同的输出，使用lit（）有什么好处
dataframeapache-sparkpyspark 
如何使用spark dataframe在csv文件中以双引号获取所有记录？
dataframecsvpyspark 
Dataframe 是否可以获取单个数据帧行并将其拆分为多个数据帧行？
dataframeapache-sparkpyspark 
Dataframe 如何使Pluto.jl输出单元适合数据帧大小
dataframejulia 
Dataframe 我不知道'；我不知道如何在数据帧中进行条件分支
dataframeapache-sparkpyspark 
Dataframe 具有多种数据类型的Pyspark SQL数据帧映射
dataframepyspark 
                                       





随机文章推荐



                                                        
Python sphinx 不渲染空间的静止分隔符
python-sphinx 
Python sphinx 在Sphinx中为文本块而不是内联跨距应用CSS和角色
python-sphinx 
Python sphinx 段落标记未在RestructuredText表格单元格中呈现
python-sphinx 
Python sphinx 如何自定义Sphinx RtD主题的默认搜索设置？
python-sphinx 
Python sphinx 通过https将sphinx生成的文档上载到pypi
python-sphinx 
Python sphinx 在sphinx中插入图像
python-sphinx 
Python sphinx 在Sphinx文档中隐藏单个部分
python-sphinx 
Python sphinx 如何设置扩展名'；斯芬克斯中的s配置值
python-sphinx 
Python sphinx Sphinx无法导入模块依赖项
python-sphinx 
Python sphinx 如何在Sphinx中获取cpp-Doxygen模块列表？
python-sphinxdoxygen 
Python sphinx 如何删除“；“下一个/上一个主题”；在斯芬克斯侧边栏？
python-sphinx


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
在R中，如何在对数据进行聚类后绘制相似性矩阵（如块图）？
									R
							 
R 在Swave中储存和以后使用乳胶标题的最佳方法？
									R
							 									Text
							 									Latex
							 
R 使用Ecdf标记绘图轴时出错
									R
							 
R 使用ggplot2中的不同调色板进行过涂
									R
							 
R从文件读取邻接列表
									R
							 
R 截获及；使用点（…）中捕获的可选变量的值
									R
							 									Parsing
							 
添加小于符号“的内容”<&引用；，通过R中的geom_文本到ggplot
									R
							 
R 将边框添加到geom_线段中的线段
									R
							 
R 为什么这些数字不相等？
									R
							 									Floating Point
							 
在R函数中创建/保存数据帧
									R
							 									Function
							 
R-使用另一个向量替换因子的级别
									R
							 
如何在R中合并多个等格式的数据帧，以便在一个Digram中使用ggplot进行绘图
									R
							 
使用R加速循环和条件
									R
							 									For Loop
							 									Parallel Processing
							 
r solve.QP：约束不一致，没有解决方案
									R
							 
R 确认方法非常慢
									R
							 									Statistics
							 
用r中截断的正态分布值替换NA
									R
							 
在R中读取文本文件
									R
							 									Dataframe
							 
将哪个（，arr.ind=T）反馈到R中矩阵的最佳方法？
									R
							 									Matrix
							 
R中的错误，月份为级别。这是错误还是逻辑缺陷？
									R
							 
如何在没有级别的情况下将多文件.xlsx数据导入单个R数据帧？
									R
							 									Excel
							 									Import
							 
以R为单位的阴影置信区间-如有可能，以R为基数
									R
							 									Statistics
							 
使用二元相依变量的R上的Glm模型：结果&；数据
									R
							 
修改插入符号中的Summary函数以计算分组的Brier分数
									R
							 
将broom:：glance（）与glmmTMB结合使用
									R
							 
R 使用自定义函数时Lappy出现意外结果
									R
							 									List
							 									Function
							 
在R bookdown中折叠常规文本
									R
							 
如何为shapiro.test创建循环
									R
							 
如何在R中选择组内两个变量组合上具有特定值的行
									R
							 									Function
							 
R 如何使用ggplot2重叠两个具有不同轴的双地块？
									R
							 
如何在R中操作excel文件文件夹？
									R
							 									Loops
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Kdb
Colors
Validation
Visual Studio 2017
Matplotlib
Extjs
Cloud Foundry
Sharepoint
Prolog
Zend Framework
Sed
Java
Perforce
Tags
Azure Ad B2c
Vb6
Visual Studio 2010
Merge
Sass
Html5 Canvas
Unity3d
Dynamic
View
Windows 7
Nhibernate
Google Chrome Extension
Vue.js
E Commerce
Cluster Computing
Jestjs
Pagination
Spring Cloud
Azure Cosmosdb
Mysql
Oracle
Knockout.js
Automated Tests
Drupal 7
Dynamics Crm 2011
Encryption
Browser
Url
Module
C++
Glassfish
Firefox
Scheme
Itext
Smalltalk
Install4j
Fiware
Frameworks
Shopify
Intellij Idea
Synchronization
Utf 8
Amazon Redshift
Qt4
Python 3.x
Directx
Lambda
Keycloak
Inno Setup
Appium
Pandas
Zsh
User Interface
Unicode
Arm
Protractor
Amazon Ec2
Ipad
Process
Speech Recognition
Cakephp
C#
Sap
Alfresco
Mapbox
Boost
Cucumber
Gruntjs
Npm
Plot
Sublimetext2
Office Js
Windows Phone 8
Fonts
Error Handling
Ant
Uitableview
3d
Cassandra
Asp.net Mvc
Ruby On Rails 3
Entity Framework
Ruby On Rails 3.2
Gradle
Datetime
Ms Access
Laravel
Julia
Build
Web Scraping
Ssis
Gcc
Apache Kafka
Applescript
Powerbi
Compiler Errors
Debugging
Fullcalendar
Proxy
Linux Kernel
Visual Studio 2008
String
Django Models
Post
Node.js
Google Api
Dynamics Crm
Text
Cocos2d X
Python Sphinx
Twig
Recursion
Exception
Pyspark
Coldfusion
Visual Studio 2015
Opengl
Sql Server 2012
Phpunit
Linker
Clojure
Events
Numpy
Leaflet
C++11
Sharepoint 2007
Curl
Gtk
Wso2
Tsql
Jsf 2
Algorithm
Excel
Jenkins
Checkbox
Jasper Reports
Winforms
Openlayers 3
Kubernetes
Asp.net
Testng
Operating System
Workflow
Discord.js
Mapreduce
Css
Binary
Calendar
Sql Server 2008
File Io
Visual Studio Code
Xcode4
Mariadb
Audio
Visual Studio
Ckeditor
Bash
Google Chrome Devtools
EmptyTag
Android Layout
Stream
Eclipse Plugin
Uiview
Search
Vbscript
Ios6
Download
Editor
Ios7
Random
Windows 8
Flutter
Discord.py
Windows Phone 8.1
Notepad++
Amazon S3
Liferay
Odata
Web
Android Fragments
Usb
Optimization
Data Structures
Windows Store Apps
Maven 2
Exchange Server
Gdb


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网