按相似列合并-R_R_Function_Merge - Fatal编程技术网

按相似列合并-R

r function merge

按相似列合并-R,r,function,merge,R,Function,Merge,这是一个非常模糊的问题，但我想知道R中是否有某种函数或包可以合并或识别两列或更多列中的相似/相同观察结果（甚至可能会评估每个观察结果彼此之间的相似程度）。我有两个凌乱的数据集，其中的一些列有一些唯一的标识符，但它们之间有很多拼写或细微的差异。例如，您有如下列： c1我们可以使用fuzzyjoin library(fuzzyjoin) stringdist_inner_join(df1, df2, by = c("c1" = "c2")) 正如@gersht在评论中指出的，选择适当的方法和max

这是一个非常模糊的问题，但我想知道R中是否有某种函数或包可以合并或识别两列或更多列中的相似/相同观察结果（甚至可能会评估每个观察结果彼此之间的相似程度）。我有两个凌乱的数据集，其中的一些列有一些唯一的标识符，但它们之间有很多拼写或细微的差异。例如，您有如下列：

c1我们可以使用fuzzyjoin

library(fuzzyjoin)
stringdist_inner_join(df1, df2, by = c("c1" = "c2"))

正如@gersht在评论中指出的，选择适当的方法和max_dist
来进行连接
这类事情总是很棘手的。请查看base R中的adist
，以及stringdist
包。除非您还使用method
和max\u dist
，否则这将无法正常工作。设置method=“cosine”
和max_dist=.33
返回了完美连接。感谢您提供此软件包，很有趣，我这样做实际上是为了临床数据。然而，当我尝试使用我的示例时，它给了我一个空的数据框：//@Mr.Biggums阅读我的评论以使事情正常进行。阿克伦可能会在他/她有机会时编辑。@gersht没错。我想在你发表评论之前更新一下。但是，我以为这部作品只展示了赝品data@Mr.Biggums是的，这是正确的，因为它是基于距离的，有时通过调整这些参数会改变您得到的输出




[function]相关文章推荐



                                                        
Function 我无法使用传递的参数获取开始作业
functionurlpowershellparameters 
Function 是否启用@IsAgentEnabled的Xpages版本？
functionxpages 
Function 在postgresql中管理修订
functionpostgresqltriggers 
Function scala/递归中的模式匹配
functionscaladesign-patternsrecursion 
Function Ocaml函数
functionocaml 
Function 使用SharedObject保存后不能从对象内调用函数
functionactionscript-3 
Function Twilio中调用API Post请求的函数
functiontwilio 
                                       





随机文章推荐



                                                        
Rx java 什么'；RxJs中Observable.expand（）的RxJava等价物是什么？
rx-javarxjs 
Rx java 使用RxJava在不同线程上进行领域、网络操作、订阅和观察
rx-java 
Rx java 如何展平流动性<；可上市未来<；列表<；T>&燃气轮机&燃气轮机；可流动<；T>；异步？
rx-java 
Rx java 在窗口/缓冲区上平放所有观察值
rx-java 
Rx java RxAndroid特定文档有什么好的参考吗？
rx-java 
Rx java 缓存最后发出的项RxJava运算符
rx-java 
Rx java RxJava重试N次
rx-java 
Rx java 在RxJava中从错误中恢复时如何处理不同的流？
rx-java 
Rx java 如何使用RxJava协调可完成的执行列表？
rx-javakotlin 
Rx java RxJava2，2个可观察/可流动的订户，但下一个订户被任何一个订户调用
rx-java 
Rx java 我想解雇&安倍；忘记返回可观察到的HTTP调用。我发现它阻塞了主线程
rx-java 
Rx java 为什么rxjava2共享运营商不是多播？
rx-java


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
如何覆盖R中的默认S3函数？
									R
							 
R 如何检索数据帧中存在的列中重复次数最多的值
									R
							 									Dataframe
							 
如何通过选择列表中除一个值以外的所有元素来子集R中的列表？
									R
							 									List
							 									Object
							 									Vector
							 
对字符矩阵中的选定行求和：错误'；x'；必须是R中的数字
									R
							 									Dataframe
							 
R-使用测试目录外的数据文件进行测试
									R
							 									Testing
							 
如何比较两个矩阵以确定它们在R中是否相同？
									R
							 									Matrix
							 
R 将具有十六进制值的列转换为具有二进制值的多列
									R
							 
为什么回收时间类不'；t在R中的data.frame中工作？
									R
							 									Dataframe
							 
R:for循环中的文本进度条
									R
							 									Function
							 									For Loop
							 
R中两个向量之间的差
									R
							 									Vector
							 
即使data.frame为空，如何安全地替换data.frame中的值？
									R
							 									Dataframe
							 
不同之处：；编制PDF"；RStudio vs.knit（）和knit2pdf（）中的按钮
TL；博士
									R
							 
R 硒的随机睡眠时间
									R
							 									Selenium
							 
R 用替换定义变量求解符号方程
									R
							 
dplyr管道中嵌套函数的执行顺序
									R
							 
R 为不同的方面分配不同的主题
									R
							 
Timeseries群集验证：使用cluster.stats度量确定最佳群集数
									R
							 									Validation
							 									Cluster Computing
							 
如何在R中的fwrite data.table中禁用科学记数法？
									R
							 
R 使用ggplot2自动打印所有data.table列的最佳方法
									R
							 
R 使用交换行/列跨两个不同的数据帧进行t检验？
									R
							 
R ggplot2：组合编组、颜色和线型
									R
							 
在R中：如何按天根据某列中的最大值聚合整行？
									R
							 
R 如何在正则表达式中使用逻辑运算符包含多个负的前向和后向条件
									R
							 
R 增强回归树-偏差值
									R
							 
计算R中ARIMA模型残差的RMSE和ACF图
									R
							 
将文字标签添加到R plotly中标记（多条记录道）的顶部
									R
							 									Shiny
							 
R 默认情况下折叠DT表列
									R
							 
R 用geom_线绘制双线时的问题
									R
							 
R DBCSN群集大小
									R
							 
ggplot2库在R版本4.0.5中工作吗？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Streaming
Collections
Typo3
Mule
Bash
Object
Tabs
Linker
Grep
Data Binding
Mysql
Laravel
Web Scraping
Jar
Model View Controller
Air
Pdf
Activerecord
Sphinx
Struct
Sas
Azure Functions
Netty
Lucene
Exception Handling
Gatsby
Soap
Corda
Csv
Sails.js
Types
Parameters
Telegram
Aframe
Jquery Plugins
Ignite
Haskell
Groovy
Windows Phone 7
Orientdb
Sharepoint 2013
Objective C
Bots
Woocommerce
Scala
Tensorflow
Bluetooth
Coldfusion
Http
Ms Word
Libgdx
Processing
Plone
Virtualbox
Jaxb
Permissions
Image Processing
Jsf
Aws Lambda
Hyperlink
Verilog
Authentication
Laravel 4
Javascript
Active Directory
Google Calendar Api
Couchbase
Image
Clearcase
Github
Visual C++
Lua
Octave
Drools
Discord.js
Wolfram Mathematica
Embedded
Web Applications
Pandas
Gulp
Iframe
Vb.net
Discord.py
Firebase
Jpa
Signalr
Apache Spark
Testng
Mvvm
Jhipster
Swing
Material Ui
Logging
Data Structures
Go
Mapping
Imagemagick
Quickbooks
Path
Pentaho
.net
Ipad
Leaflet
Webpack
Openssl
Asp.net Core Mvc
Jms
Oracle10g
Concurrency
Shiny
Matrix
Spring Batch
Nhibernate
Combobox
Xpages
Sql Server 2008
Android Studio
Entity Framework Core
Cordova
Hyperledger Fabric
Backbone.js
Knockout.js
Aurelia
Fullcalendar
Asp.net Mvc 5
Random
Ldap
Yii
Excel Formula
Django Models
Hive
Sublimetext2
Vagrant
Computer Vision
Documentation
Design Patterns
Jmeter
Gmail
Delphi
Tkinter
Ssis
Date
Unix
Android Emulator
Wpf
Machine Learning
Weblogic
Extjs4
Loopbackjs
R
Big O
Indexing
Entity Framework 4
Single Sign On
Azure Ad B2c
Sql Server 2005
Visual Studio
Apache Flink
Cobol
Dll
Spring Cloud
Session
Colors
Java 8
Jersey
Plsql
Nestjs
Sharepoint
Tree
Eclipse Plugin
Aem
Arangodb
Layout
Keyboard
Outlook
Xmpp
Rspec
Instagram
Webgl
Android Fragments
Curl
Jquery Ui
Yaml
Google Cloud Firestore
Navigation
Xsd
Firefox
Asp.net Mvc 2
Jquery
Vuejs2
Tfs
Google Cloud Platform
Airflow
Process
Webview
Ant
Loops
Video
Visual Studio 2013
Sdk
Gis


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网