从R中的全名中删除重复的名字_R_Dataframe - Fatal编程技术网

从R中的全名中删除重复的名字

r dataframe

从R中的全名中删除重复的名字,r,dataframe,R,Dataframe,考虑以下data.frame： df <- data.frame(ID = 1:3, Name = c("Xiao-Li Meng, Michael Drake, Jennifer Chayes, Chayes, Michael Jordan, John DeNero, Ani Adhikari, Jordan, Mia Scher", "Nenshad Bardoliwalla, Bardoliwalla, Alex Woodie", "

考虑以下data.frame：

df <- data.frame(ID = 1:3, Name = c("Xiao-Li Meng, Michael Drake, Jennifer Chayes, Chayes, Michael Jordan, John DeNero, Ani Adhikari, Jordan, Mia Scher", "Nenshad Bardoliwalla, Bardoliwalla, Alex Woodie", "Jill McKeon, Jan Nygaard Jensen, Hongyu Zhao, Xinxin (Katie) Zhu, Clive R. Wood") , stringsAsFactors = FALSE)

df回答
使用grepl查找[1]不包含空格且[2]存在于其他名称中的字符串
代码
df$UniqueName <- sapply(df$Name, function(x) {
  sn <- unlist(strsplit(x, split = ", ", fixed = TRUE))
  sn2 <- sn[!(!grepl(" ", sn) & sapply(sn, function(y) sum(grepl(y, sn)) > 1))]
  paste(sn2, collapse = ", ")
})

df$UniqueName我知道您接受了我的答案，但由于您添加了名称Jan Nygaard Jensen
，因此我的答案没有涵盖您的新示例。在这种情况下，我的代码将不起作用，因为它将在Jan Nygaard
（或Jan Jensen
，或Nygaard Jensen）中作为全名处理，因此从不排除它。如果可以，那么我的代码也可以。如果这不好，那么你可能想进一步澄清一下开场白。没关系。我正在寻找一个解决方案，它将与任何一个名字/姓氏重复工作删除。
df$UniqueName <- sapply(df$Name, function(x) {
  sn <- unlist(strsplit(x, split = ", ", fixed = TRUE))
  sn2 <- sn[!(!grepl(" ", sn) & sapply(sn, function(y) sum(grepl(y, sn)) > 1))]
  paste(sn2, collapse = ", ")
})




[dataframe]相关文章推荐



                                                        
Dataframe 从多个文件到带有列的Dask数据帧的Dask包
dataframedask 
Dataframe 如何在数据帧中跨组使用线性回归？
dataframepyspark 
Dataframe 在Julia中加入数据帧
dataframejoinjulia 
Dataframe 为什么lm为每个自变量生成NA？
dataframe 
Dataframe 在pyspark中的数据帧上应用udf后出错
dataframeerror-handlingpyspark 
Dataframe 数据帧的拆分列
dataframe 
如何从dataframe列动态创建临时表？
dataframeapache-sparkhive 
Dataframe Spark Scala，使用SaveMode.Append写入数据，同时覆盖某些现有分区
dataframeapache-sparkhive 
Dataframe 为什么Spark对数据帧使用有序模式？
dataframeapache-sparkpyspark 
Dataframe 如何避免在pyspark出现任何故障时将相同的数据重新加载到hdfs中
dataframepysparkhive 
Dataframe 如何使for循环中的数组在Julia中全局可用？
dataframefor-loopjulia 
Dataframe 将元组值更改为数据帧
dataframe 
Dataframe 是否有一种惯用的方式来缓存Spark数据帧？
dataframeapache-sparkpyspark 
                                       





随机文章推荐



                                                        
Fullcalendar 浏览器如何记住所选的周、月、日视图
fullcalendar 
Fullcalendar 使用'；在IE中显示事件时出现完整日历故障；事件（作为功能）和#x27；使用xml
fullcalendar 
Fullcalendar 在鼠标上方突出显示跨越周末的活动
fullcalendar 
Fullcalendar 十、 在EventClick回调中单击鼠标的Y
fullcalendar 
Fullcalendar 完整日历比较时间
fullcalendar 
在fullcalendar中禁用某些事件源的冲突
fullcalendar 
FullCalendar将周视图更改为垂直列表，而不是水平表列
fullcalendar 
FullCalendar cakephp：在日历上显示关联模型中的数据
fullcalendar 
带有专用google日历事件的FullCalendar
fullcalendargoogle-calendar-api 
Fullcalendar 在周视图中仅显示特定的时间范围
fullcalendar 
如何将任何样式应用于FullCalendar单元格
fullcalendar 
Fullcalendar 完整日历集资源营业时间颜色资源
fullcalendar


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R中列表数据类型下每个变量的描述性统计
									R
							 
R 删除矩阵中不在其他矩阵中的所有行
									R
							 									Matrix
							 
R 如何更改ggplot2中的镶嵌面标签？
									R
							 
R 如何识别全局矩阵的lat和long？
									R
							 									Matrix
							 
R 图中轴的步进宽度
									R
							 									Plot
							 
在R中绘制具有多列的线图
									R
							 									Plot
							 
R 如何创建复杂的循环
									R
							 
R 数字标题行距中的上标
									R
							 									Text
							 
使用grid.arrange（）在同一页面中绘制多个绘图
									R
							 
R 将POSIXct应用于数据帧
									R
							 									Dataframe
							 
使用substr直到满足条件
									R
							 
R 在矩阵中的位置之间减去值
									R
							 
R twitteR包maxID不'；我不喜欢小牛队
									R
							 									Twitter
							 
R分配给列表中的第i个索引，其名称在循环中可变地调用？
									R
							 									List
							 									Variables
							 									Indexing
							 
R 如何从数据帧预测新行？
									R
							 									Dataframe
							 
将R可视化分发给其他用户
									R
							 									Web
							 
R、 计算对象所属组的列表
									R
							 
使用dplyr的enquo通过SparkyR访问Spark表列
									R
							 
线性回归R中的NA系数
									R
							 
迭代加载和筛选表[R][s]
									R
							 									Shiny
							 
R 一次比较所有ksvm内核的性能
									R
							 
R 将时间数据组织为固定的时间间隔
									R
							 
R ggplot2的线条图例显示为“划线”
									R
							 									Graph
							 									Charts
							 
R 如何忽略NA'；在通过两列连接两个数据帧时？
									R
							 									Dataframe
							 
在具有不同值的列中运行R中的总计
									R
							 
将R数据帧转换为h2o对象-错误：提供的列类型未知
									R
							 									Dataframe
							 
尝试在r中使用lm（）表示年份
									R
							 
将数据帧转换为R中的因子
									R
							 									Dataframe
							 
R 列出tbl_堆栈标题中的总N
									R
							 
R 如何在x轴上创建包含平均值和比例变量（1-5）的堆叠条形图？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Windows Services
Internet Explorer 8
Express
Oop
Quickbooks
Django Rest Framework
Directx
Z3
Concurrency
Resharper
Plone
System Verilog
Post
Sql Server
Scikit Learn
Asp.net Web Api
Eclipse
Mfc
Sorting
Safari
Responsive Design
F#
Centos
Julia
Uiview
Racket
Zend Framework
Llvm
Sap
Eclipse Rcp
Liferay
Content Management System
Localization
Elm
Plugins
Twitter Bootstrap
Maps
Jhipster
Canvas
Xcode
Azure Service Fabric
Video Streaming
Jsf 2
Vector
Matplotlib
Search
Drupal 6
Jasper Reports
Filesystems
Mariadb
Osgi
Mapbox
Listview
Redux
Xna
Fluent Nhibernate
Groovy
Webview
Image
Shell
Linker
Google Maps
Php
Mongodb
Iframe
Highcharts
Hbase
Meteor
Openssl
Lua
Jsf
Joomla
Tkinter
Tinymce
Cygwin
Bazel
Influxdb
Mysql
Merge
Ruby On Rails 3
Colors
Linq To Sql
Excel Formula
Xpages
Sip
Couchbase
Bootstrap 4
Windows Installer
Entity Framework
Google Visualization
Ionic Framework
Swagger
C++11
Ecmascript 6
Printing
Leaflet
For Loop
Parameters
Automation
Menu
Umbraco
Axapta
Visual Studio 2010
Logstash
Django
Virtual Machine
Combobox
Rabbitmq
Ios5
Knockout.js
Clearcase
Microsoft Graph Api
React Native
Akka
Windows Phone
Windows Phone 8.1
Openlayers 3
Apache2
Xaml
Autocomplete
Electron
Doctrine Orm
Node.js
Powerbi
Aws Lambda
Struct
Webgl
Datetime
Tfs
Workflow
Xsd
Erlang
Powershell
Mobile
Google Chrome
Less
Migration
Github
Paypal
Cassandra
Kibana
Neo4j
Openerp
Chef Infra
Exchange Server
Pine Script
Postgresql
Intellij Idea
Ftp
Cloud Foundry
Login
Facebook
Hyperlink
Cocos2d X
Orchardcms
Flutter
Charts
Zurb Foundation
Stripe Payments
Jquery
Video
Stata
EmptyTag
Network Programming
Amazon Cloudformation
Prolog
Wix
Function
Phantomjs
Notifications
Regex
Windbg
Nsis
Stm32
Antlr4
Heroku
Ios6
Db2
Boost
Chart.js
Applescript
Xamarin
Unix
Nlp
Plsql
Azure Data Factory
Perforce
Graph
Cypress
Spring Security
Jetty
Dask
Interface
C++ Cli
Iphone
Model View Controller
Asp.net Mvc 5
Pentaho
Filter
Sql Server 2012
Gulp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网