删除R中每个字符串上的重复值_R_Duplicates - Fatal编程技术网

删除R中每个字符串上的重复值

r

删除R中每个字符串上的重复值,r,duplicates,R,Duplicates,我有一个包含两列的数据框： VAR1. VAR2. A. 102 million; 102 million B. 0.1 million; 2 million; 0.1 million; 2 million 我想删除VAR2的重复值。对于每行，获取 VAR1. VAR2. A. 102 million B. 0.1 million; 2 mill

我有一个包含两列的数据框：

 VAR1.                     VAR2.

  A.              102 million; 102 million

  B.      0.1 million; 2 million; 0.1 million; 2 million

我想删除VAR2的重复值。对于每行，获取

 VAR1.           VAR2.

  A.          102 million

  B.     0.1 million; 2 million

我该怎么办

谢谢您的建议。

这里有一个使用

sub

的解决方案，似乎很有效：

x <- "0.1 million; 2 million; 0.1 million; 2 million"
gsub("\\b(\\d+(?:\\.\\d+)?) ([^;]+); (?=.*\\b\\1 \\2\\b)", "", x, perl=TRUE)

[1] "0.1 million; 2 million"

x使用基数R，我们可以拆分“；”
上的字符串和粘贴唯一项，用于VAR2

sapply(strsplit(df$VAR2, ";"), function(x) paste(unique(x), collapse = ";"))
#[1] "102 million"           "0.1 million;2 million"


使用dplyr
和tidyr
我们可以使用separate_行
将VAR2
放入不同的行中，然后paste
仅每个组的唯一
条目
library(dplyr)
library(tidyr)

df %>%
 separate_rows(VAR2, sep = ";") %>%
 group_by(VAR1) %>%
 summarise(VAR2 = paste(unique(VAR2), collapse = ";"))

#  VAR1  VAR2                 
#  <fct> <chr>                
#1 A     102 million          
#2 B     0.1 million;2 million

库（dplyr）
图书馆（tidyr）
df%>%
单独的_行（VAR2，sep=“；”）%>%
分组依据（VAR1）%>%
摘要（VAR2=粘贴（唯一（VAR2），collapse=“；”））
#VAR1 VAR2
#                   
#1.02亿美元
#20亿美元；200万




[cloud foundry]相关文章推荐



                                                        
Cloud foundry CF推送失败，表示“路由无效”
cloud-foundry 
Cloud foundry cloud foundry应用程序正在运行的实例数
cloud-foundry 
Cloud foundry s4sdk、Neo或Cloud Foundry
cloud-foundry 
Cloud foundry 在CloudFoundry上运行的应用程序的监控环境
cloud-foundry 
Cloud foundry 如何设置Pivotal Cloud Foundry配置服务器以使用my git repo的多个搜索路径？
cloud-foundry 
Cloud foundry pivotal cloud foundry是否支持windows 7 32位？
cloud-foundry 
                                       





随机文章推荐



                                                        
Tinymce 使用微型mce页面时，永远需要加载
tinymce 
TinyMCE不在Mac OS Lion上工作
tinymce 
tinyMCE-tinyMCE rails-资产预编译问题
tinymce 
Tinymce 为什么字体大小，字体系列，颜色都不起作用？
tinymce 
如何在tinymce文本区域中使用占位符
tinymce 
tinymce是否自动添加p标记？
tinymce 
Tinymce 文本区域调整句柄图像源
tinymce 
TinyMCE文本编辑器RTL方向工具栏列表框按钮方向错误
tinymce 
tinyMCE.execCommand中的用户界面参数做什么？
tinymce 
在TinyMCE 5中创建插件
tinymce


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
包装'；Rbbg&x27；不可用（适用于R版本2.15.2）
									R
							 
在r中，与%in%相对的是什么
									R
							 
R 创建不同长度的分类变量汇总表
									R
							 
R Markdown：我的代码在控制台上运行，但在我尝试编写HTML时不会运行
									R
							 
在命令行中运行Rscript并加载包
									R
							 									Command Line
							 
是否可以在R中的一个命令中将单个图形导出到多个文件夹。
									R
							 									Graph
							 
无法在R版本3.2.3中完全安装软件包（“插入符号”）
									R
							 
geom_raster（）不带填充和图例
									R
							 
在plyr或dplyr中调试-查看哪个组
									R
							 									Debugging
							 
R 如何删除包含NA的部分列
									R
							 
R &引用；“字符中未识别的转义”；调用系统（）时
									R
							 
R中的四舍五入返回错误值
									R
							 
R中特殊乳胶字符的转义
									R
							 
读取或导出R中的.yaml文件
									R
							 									Yaml
							 
在R中合并数据
									R
							 									Merge
							 
R 为添加到excel单元格的注释创建新列
									R
							 
R 将函数输入分配给全局环境中的值
									R
							 
R 在脚本中运行但不在函数中运行的代码
									R
							 
使用download.file从R中的URL下载zip文件
									R
							 									Curl
							 
R 以绘图方式显示在图表下方的线（使用布局-形状）
									R
							 									Charts
							 
R RefClass使用包含使用停止条件初始化/避免调用初始化的字段
									R
							 									Oop
							 
读取csv文件后，如何在R中将因子类型转换为数字类型？
									R
							 
R 代码性能：应用族或优化的备选方案
									R
							 									Performance
							 
R 使用带lappy的嵌套函数
									R
							 									Function
							 									Functional Programming
							 
&引用；Sapply“；函数，用于将代码从R转换为MATLAB
									R
							 									Matlab
							 									Machine Learning
							 
如何在R中选择线性回归的数值列
									R
							 
R 通过保留前6个字符重命名多个文件
									R
							 									File
							 
使用read.csv或fread时存在持久字符串
									R
							 
与r中的条件合并
									R
							 									Dataframe
							 
分组数据的卡方检验（r中缺失值的特定组除外）
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Generics
Frameworks
Netsuite
Sed
Concurrency
Aem
Twilio
Bootstrap 4
Azure Active Directory
Eclipse Plugin
Scripting
Apache Kafka
Doxygen
Amazon Ec2
Angular Material
Charts
Codenameone
Gwt
Websocket
Programming Languages
Mapreduce
Cakephp
Spring Integration
Domain Driven Design
Chef Infra
Memory Management
Elm
Serialization
Ecmascript 6
Indexing
Youtube Api
Clojure
Azure Functions
Visual Studio 2010
Configuration
Codeigniter
Aframe
Deployment
Html
Qt4
Symfony1
Playframework
Ios6
Yii2
Ide
Javafx
Wpf
Networking
Chart.js
C++11
Eclipse Rcp
Vb.net
Nestjs
Push Notification
Odoo
Phpunit
Powershell
Uml
Sqlalchemy
Ethereum
Binding
Vagrant
Adobe
Wolfram Mathematica
Syntax
Requirejs
Sugarcrm
Google Chrome
Windows Phone 8.1
Synchronization
Docker Compose
Kernel
Glsl
Sql
Open Source
Python 2.7
Web Crawler
Nsis
Assembly
Android Studio
Flutter
Time
Ruby On Rails 3.1
Ssh
Twitter Bootstrap 3
Coq
Dotnetnuke
Database
Pyspark
Ibm Midrange
Coding Style
Google Cloud Platform
Visual Studio 2015
Shopify
Image Processing
Zurb Foundation
Compilation
Spring Security
Orm
Migration
Java Me
Input
Gtk
Camera
Url Rewriting
Zsh
Postgresql
Ssl
Azure Sql Database
Image
Android Emulator
Download
Linkedin
Ruby
Firebase
Sonarqube
Cmake
Mapping
Kotlin
Security
Xml
Uitableview
Sharepoint 2007
Sequelize.js
Tridion
Android Layout
Excel Formula
Pycharm
Hyperledger Fabric
Flash
Bazel
Dart
Jasmine
Jpa
Xslt
Salesforce
Windows Runtime
Maven
.net Core
Spring Boot
Dns
Algorithm
Typo3
Asp.net Mvc 5
Vba
Sockets
Listview
Http
Graph
Laravel 5
Variables
Certificate
Amazon Redshift
Drupal 7
Compiler Construction
Python 3.x
Openlayers 3
Process
Leaflet
Mips
Phantomjs
Apache Flink
Doctrine Orm
Gulp
Audio
Path
Java
Sphinx
Sbt
Calendar
Tfs
Vb6
Timer
Grid
Ip
Nginx
Post
Ruby On Rails 3
Awk
Combobox
Sails.js
Reflection
Gruntjs
Sparql
Angular
Vbscript
Razor
Udp
Drupal
Javascript
Join
Jar
Snowflake Cloud Data Platform
Stm32
Crystal Reports
E Commerce
Maps
Gps
Solr
Parsing
Azure


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网