R 从字符串中删除相邻的重复项_R_String_Duplicates - Fatal编程技术网

R 从字符串中删除相邻的重复项

r string

R 从字符串中删除相邻的重复项,r,string,duplicates,R,String,Duplicates,我在分析歌词。这些通常包含“拉拉”和“哦哦哦”。基本上没有意义的词。我想删除这些重复的单词，或者至少首先识别它们。下面是一些几乎可以完成这项工作的代码 test <- data.frame(c("la la la yeah the meaning of life vive la France yeah yeah yeah")) names(test) <- "V1" test$V1 <- as.character(test$V1) d <- unlist(strspl

我在分析歌词。这些通常包含“拉拉”和“哦哦哦”。基本上没有意义的词。我想删除这些重复的单词，或者至少首先识别它们。下面是一些几乎可以完成这项工作的代码

test <- data.frame(c("la la la yeah the meaning of life vive la France yeah yeah yeah"))
names(test) <- "V1"
test$V1 <- as.character(test$V1)

d <- unlist(strsplit(test$V1, split=" "))
test$V2 <- paste(d[-which(duplicated(d))], collapse = ' ')
test$V2

test我们可以在这里尝试使用gsub
和肯定的先行断言，该断言检查相邻的重复单词：
input <- "la la la yeah the meaning of life vive la France yeah yeah yeah"
output <- gsub("(\\S+)( \\1)+", "", input, perl=TRUE)
output <- gsub("^\\s+|\\s+$", "", output)
output

[1] "yeah the meaning of life vive la France"

input也许您需要rle
来识别顺序并只选择长度为1的单词
sapply(strsplit(test$V1, split=" "), function(x) {
   paste(with(rle(x), values[lengths == 1]), collapse = " ")
})
#[1] "yeah the meaning of life vive la France"

@RonakShah谢谢…当我回答时，我读到的只是标题，它指的是相邻的副本。OP没有清楚显示预期的输出。谢谢，我不知道rle功能。它确实做得很好。谢谢谢谢，老实说，我从来没有见过复选标记选项。我真没注意到：-（我也会在我的答案上标出前面的回答。谢谢




[string]相关文章推荐



                                                        
String 查询以计算SQLite 3中的单词数
stringsqlite 
String agh-mod#U rewrite remove'-xxx xxx'；从URL
stringmod-rewrite 
String 基于Spring 3.0注释的自动布线
stringspring 
String pos函数的R-等价
stringrfunction 
String 将字符串集划分为大小大致相同的最小互斥组集的算法
stringalgorithm 
如何将StringBuffer转换为ASCII码并转换回整数
string 
String 需要重定向以删除项目ID字符串
string.htaccessredirect 
String 如何使用os.execute（输入文本…）输入网站
stringlua 
String 批比较路径名%1
stringbatch-filepath 
String 获取perl字符串计算结果
stringperl 
String 将TSearchrec字符串添加到备忘录
stringdelphi 
String 将\t（制表符）分隔的字符放入新的列向量中
stringmatlabvectortabs 
String 具有命名值的字符串格式
stringscala 
String 如何在记事本++；
stringnotepad++ 
String 量角器比较字符串数
stringjasmineprotractor 
String 为什么使用Golang设置的文件权限与预期不同？
stringfilegopermissions 
String 使用VLOOKUP中字符串函数的结果匹配数字
stringexcelexcel-formula 
String JDBC在表中插入字符串、日期和持续时间值
stringdatejdbc 
String 在Powershell中分析字符串并创建表
stringpowershellparsing 
String 搜索字符串并删除所有内容，然后使用Powershell粘贴到新文件
stringpowershell 
                                       





随机文章推荐



                                                        
ckeditor-onpaste事件
ckeditor 
Ckeditor 截获编辑击键
ckeditor 
Ckeditor 选项卡元素上方的编辑器对话框输入字段
ckeditor 
Ckeditor 我的编辑器没有加载工具栏
ckeditor 
Ckeditor 如何禁用所见即所得编辑器v1.1.1上下文菜单
ckeditor 
CKEditor：使用工具栏按钮控制Entermode
ckeditor 
Ckeditor 最大化屏幕编辑器
ckeditor 
CkEditor模板更改将不会生效
ckeditor 
如何在CKEditor中配置样式？
ckeditor 
在XPages下自定义CKEditor（正确的方式）
ckeditorxpages 
attachedListener函数（）中的getAttribute（）返回“null”（CKEditor 4.4.8）
ckeditor 
带嵌入对象的ckeditor全WYSWYG
ckeditor 
Ckeditor 适合父区域
ckeditor 
CkEditor将光标设置在插入的Html后面
ckeditor 
第二次之后无法在CKeditor中显示内容
ckeditor 
CKEditor：如何修复执行失败的&x27；后消息'；在'；窗口'；：无法克隆对象？
ckeditor 
Ckeditor 键入3编辑程序–；配置不工作
ckeditortypo3yaml 
CKEditor 4：打开/显示自动小部件对话框
ckeditor


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 使用相同的x轴在xyplot下方打印条形图？
									R
							 									Plot
							 
如何在R的数据框中按日期获得每8天的值之和
									R
							 
geom#u ribbon不'；t work-eval（expr、envir、enclose）中的错误：object'；变量'；找不到
									R
							 									Plot
							 
如何控制RMarkdown/knitr加载的默认包以避免选项冲突
									R
							 
Rcurl:url.exists在url确实存在时返回false
									R
							 
我可否加上一句；“转到顶部”；按钮到以R标记呈现的HTML文档？
									R
							 
R-tidyr-spread（）-将NA作为列名处理
									R
							 
R 为什么这些数字不相等？
									R
							 									Floating Point
							 
R 使用分组和时间线构建条形堆叠图
									R
							 
R nls自启动功能的范围
									R
							 
R-Predict（）、重命名列和；有10行，但发现的变量有20行；
									R
							 
iGraph，R-来自二部群的子关联矩阵（不计算整个关联矩阵）
									R
							 									Matrix
							 
R testthat：期望错误和变量值同时出现吗？
									R
							 									Testing
							 
如何在R中重新划分有序logistic回归模型中的因子？
									R
							 									Statistics
							 
R 如何同时提取列表中的不同元素
									R
							 
在r中使用时，请卸下前导支架
									R
							 									Printing
							 
R从Renderi checkboxGroupInput聚合数据
									R
							 									Shiny
							 
如何将参数列表传递给R中的方法？
									R
							 									Methods
							 
带有RcppArmadillo和c+的包装+；11不要导出函数
									R
							 									C++11
							 
将r中的方差分析与结果分开
									R
							 
R 如何以双射方式对称[0,1]^d中的数据集
									R
							 
R 将多个向量合并到数据帧
									R
							 									Dataframe
							 									Merge
							 
将两个AddLayerControl添加到一个地图（使标记位于多个组中）
									R
							 									Leaflet
							 
R 使用聚合函数时包括组大小
									R
							 
以r表示的日期和小时的数值
									R
							 
提取R中向量中的最后序列数
									R
							 
R：将逻辑添加到sapply
									R
							 
R 如何将120/80转换为两列（120和80）？
									R
							 
R 基于方程的绘图
									R
							 
R 求解一个简单的（？）非线性方程组
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Teradata
Java 8
Multithreading
Umbraco
Language Agnostic
Plugins
Mule
Dynamic
Validation
Xamarin
Ip
Entity Framework Core
Active Directory
Angular6
Nunit
Asp.net Mvc 4
Gitlab
Google Maps
Unity3d
Webrtc
Content Management System
Cordova
Matlab
Jira
Telerik
Deep Learning
Geometry
Android Studio
Perforce
Report
Localization
Internet Explorer
Webstorm
Certificate
Meteor
Gruntjs
Scrapy
Solr
Kentico
Erlang
Adobe
Cmake
Pip
Cakephp
Artifactory
Gradle
C#
Keras
Neo4j
Twitter Bootstrap
Vaadin
Sql Server 2008
Artificial Intelligence
Matplotlib
Security
Sequelize.js
Serial Port
Version Control
Aem
Google Cloud Dataflow
Aws Lambda
Winapi
Jsp
Tags
Generics
Webpack
Visual Studio
Puppet
Hyperledger Fabric
Nsis
Extjs
Cygwin
Drools
Wicket
Delphi
Nestjs
Charts
Xmpp
Clojure
Loopbackjs
Http
Sublimetext3
Domain Driven Design
Eclipse Plugin
Mono
Jdbc
.net
Spring
Geolocation
Passwords
Parse Platform
Design Patterns
Smalltalk
Oracle11g
Makefile
Google Visualization
Socket.io
C++
Forms
Single Sign On
Swing
Binding
Flask
Computer Vision
Postman
Join
Servlets
Junit
Encryption
Lisp
Electron
Netty
Titanium
Flash
Ubuntu
Xcode
Uml
Firebase
Cron
Deployment
Ms Word
Jwt
Installation
Stored Procedures
Ldap
Ember.js
Codeigniter
Mongoose
Graphviz
User Interface
Openshift
Selenium
Javafx
Data Binding
Openerp
Usb
Nginx
Struct
Twilio
Neural Network
Windows Mobile
Plsql
Uitableview
Wix
Uiview
Docker
Gatsby
Twig
Blackberry
Autodesk Forge
Powerbi
Playframework 2.0
Ftp
Testing
Qt
Calendar
Path
Spring Boot
Architecture
Weblogic
Appium
Bots
Ffmpeg
Perl
Heroku
R
Gnuplot
Svg
Sbt
Object
Knockout.js
Ignite
React Native
Objective C
Apache Zookeeper
Sonarqube
Google App Engine
Express
Powershell
Sip
Ios6
Latex
Autocomplete
Apache Spark
Vue.js
Glassfish
Phpstorm
Linux Kernel
Identityserver4
Jestjs
Ocaml
For Loop
Macos
Oauth
Unicode
Nativescript
Vim
Jakarta Ee
Android Fragments
Logging
Google Analytics


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网