Regex 在R中删除标点和数字文本挖掘后如何给出两个单词之间的空间_Regex_R_Gsub_Tm - Fatal编程技术网

Regex 在R中删除标点和数字文本挖掘后如何给出两个单词之间的空间

regex r

Regex 在R中删除标点和数字文本挖掘后如何给出两个单词之间的空间,regex,r,gsub,tm,Regex,R,Gsub,Tm,我们可以看到，在下面的示例中，在删除数字3054和标点符号后-在给定字符串中“BG3054 suhas B-DC chr 23.7-22.8.13”输出将合并为bgsuhas，但我需要在这两个单词之间留一个空格作为bg suhas。在下面给定的字符串中，您可以看到相同的内容，如bdc，bbxsh。你能帮我在这些单词之间留出一个空格进行文本挖掘吗我需要这样 bg sub dc chr rashmi作为输出矩阵 Newcol<-c("BG3054-suhas B-DC chr 23.7-22

我们可以看到，在下面的示例中，在删除数字3054和标点符号后-在给定字符串中

“BG3054 suhas B-DC chr 23.7-22.8.13”

输出将合并为

bgsuhas

，但我需要在这两个单词之间留一个空格作为

bg suhas

。在下面给定的字符串中，您可以看到相同的内容，如

bdc，bbxsh

。你能帮我在这些单词之间留出一个空格进行文本挖掘吗

我需要这样

bg sub dc chr rashmi作为输出矩阵
Newcol<-c("BG3054-suhas B-DC chr 23.7-22.8.13","BBXSH0030 Rashmi S 23.4.13to22.5.13")

text.corp <- Corpus(VectorSource(Newcol))   

text.corp <- tm_map(text.corp, tolower)

text.corp <- tm_map(text.corp, stripWhitespace)

text.corp <- tm_map(text.corp, removeNumbers)

text.corp <- tm_map(text.corp, removePunctuation)

text.corp <- tm_map(text.corp, removeWords, c("the", stopwords("english")))

dtm <- DocumentTermMatrix(text.corp)

dtm.mat <- as.matrix(dtm)

dtm.mat

OUTPUT
    Terms
Docs bbxsh bdc bgsuhas chr rashmi
   1     0   1       1   1      0
   2     1   0       0   0      1

Newcol我会使用gsub
将任何非a-z字母替换为空格，作为预处理步骤：
Newcol <- gsub("[^a-zA-Z]+", " ", Newcol)
Newcol
# [1] "BG suhas B DC chr " "BBXSH Rashmi S to "

Newcol定义您自己的内容转换器：
替换标点符号




[r]相关文章推荐



                                                        
R-尝试将.csv文件合并到.shp文件时多边形撕裂
rmerge 
如何逐个访问矩阵的所有列以在R中进行规格化
rmatrix 
如何访问R中矩阵转置后的第一列
r 
如何在R中检索工作日的日期？
r 
Shining-使用highcharts压缩两个不同长度的数据集
rhighcharts 
RNeo4j appendCypher（）错误：“错误：401未经授权”
r 
识别rbind进程中有问题的csv文件-错误消息
r 
R 如果输出有依赖项，mclapply是否等待？
rparallel-processing 
r-rmongodb$或查询构造
r 
长格式数据上的dplyr平均组
r 
R 不要在ggplot中排列x轴
r 
R 光板盒背景
r 
夏令时打断GGR绘图日期时间轴
rdatetime 
根据R中另一个矩阵给出的位置更改一个矩阵中的元素
rfor-loopmatrix 
purrr:：map_int:无法将元素1从双精度强制为整数
r 
R 反应式过滤数据以生成地图
rshiny 
为什么插入到postgresql的NA值没有将类型转换为NULL？
rpostgresql 
R 如何在字符串中的模式之前提取数字
r 
R 如果某个数字包含在某个范围内，则选择此选项
r 
R Kmeans通过和汇总管道在组中创建中心
r 
                                       





随机文章推荐



                                                        
Routes 在MapQuest/OpenStreetMap中请求路线或路线矩阵时更改速度限制？
routes 
Routes 当标头值为时，骆驼路由打开
routesapache-camel 
Routes 如何在Docpad中处理路由
routes 
Routes Adonis JS的Ziggy等价物
routes


                                        

                                        
                                        


                                                
                                                        [regex]相关推荐
                                                        
Regex 如何在Perl中从字符串中提取子字符串？
									Regex
							 									Perl
							 									String
							 
Regex 正则表达式快速特殊选择
									Regex
							 									String
							 
Regex TCL-使用正则表达式获取另一个字符串中由空格分隔的字符串列表
									Regex
							 									Tcl
							 
Regex 计算新线出现的次数？
									Regex
							 									C# 4.0
							 
Regex 正则表达式与行的开头/结尾不匹配
									Regex
							 									Eclipse
							 
Regex Selenium正则表达式：将文本字符串与动态日期匹配
									Regex
							 									Selenium
							 
Regex 使用awk替换正则表达式模式
									Regex
							 									Linux
							 									Awk
							 
Regex 后跟特殊字符的正则表达式空格
									Regex
							 
Regex 无法从带有s的双引号Perl变量中提取值///
									Regex
							 									Perl
							 
Regex 通过htaccess为子页面建立值对url模型
									Regex
							 									Apache
							 									.htaccess
							 									Mod Rewrite
							 									Redirect
							 
Regex 正则表达式中出错，无法从字符串中提取所需字段
									Regex
							 									Python 2.7
							 
Regex 需要从字符串中的模式创建数据帧
									Regex
							 									R
							 
Shell-Sed REGEXP从一个单词到最后一个逗号和行尾的捕获
									Regex
							 									Bash
							 									Shell
							 									Sed
							 
Regex 正则表达式，如何匹配除一个以外的所有URL？
									Regex
							 
Regex 将带有参数的url重定向到主页url
									Regex
							 									Apache
							 									.htaccess
							 									Mod Rewrite
							 									Redirect
							 
Regex 从字符串中提取括号之间的文本
									Regex
							 									Vbscript
							 
Regex 使用简单的模式匹配逐行比较文件
									Regex
							 									Perl
							 
Regex Lookahead/behind查找字符，除非后跟相同的字符
									Regex
							 									Vb.net
							 									Replace
							 
Regex Grep匹配模式文件中的两个或多个模式
									Regex
							 									Grep
							 
Regex 在Python中选择特定的数字
									Regex
							 									Python 2.7
							 
Regex 在正则表达式中查找特定的数字
									Regex
							 
Regex 是否在AWK中编辑保留/填充带空格的浮点字段？
									Regex
							 									Awk
							 
Regex SQL对象的正则表达式
									Regex
							 									Vbscript
							 
Regex 正则表达式以匹配不带'；一个字也没有
									Regex
							 
Regexp checkstyle处理版权标题中的星号
									Regex
							 
使用POSIX BRE/ERE regex将IP地址提取为整字
									Regex
							 									Bash
							 
Regex 如何只提取匹配字符串的一部分？非捕获组
									Regex
							 									Excel
							 									Vba
							 
Regex 如何排除包含连字符的行？Python（3.6）RE
									Regex
							 									Python 3.x
							 
如何让终端在OSX中将Regex识别为文件名？
									Regex
							 									Bash
							 									Macos
							 									Terminal
							 
Regex 如何在perl中解析字符串？
									Regex
							 									String
							 									Perl
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Oracle11g
Windows Phone
Uml
Cocos2d Iphone
Asp Classic
Joomla
Excel Formula
Breeze
Highcharts
Spring Mvc
Qml
Xaml
Hadoop
Sequelize.js
Material Ui
Download
Jakarta Ee
Performance
Regex
Cors
Facebook
Acumatica
Vhdl
Perforce
Stream
Spring Cloud
Configuration
Apache Zookeeper
Amazon Cloudformation
Bootstrap 4
Delphi
Bazel
Amazon S3
Jwt
Visual Studio 2015
Vba
Pine Script
Canvas
Ruby On Rails 3.2
Requirejs
Clearcase
Nest
Symfony1
Ubuntu
Windows
Wicket
Ios
Sbt
Deep Learning
Apache Flex
Algorithm
C++ Cli
Swiftui
Optimization
Sql Server
Formatting
Virtualbox
Latex
Stm32
Jquery Ui
Perl
Ravendb
Asp.net Mvc
Java 8
Google Cloud Dataflow
Coding Style
Webgl
Laravel 5
Openlayers 3
Iphone
Unix
Spotify
Deployment
Artifactory
Gmail
Xna
Sap
Xampp
Ms Office
Atom Editor
Multithreading
Python 2.7
Neural Network
Java
Lambda
Dependencies
Google App Engine
Concurrency
Notepad++
Scrapy
Django Models
Arm
Iis 7
Binding
Ruby On Rails
Flutter
Kernel
Meteor
Gremlin
Netbeans
Apache Flink
Html5 Canvas
Processing
Cloud Foundry
Xquery
Typo3
Object
Robotframework
Silverlight 4.0
File Upload
Opencart
Open Source
Android Fragments
Phpstorm
Google Bigquery
Codenameone
Json
Jestjs
Mapbox
Database
Build
Xpath
Actionscript
Grafana
Cocoa
Azure Devops
Tree
Chef Infra
Gridview
Tinymce
Github
Gwt
Raspberry Pi
Activerecord
Gradle
Binary
Windows Phone 7
Big O
Apache Pig
Ruby On Rails 3
Adobe
Asp.net Core Mvc
Ffmpeg
Oauth
Openstack
Julia
Xsd
Autodesk Forge
Numpy
Django
Laravel
Composer Php
Mqtt
Ethereum
Api
Xamarin
Ssl
Antlr
Vb.net
Search
Unit Testing
Actions On Google
Ajax
Indexing
Entity Framework Core
Flask
Rust
Boost
Plsql
Validation
Xcode4
Webpack
Rspec
Button
Ssh
Soap
Linux Kernel
Usb
Openlayers
EmptyTag
Url Rewriting
Aurelia
Python Sphinx
Jms
Ssrs 2008
Sharepoint 2013
Wcf
Swing
Mpi
Process
Replace
Sass
Docker
Go
Xpages
Ios8
Hybris
Objective C
Ocaml
Aws Lambda
Pyspark


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网