如何提取R中的多字？_R_Text_Stringr - Fatal编程技术网

如何提取R中的多字？

r text

如何提取R中的多字？,r,text,stringr,R,Text,Stringr,我想在给定的文本中提取位于年和以下逗号之间的某些单词年份可能有也可能没有开始和结束括号。请注意，1998年没有开始和结束括号，而2020年和2015年没有开始和结束括号 library(stringr) txt <- "Mining exercise (2020) Mining, p. 628; Computer Science text 1998 Computer Science, p.345-355; Data mining (2015) J. Data Science, pp. 31

我想在给定的文本中提取位于年和以下逗号之间的某些单词年份可能有也可能没有开始和结束括号。请注意，1998年没有开始和结束括号，而2020年和2015年没有开始和结束括号

library(stringr)
txt <- "Mining exercise (2020) Mining, p. 628; Computer Science text 1998 Computer Science, p.345-355; Data mining (2015) J. Data Science, pp. 31-33"
comp <- c("Mining", "Computer Science", "J. Data Science")
pattern <- str_c(comp,collapse ="|")

但答案应该是：

# "Mining"  "Computer Science"  "J. Data Science"

考虑到

周围没有的开始括号和结束括号。有什么帮助吗？

这里有一个选项，删除4位数年份周围的括号，然后使用OP模式，而不使用

（）

库（stringr）
str_extract_all（str_replace_all（txt），“\\（（\\d{4}）\\）”，“\\1”），
str_c（“（？Tryunlist（str_-extract_-all）（txt，str_c（”）？
# "Mining"  "Computer Science"  "J. Data Science" 

library(stringr)
str_extract_all(str_replace_all(txt, "\\((\\d{4})\\)", "\\1"),
     str_c("(?<=\\d{4}\\s)(", pattern, ")(?=,)"))[[1]]
#[1] "Mining"           "Computer Science" "J. Data Science" 

str_extract_all(txt, str_c("(?<=\\(?\\d{4}\\)?\\s)(", pattern, ")(?=,)"))[[1]]
#[1] "Mining"           "Computer Science" "J. Data Science"




[text]相关文章推荐



                                                        
Text 编解码
textcompression 
Text 以编程方式创建演示文稿时，如何在幻灯片之间分割一大块文本？
text 
Text 对LSA的质疑
text 
将剪切/复制/粘贴覆盖到wx.TextCtrl
textwxpython 
Text 存储数据的有效方法
text 
Text Andengine-文本对象dosn'；在updateHandler中不可见
text 
Text 文本是透明的，不是全色的
text 
Text 不同字体大小的基线相同
textimagemagick 
Text 如何从MS Word中提取同义词库文件？
textms-word 
Text FFMpeg绘图文本宽度？
textffmpeg 
Text 字体系列Roboto浅色和粗体
textfontsreact-native 
Text 最小比例的SwiftUI大字体未在中心对齐
textfontsswiftui 
Text 如何将文本文件转换为UCS-2 LE，无论默认值是什么？
textencoding 
Text 如何在fabric js中删除组对象之外的文本？
text 
Text 从以X字体呈现的文本中获取像素
textfontsgraphics 
                                       





随机文章推荐



                                                        
Soap 搜索API，查找RSS源？
soapservice 
在php中连接soap服务器时出错
soapphp 
Soap WSDL找不到的分派方法
soap 
Soap SpringWS的Maven项目，用于创建服务器WAR/EAR和客户端JAR的JAXB/XSD，还可以从XSD自动生成类
soapmavenjaxb 
javax.xml.ws.soap.SOAPFaultException:无法发送消息-在JaxWsClientProxy.invoke处-由URL的HTTP响应代码401引起
soap 
Axis2 WebService客户端：给定的SOAPAction与操作不匹配
soap 
是否有一种简单或轻量级的方法来测试信封Id是否有效（使用Soap API）？
soapdocusignapi 
SOAP响应MTOM附件可以'；无法解密（AES算法）
soap 
Soap 如何添加Web参考Visual Studio 2012
soapvisual-studio-2012 
Soap Groovy wslite库对http连接池的支持
soapgroovy 
使用SoapUI-和#x27测试Dynamics CRM 2011内部部署；脚本已禁用'；响应
soapdynamics-crm-2011 
如何使用Jmeter for SOAP上载附加文件
soapfile-uploadjmeter 
Spring安全恢复通道SAML SOAP身份验证
soapspring-security 
WSO2“；前缀为；soapenv"；对于“元素”；soapenv：信封“；不受约束。”；
soapwso2 
用soap-api进行改造
soap 
连接到soap wsdl服务
soap 
在VB6中为SOAP WSDL调用启用TLS 1.2
soapvb6 
Soap 删除<；时间戳>；来自WSO2策略创建的ws-security头的标记
soapwso2 
Soap 在测试用例中将故障从DUT提升到Onvif设备测试工具时出错
soap 
Soap Sabre Web服务GetReservationRQ酒店产品返回不正确的“值”；isPast"；要素
soap


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
使用roxygen2包的Package.Rd文件
									R
							 
在R中组合列表元素
									R
							 									List
							 
R 我们可以使用或选择查询在data.table中进行二进制搜索吗
									R
							 
R 用几何误差条定位减淡
									R
							 
R 使用不同的索引从向量添加元素
									R
							 
R 循环遍历数据帧列表并返回不包含重复项的列的名称？
									R
							 									Dataframe
							 
将多个R摘要写入单个excel文件
									R
							 
R 如何将NA从因子向量转换为0的值
									R
							 
在R中查找公共行
									R
							 									Dataframe
							 
R 将只出现一次的值分组到其他字段中
									R
							 
建筑a"；“按颜色划分的频率”；R中矩阵的网格
									R
							 									Matrix
							 
R 在数据库中存储数据
									R
							 									Shiny
							 
R 基于共同贡献创建加权网络
									R
							 
如何在频率矩阵中拆分r文本？
									R
							 
R按每列值拆分矩阵
									R
							 									Matrix
							 									Dataframe
							 
在R中排列文本行
									R
							 									Text
							 
R 功能已创建ggplot到ggplot对象
									R
							 
R 使用分类变量多次重复行数据
									R
							 									Dataframe
							 
R检查一行字符串，如果相等，则分配相等的ID，耗时更少
									R
							 									Performance
							 									Time
							 									Dataframe
							 
R 文本层在ggplot中工作，但使用ggplotly删除
									R
							 
将R中的多多边形SF对象从XY坐标转换为lat/lon
									R
							 
sparkR不支持1.6.1版之后的RDD相关API？
									R
							 									Apache Spark
							 
R写入xlsx文件，转换数字输出中的空白单元格
									R
							 									Excel
							 									Dataframe
							 
R 在箱线图中突出显示特定基因
									R
							 
在列中搜索要在r中合并的字符串
									R
							 									Search
							 									Merge
							 
R 创建作为其他列向量的新列
									R
							 
R 提取范围内变量的最大值
									R
							 									Dataframe
							 
R 删除字符串序列中重复的字符串，只保留上次出现的字符串
									R
							 									String
							 
R 如何在tbl_回归中操作行名称？
									R
							 
quantreg包中的predict.rq？
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Cluster Computing
Signalr
Ansible
Silverstripe
Julia
Raspberry Pi
Algorithm
Ios7
Moodle
Jekyll
Cocos2d X
Gtk
Xsd
Asp.net Mvc 3
Frameworks
Yocto
Vb6
Macros
Vuejs2
Windows Installer
Ajax
Gruntjs
Ocaml
Syntax
Sas
Smalltalk
Rest
Google Cloud Dataflow
Scala
Rabbitmq
Mod Rewrite
Asp.net Mvc
Log4net
Alfresco
Dialogflow Es
Hazelcast
Imagemagick
Tcl
Dynamics Crm 2011
Rdf
Webview
Less
Excel
Antlr4
Office Js
Ravendb
Xquery
Permissions
Stata
Opencart
Browser
Robotframework
Streaming
Google Colaboratory
Titanium
Html
Graphviz
Charts
View
Osgi
Ruby On Rails 3
Kubernetes
Exception Handling
Camera
Animation
Autohotkey
Automation
Shiny
Java
Activemq
Gridview
Io
Leaflet
Actionscript 3
Memory Management
Directx
Instagram
Sails.js
Character Encoding
Html5 Canvas
Gwt
Boost
Mobile
Tomcat
Groovy
Pandas
Installation
Primefaces
Sublimetext2
Web Crawler
Triggers
Jboss
Wicket
Graphics
Go
Blockchain
Merge
Plone
Processing
Ssl
Process
Coding Style
Mapreduce
Url Rewriting
Doctrine Orm
Weblogic
Ruby On Rails 3.1
Drools
Angular6
Matrix
Jquery Mobile
Binary
Kentico
Asp.net
Cmd
Hive
Web Services
Google Visualization
3d
Oop
Telegram
Webpack
Sencha Touch
Modelica
Servlets
Sql Server
Stream
Coq
Oracle11g
Jaxb
Model View Controller
Vector
Openstack
Artifactory
Php
Programming Languages
Video Streaming
C#
Eclipse
C++11
Windows 8
Mips
Printing
Terraform
Talend
Socket.io
Web Applications
Assembly
Dynamics Crm
Jira
Geolocation
Coldfusion
Certificate
Sqlalchemy
Sequelize.js
Aws Lambda
Virtual Machine
.net
Curl
Ms Word
Google Maps Api 3
Batch File
Openssl
Typescript
Json
Text
Jsf
Autocomplete
Cocoa
Android
Tags
.net 4.0
Entity Framework
For Loop
Odoo
Azure Data Factory
Xampp
Opencv
Material Ui
Netsuite
Grep
Button
Xamarin.android
Spring Mvc
Openerp
Haskell
Lisp
Xna
Netty
Ag Grid
Service
Adobe
Web
Proxy
Path
Mvvm
Login
Tridion
Functional Programming
Cobol
Responsive Design


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网