R 使用正则表达式删除特定标记，同时保留内容_R_Regex - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 使用正则表达式删除特定标记，同时保留内容_R_Regex - Fatal编程技术网

R 使用正则表达式删除特定标记，同时保留内容

r regex

R 使用正则表达式删除特定标记，同时保留内容,r,regex,R,Regex,对于包含HTML标记的文本体，我有一个特定的问题，可以通过删除特定标记并保留这些标记的内容来解决（本质上是将文本在层次结构中提升一个级别）例如，我想： <div> <div class="meta">Wednesday, 2 November 2016 at 15:52 UTC</div> <div class="comment">My life this weekend</div> <p></p> </

对于包含HTML标记的文本体，我有一个特定的问题，可以通过删除特定标记并保留这些标记的内容来解决（本质上是将文本在层次结构中提升一个级别）

例如，我想：

<div>
<div class="meta">Wednesday, 2 November 2016 at 15:52 UTC</div>
<div class="comment">My life this weekend</div>
<p></p>
</div>


2016年11月2日星期三15:52 UTC
我这个周末的生活

成为：

<div>
<div class="meta">Wednesday, 2 November 2016 at 15:52 UTC</div>
My life this weekend
<p></p>
</div>


2016年11月2日星期三15:52 UTC
我这个周末的生活

我正在使用

library（XML）

来解析清理后的标记，因此这里不需要使用XML:：xpathsaply（）

我相信解决方案在于某种正则表达式，它匹配一个包含两个标记的模式，并忽略它们之间的文本，直接用“”替换。我相信前瞻性也是必须的，但我对regex还不熟悉，有点挣扎

标记本身是一致的，不包含任意数量的空白

谢谢

texttext是的，我认为这很好地解决了我的问题。谢谢是的，我认为这很好地解决了我的问题。谢谢
text <- "<div>
<div class=\"meta\">Wednesday, 2 November 2016 at 15:52 UTC</div>
<div class=\"comment\">My life this weekend</div>
<p></p>
</div>"

m <- gsub("<div class=\"comment\">(.*?)</div>", "\\1", text, perl = TRUE)
cat(m)

<div>
<div class="meta">Wednesday, 2 November 2016 at 15:52 UTC</div>
My life this weekend
<p></p>
</div>




[regex]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
如何从窗口小部件侧显式访问连接器到Vaadin 7？
vaadin 
在Vaadin中将零部件创建为静态工厂样式（单例）
vaadin 
Vaadin Maven插件尝试将subversion目录编译为主题
vaadin 
Vaadin 如何将Sencha GXT表调整到它包含的Div中
vaadin 
Vaadin 在声明式UI中使用字体图标
vaadin 
在J2EE容器外部使用Vaadin
vaadin 
Vaadin MenuItem：选中时不关闭
vaadin 
如何在Vaadin中向布局添加链接、弹出窗口等？
vaadin 
Vaadin 这个代码有什么问题？它正在抛出空错误
vaadin 
Vaadin 8 TreeGrid-是否可以对叶/子元素进行多重选择，并且父元素不可选择？
vaadin 
vaadin标签上漂亮的html格式字符串
vaadin


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Ipad
Vb6
Tomcat
Automated Tests
Proxy
Pine Script
Fullcalendar
Wso2
Post
Scikit Learn
Smtp
Cobol
Apache Pig
Wicket
Laravel 5
D
Arangodb
Interface
Autodesk Forge
Tfs
Delphi
Nhibernate
Google Analytics
Bootstrap 4
Image
Qt
Amazon Ec2
Haskell
Rss
Sequelize.js
Gis
Cygwin
Sdk
Arrays
Sparql
Cmd
Join
Flash
Events
Php
C# 3.0
Ubuntu
Cors
Visual Studio 2017
Azure Service Fabric
Odoo
Office365
Joomla
Geometry
Sql Server 2005
Java
Language Agnostic
Excel
Graph
Codeigniter
Azure Data Factory
Jmeter
Asp.net Mvc
Breeze
Botframework
Activerecord
Unicode
Docusignapi
Ios7
Openshift
Loops
Parsing
Memory Management
Ajax
Keycloak
Date
Firefox Addon
Identityserver4
Cucumber
Search
Internet Explorer
Android Layout
Typescript
Collections
Authentication
Protractor
Youtube
Jasper Reports
Google Bigquery
Eclipse Plugin
Jsp
Jqgrid
Sed
Kernel
Linker
Hbase
Couchbase
Openerp
Hash
Pip
Llvm
Python 2.7
Azure Sql Database
Exception Handling
Markdown
Socket.io
Awk
Lotus Notes
Apache Spark
Recursion
Opencv
Amazon Cloudformation
Terminal
Model View Controller
Autocomplete
Vbscript
Optimization
Ffmpeg
Logging
Mdx
Routing
Julia
Xcode
Jestjs
Web Services
Svn
Sublimetext3
Memory
Material Ui
Web
Teamcity
Yii2
Qml
Pointers
Elm
Cordova
Xsd
Sharepoint 2013
Android Fragments
Mercurial
Junit
Migration
Snowflake Cloud Data Platform
Vim
Google Cloud Storage
Terraform
Phpstorm
Android Ndk
Exception
Android Studio
Blazor
Django Models
Virtualbox
Liferay
Axapta
Ruby On Rails 3.2
Google Plus
Azure Ad B2c
Db2
Python
Reporting Services
Xmpp
Opengl
Bison
Node.js
EmptyTag
Menu
Ember.js
Google Compute Engine
Cluster Computing
Emacs
Ios
Kendo Ui
Algorithm
Shiny
Configuration
Vmware
Testing
Facebook
Intellij Idea
Plone
Gps
Twig
Javafx 2
Validation
Mongoose
Nuget
Dynamics Crm 2011
Azure Functions
Url
Yii
Webstorm
Permissions
Sharepoint 2007
Asterisk
Openid
Scheme
Synchronization
Asp.net Mvc 3
Enums
Air
Ibm Mq
Monitoring
Sugarcrm
Antlr4
Isabelle


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网