Regex（或替代方法）删除HTML文档中特定标记的内容_Html_Regex_Html Parsing - Fatal编程技术网

Regex（或替代方法）删除HTML文档中特定标记的内容

html regex

Regex（或替代方法）删除HTML文档中特定标记的内容,html,regex,html-parsing,Html,Regex,Html Parsing,我正在尝试构建一个正则表达式字符串，用于在sublime text或notepad++中查找和替换，以从html页面中删除删除线文本。通常，删除线的格式如下所示： <span style="color: rgb(255,0,0);"><s>Some text here</s></span> 这里有一些文本到目前为止，我已经想到了这个： <span.*<s>.*<\/s><\/span> 限制贪婪匹配

我正在尝试构建一个正则表达式字符串，用于在sublime text或notepad++中查找和替换，以从html页面中删除删除线文本。通常，删除线的格式如下所示：

<span style="color: rgb(255,0,0);"><s>Some text here</s></span>

这里有一些文本

到目前为止，我已经想到了这个：

<span.*<s>.*<\/s><\/span>

限制贪婪匹配的最佳方法是使其在特定字符处停止[abc]
是一个字符类，表示a、b、c中的任意一个，而[^abc]
表示除a、b、c以外的任何内容。因此，[^展开dwks的答案和对其的评论，如果打通的文本中有任何HTML标记，例如，如果它看起来像
<span><s>first <b>second</b> third</s></span>

@maxzoom的可能副本：尽管他没有试图解析HTML文档。工作非常完美，一百万个谢谢！会在时间限制允许的情况下将此标记为正确答案：）如果删除线中有其他标记，则第一个正则表达式将不起作用，例如，first second third
（在这种情况下，第二个策略将起作用。）是的，如果有其他嵌套的标记，那么最好在删除标记之间使用*？
。可能是[^>]*>
或*？
而不是上一个示例中的*是的，这是合理的。（更新答案以包括建议。）
<span><s>first <b>second</b> third</s></span>

<span[^>]*><s>[^<]*</s></span>

<span[^>]*><s>.*?<\/s><\/span>




[regex]相关文章推荐



                                                        
Regex 将TextField限制为类似于数字步进器
regexapache-flexflashactionscript-3 
Regex .htaccess，分别重定向到自己的index.php
regexapache.htaccessmod-rewrite 
Regex 多行正则表达式替换
regexreplace 
Regex 所有匹配中的sed/awk替换
regexsedawk 
Regex 正则表达式以匹配uri路径（特定页面除外）
regexmod-rewritenginx 
Regex Mongoimport严格JSON{$date:XXX}作为ISODate
regexmongodbsed 
RegExp：有没有方法在不使用ecranisation的情况下将字符串传递给RegExp？
regex 
Regex Powershell管道和正则表达式，求值顺序
regexpowershell 
Regex 防止正则表达式中的任何回溯超过特定模式
regex 
Regex preg_match_all在格式错误时抓取HTML标记中的所有内容
regex 
Regex 在iron路由器中使用正则表达式时，如何访问匹配？
regexmeteor 
Regex 变量文件名的Tcl正则表达式
regexfilevariablesdirectorytcl 
Regex高尔夫-有更短的路吗？
regex 
Regex Apache2:重写包含问号的url
regexapachemod-rewriteurl-rewriting 
Regex 捕获字符串“的正则表达式”\s@\s"；只有这样
regex 
Regex 仅在字符序列之后出现正则表达式匹配
regex 
Regex Bash替换令牌之间的字符串
regexlinuxsed 
Zend中的Regex电子邮件可用性
regexzend-framework 
Regex验证字符串，但字符串可以'；t包含特定字符的n个数字
regex 
Regex Perl输出不可读，即使要求使用UTF-8进行编码
regexperlencodingutf-8 
                                       





随机文章推荐



                                                        
Internet explorer 从模式对话框（即+；Safari）返回值？
internet-explorersafari 
Internet explorer IE8中的Adobe PDF链接问题
internet-explorerpdfinternet-explorer-8 
Internet explorer Mozilla firefox与Internet Explorer-html
internet-explorerfirefox 
Internet explorer Internet Explorer：使用AutoIt将URL记录到控制台
internet-explorercom 
Internet explorer 因为奇怪的行为而重新安装internet explorer？
internet-explorer 
Internet explorer 在IE8标准模式下为IE8中呈现的本地html文件使用基本元素时，缺少样式表/脚本/图像
internet-explorerinternet-explorer-8 
Internet explorer 引导、较少和Visual Studio（Chirpy）导致IE过滤器问题
internet-explorertwitter-bootstrapless 
Internet explorer &引用；更改“；GWT中的浏览器事件
internet-explorergwt 
Internet explorer 菜单栏顶部的白线-镀铬和IE
internet-explorergoogle-chromemenu 
Internet explorer Windows Azure上这些Internet Explorer历史记录文件来自何处？
internet-explorerazure 
Internet explorer 为所有IE浏览器添加类
internet-explorer 
Internet explorer Iframe全屏internet explorer
internet-explorervideo 
Internet explorer 来自web worker IE11的xhr
internet-explorercors 
Internet explorer 未使用IE11从localhost向Intranet发出API请求
internet-explorercors 
Internet explorer 午睡：“无法从释放的脚本执行代码”
internet-explorer 
Internet explorer &引用；SSL网络扩展器服务已关闭”；IE11中的错误
internet-explorersslwindows-10 
Internet explorer 微软边缘上的ASP经典
internet-explorervbscriptasp-classic 
Internet explorer IE 11（更新版本：11.0.24）内存消耗问题
internet-explorermemory-leaks 
Internet explorer IE中svg图像的奇怪行为
internet-explorersvg 
Internet explorer 保持'；意外响应，代码=404'；watirwebdriver中的异常
internet-explorerselenium


                                        

                                        
                                        


                                                
                                                        [html]相关推荐
                                                        
更改NetBeans中的模板或HTML缩进
									Html
							 									Netbeans
							 
Html 这些闪光颜色值的颜色格式/编码是什么
									Html
							 									Flash
							 									Apache Flex
							 
Html 如何使div填充剩余的屏幕空间和具有相同高度的内部div？
									Html
							 									Css
							 
WebSocket意外响应代码：400，RFC6455协议称响应类似HTML？
									Html
							 									Google Chrome
							 									Safari
							 									Websocket
							 
Html 相同的代码、相同的浏览器、相同的Web服务器，但事情看起来仍然不同
									Html
							 									Css
							 									Internet Explorer
							 									Tomcat
							 
Html 创建页面
									Html
							 									Css
							 
Html 垂直居中的文本在图标下继续显示
									Html
							 									Css
							 
Html 在动态表格下，如何保持网页底部内容的静态？
									Html
							 									Css
							 									Jsp
							 
Html 从ng选项angularjs获取密钥
									Html
							 									Angularjs
							 									Ionic Framework
							 
Html 父div高度0，clearfix不'；行不通
									Html
							 									Css
							 
Html 如何在没有重叠阴影的情况下进行导航
									Html
							 									Css
							 
Html IE11音频标签不工作
									Html
							 
Html 框延伸到屏幕的末端
									Html
							 									Css
							 									Drop Down Menu
							 
Html Safari中的网站标题与Chrome中的不同
									Html
							 									Css
							 									Google Chrome
							 									Safari
							 
Html 我有一个没有SSL（HTTPS）的网站，我需要添加到头元素的元推荐不安全的url？
									Html
							 									Http
							 									Ssl
							 									Https
							 									Seo
							 
Html 电子邮件模板中花括号的含义
									Html
							 									Css
							 
Html 图例标记在字段集中的位置重要吗？
									Html
							 
Html 如何使用css重复背景图像
									Html
							 									Css
							 
Html 将引导单选按钮与文本对齐
									Html
							 									Css
							 									Twitter Bootstrap
							 
Html Bootstrap不会将图像和文本并排放置在中间。
									Html
							 									Css
							 									Twitter Bootstrap
							 
Html 什么是#文本以及如何删除它？
									Html
							 
Html 引导问题：容器流体不是100%宽度
									Html
							 									Css
							 									Twitter Bootstrap 3
							 
Html bootstrap中的左边距
									Html
							 									Css
							 									Twitter Bootstrap
							 
Html 填充图像调整大小后的剩余空间，保持其纵横比
									Html
							 									Css
							 
Html 更改下拉菜单的位置
									Html
							 									Css
							 
Html 我的密码验证没有'；执行不当
									Html
							 									Asp.net
							 
Html 为什么我的按钮不显示在一行上？
									Html
							 									Css
							 
Html 手机chrome上的键盘和CSS乱七八糟
									Html
							 									Css
							 									Google Chrome
							 									Mobile
							 									Responsive Design
							 
Html 如何适应粘性背景图像并防止css溢出？
									Html
							 									Css
							 
Html 两个XPath变体都返回字符为（0）的刮取尝试
									Html
							 									R
							 									Xml
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Puppet
Windbg
Ip
Redis
Dynamic
Z3
Vaadin
Pointers
Sap
Process
Pytorch
Xcode
Jar
Tomcat
.net 4.0
Build
Protractor
Variables
Ruby On Rails
String
Sprite Kit
Google Cloud Firestore
Cocoa Touch
Android
Xquery
Dom
Openlayers 3
Sip
Listview
Opencv
Protocol Buffers
Gitlab
Parsing
Plugins
Swagger
Devexpress
Weblogic
Css
Vuejs2
Postman
Vue.js
Couchbase
Artificial Intelligence
Sphinx
Networking
Usb
Compiler Errors
Resharper
Discord.js
Amazon Cloudformation
Enums
Keyboard
Fluent Nhibernate
Modelica
Plone
Quickbooks
Youtube Api
Ios8
Automated Tests
Swing
Tinymce
.htaccess
Erlang
Web Applications
Dialogflow Es
Lotus Notes
Mapping
Automation
Django Models
Graph
Azure Active Directory
Blazor
Activerecord
Angular Material
Internet Explorer
Jira
Tags
Visual Studio 2017
Ionic2
Web Scraping
Vhdl
Dask
Hadoop
Collections
Installation
Phantomjs
Routing
Compiler Construction
Navigation
Visual Studio 2013
Rxjs
Scala
Ffmpeg
Codenameone
Jenkins
Cmake
Google Api
Embedded
Node.js
Drupal 6
Highcharts
Windows Phone 8.1
Scroll
Yii
Webstorm
Streaming
Opencart
Firefox Addon
Sql Server 2012
Plsql
Mediawiki
Dojo
Sharepoint 2010
Windows Mobile
Nuget
Responsive Design
Memory Management
Visual Studio 2012
Wix
Xslt
Prestashop
Go
Seo
Netlogo
Bash
Nservicebus
Apache Storm
Google Chrome Extension
React Native
Wxpython
Teradata
Latex
Shell
Parse Platform
Electron
Autohotkey
Tensorflow
Google Drive Api
Sms
Synchronization
Arm
Three.js
Tableau Api
Subsonic
Rdf
Youtube
Ms Office
Dataframe
Download
Elm
Asp.net Web Api
Image
Logic
Corda
Spring Cloud
Filter
Exception Handling
Triggers
Cocos2d Iphone
Angular6
Ethereum
C# 4.0
Netsuite
Sharepoint 2007
Unix
Calendar
.net Core
Nest
Mongoose
Model
Ajax
Sails.js
Log4net
Types
Jdbc
For Loop
Performance
Symfony1
Rx Java
Vector
Dependency Injection
Spring
Menu
File Io
File
Vba
Internet Explorer 8
C# 3.0
Network Programming
Amazon S3
Fortran
Web Services
Magento
Parallel Processing
Tabs
Class
Syntax
Search
Rspec
Sas
Knockout.js


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网