解析html文档中的脚注_Html_Regex - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
解析html文档中的脚注_Html_Regex - Fatal编程技术网

解析html文档中的脚注

html regex

解析html文档中的脚注,html,regex,Html,Regex,我需要解析通过将word文档保存为html生成的html文档我已经非常成功地使用了HTML敏捷包，但在这个例子中，我认为在这一部分中使用正则表达式可能更容易（观点？） Word将其脚注之一翻译为html时生成以下代码 <a href="#_ftn2" name="_ftnref2" title=""><span class=MsoFootnoteReference><span class=MsoFootnoteReference><span style

我需要解析通过将word文档保存为html生成的html文档

我已经非常成功地使用了HTML敏捷包，但在这个例子中，我认为在这一部分中使用正则表达式可能更容易（观点？）

Word将其脚注之一翻译为html时生成以下代码

<a href="#_ftn2" name="_ftnref2" title=""><span
class=MsoFootnoteReference><span class=MsoFootnoteReference><span
style='font-size:10.0pt'>[2]</span></span></span></a>

此输出对于每个脚注都是一致的，只有href=和名称以及[2]文本发生了更改

我需要提取_ftn2和[2]元素

到目前为止，我有以下正则表达式，它将把_ftn2部分提取到名称组中

<a href="#(?<name>_ftn\d).*>(<span class=MsoFootNoteReference>)

如果输入完全遵循该格式，则可以使用非常松散的正则表达式。您只需忽略除要提取的部分之外的所有内容，然后使用非贪婪表达式来吃掉它们之间的所有垃圾：
<a href="#(?<name>_ftn\d).*?(?<number>\[\d+\]).*?<\/a>

我将获取类MsFootNoteReference的所有跨度，并检查父href。。。
<a href="#(?<name>_ftn\d).*?(?<number>\[\d+\]).*?<\/a>




[regex]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
免费还是付费Wordpress足球俱乐部主题？
wordpress 
在Wordpress中使用序列化数据
wordpressserialization 
如何将照片从url添加到wordpress？
wordpress 
Wordpress WP_站点URL和WP_主页值？
wordpressurl 
如何在WordPress管理菜单中创建新按钮
wordpress 
Wordpress 新模板未显示在模板下拉列表中
wordpress 
用Hack/hvm开发WordPress
wordpress 
无法更新到WordPress 4.7.2-错误：文件权限不一致
wordpresspermissions 
让我的Wordpress站点的一些页面位于另一个域中
wordpress.htaccessdns 
如何将wordpress博客集成到现有网站中？（www.xxxx.com/blog）
wordpressreactjs 
Wordpress 包含相同名称的正则表达式文件夹重定向（创建循环）
wordpress.htaccessredirectmod-rewrite 
Wordpress 如何获取自定义类型字段组标题？
wordpress 
Wordpress图像库的断点
wordpressmobile 
将Wordpress live站点转换为PWA的最佳实践是什么
wordpressweb 
Wordpress htaccess如何删除get参数
wordpress.htaccess 
当我更新Wordpress'；s的最新版本现在显示此错误
wordpress 
具有WordPress Borlabs Cookies的多个Google分析属性
wordpresscookiesgoogle-analytics 
nginx上的Wordpress未加载css/js/images
wordpressnginx 
Wordpress 高级自定义字段| 2个字段的验证规则
wordpress 
如何在WordPress中使用out插件制作粘性标题
wordpress


                                        

                                        
                                        


                                                
                                                        [html]相关推荐
                                                        
Html IE7默认元素为100%宽度
									Html
							 									Css
							 
HTML表格布局问题
									Html
							 
Html 自定义推特，G+；，Facebook按钮
									Html
							 									Css
							 									Facebook
							 									Twitter
							 									Google Plus
							 
Html 如何在MVC3中提供基于角色的登录和菜单？
									Html
							 									Asp.net Mvc 3
							 									C# 4.0
							 
Html 设置选择下拉菜单的样式，使其在所有浏览器和操作系统中看起来都相同
									Html
							 									Select
							 									Drop Down Menu
							 									Menu
							 
Html 集成后退按钮
									Html
							 									Wordpress
							 
Html 在不同的屏幕分辨率下，网站布局变得杂乱无章
									Html
							 									Css
							 									Layout
							 
Html PHP:$\u POST字段为空
									Html
							 									Php
							 
Html 无法提交IE9上有4个文件上载字段的表单
									Html
							 									File Upload
							 
Html 旋转箭头，即在mousemove上绘制的箭头
									Html
							 									Canvas
							 
Html 仅Firefox上主容器div外的Nivo滑块div位置
									Html
							 									Css
							 
Html Div-won'；t IE8中浏览器的100%宽度
									Html
							 									Css
							 
Html 使用基础3显示铬中的滑块
我正在使用基础3和原生轨道滑块构建一个站点。
									Html
							 									Css
							 									Google Chrome
							 									Zurb Foundation
							 
通过html隐藏密码
									Html
							 									Css
							 
Html 可调整大小的导航栏和按钮'；a la'；福布斯
									Html
							 									Css
							 
Html 防止多级水平断裂
									Html
							 									Css
							 
Html CSS通过类访问ID
									Html
							 									Css
							 
Html 如何更改打开新窗口的方法
									Html
							 									Css
							 
Html 当设备仅从纵向旋转到横向时，网页上的全屏图像会被挤压
									Html
							 									Css
							 									Image
							 									Responsive Design
							 
Html Div css下的Div不工作
									Html
							 									Css
							 
Html 使纯css动画图标跨浏览器兼容
									Html
							 									Css
							 
Html 3个div：一个中心div，最大宽度，左、右div，应占据剩余空间
									Html
							 									Css
							 
Html 在带有过渡的链接悬停上显示图像
									Html
							 									Css
							 
Html 如何根据元素数量设置元素宽度？
									Html
							 									Css
							 
Html 如何查看localhost中的目录列表？
									Html
							 									Networking
							 									Directory
							 
Html bootstrap-border top正在向表中添加边框
									Html
							 									Css
							 									Twitter Bootstrap
							 
Html 当文本长度发生变化时，如何使表格不下移？（将工作台固定在一个位置）
									Html
							 									Css
							 
Html 表格单元格内的自定义文字样式
									Html
							 
Html 无法创建导航选项卡链接重定向到新页面
									Html
							 									Jquery
							 
Html 如何更改锚定标记中标题属性的样式？
									Html
							 									Css
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Cluster Computing
Signalr
Ansible
Silverstripe
Julia
Raspberry Pi
Algorithm
Ios7
Moodle
Jekyll
Cocos2d X
Gtk
Xsd
Asp.net Mvc 3
Frameworks
Yocto
Vb6
Macros
Vuejs2
Windows Installer
Ajax
Gruntjs
Ocaml
Syntax
Sas
Smalltalk
Rest
Google Cloud Dataflow
Scala
Rabbitmq
Mod Rewrite
Asp.net Mvc
Log4net
Alfresco
Dialogflow Es
Hazelcast
Imagemagick
Tcl
Dynamics Crm 2011
Rdf
Webview
Less
Excel
Antlr4
Office Js
Ravendb
Xquery
Permissions
Stata
Opencart
Browser
Robotframework
Streaming
Google Colaboratory
Titanium
Html
Graphviz
Charts
View
Osgi
Ruby On Rails 3
Kubernetes
Exception Handling
Camera
Animation
Autohotkey
Automation
Shiny
Java
Activemq
Gridview
Io
Leaflet
Actionscript 3
Memory Management
Directx
Instagram
Sails.js
Character Encoding
Html5 Canvas
Gwt
Boost
Mobile
Tomcat
Groovy
Pandas
Installation
Primefaces
Sublimetext2
Web Crawler
Triggers
Jboss
Wicket
Graphics
Go
Blockchain
Merge
Plone
Processing
Ssl
Process
Coding Style
Mapreduce
Url Rewriting
Doctrine Orm
Weblogic
Ruby On Rails 3.1
Drools
Angular6
Matrix
Jquery Mobile
Binary
Kentico
Asp.net
Cmd
Hive
Web Services
Google Visualization
3d
Oop
Telegram
Webpack
Sencha Touch
Modelica
Servlets
Sql Server
Stream
Coq
Oracle11g
Jaxb
Model View Controller
Vector
Openstack
Artifactory
Php
Programming Languages
Video Streaming
C#
Eclipse
C++11
Windows 8
Mips
Printing
Terraform
Talend
Socket.io
Web Applications
Assembly
Dynamics Crm
Jira
Geolocation
Coldfusion
Certificate
Sqlalchemy
Sequelize.js
Aws Lambda
Virtual Machine
.net
Curl
Ms Word
Google Maps Api 3
Batch File
Openssl
Typescript
Json
Text
Jsf
Autocomplete
Cocoa
Android
Tags
.net 4.0
Entity Framework
For Loop
Odoo
Azure Data Factory
Xampp
Opencv
Material Ui
Netsuite
Grep
Button
Xamarin.android
Spring Mvc
Openerp
Haskell
Lisp
Xna
Netty
Ag Grid
Service
Adobe
Web
Proxy
Path
Mvvm
Login
Tridion
Functional Programming
Cobol
Responsive Design


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网