Php Regex以获取XML标记之间的内容

Php Regex以获取XML标记之间的内容,php,regex,Php,Regex,对于正则表达式,我希望以内容字符串的形式返回和之间的所有内容 我使用的正则表达式如下:。(]*>)([^]*)? 但是,有时内容会在开头被剪切,因此内容可以以文本开始 我想要一个与以下内容匹配的正则表达式: $1:' $2:‘文本’ 并且仍然与 我现在有两个正则表达式(另一个是#^()([^您需要第二个正则表达式(实际上您还需要更多)因为正则表达式不是一个足够强大的工具来解析XML/HTML。没有办法构造一个或多个正则表达式来成功地实现您想要的功能。与其这样做,我建议使用一个或多个支持XML

对于正则表达式,我希望以内容字符串的形式返回
之间的所有内容

我使用的正则表达式如下:
。(]*>)([^]*)?

但是,有时内容会在开头被剪切,因此内容可以以
文本开始

我想要一个与以下内容匹配的正则表达式:

  • $1:'
  • $2:‘文本’
并且仍然与


我现在有两个正则表达式(另一个是
#^()([^您需要第二个正则表达式(实际上您还需要更多)因为正则表达式不是一个足够强大的工具来解析XML/HTML。没有办法构造一个或多个正则表达式来成功地实现您想要的功能。与其这样做,我建议使用一个或多个支持XML的库。

我真的很想有机会使用此链接:@cwallenpole-只是一个时间问题ime。这些不是HTML标记(不是讽刺性的。我觉得这篇文章很搞笑(我眼中的泪水很好笑),我真的很喜欢查找它。事实上,这是一个双重的好处)问题是它不是有效的xml,因为它只是xml文档的一部分。你能提供一个你正在使用的xml的示例吗?xml解析器(可以是)非常宽松,就像HTML解析器必须做到的那样,并且可能能够绕过这个问题你已经知道,它是如此的无效以至于不可解析,你不能以这样的方式转换或包装它以使其有效,它实际上根本不是XML,它只是看起来像XML的数据,在这种情况下,你可能会被卡住-你怎么能希望准确解析非结构化数据?是的,它们是问题末尾的一些示例内容啊,是的,sorry,跨越远处的巨大线条很容易被跳过。如果你真的需要这样做的话,我想你已经被卡住了。第一个标记
关闭了一个不存在的
w:t
,我们已经失去了任何有意义的结构。你说它是“xml文档的一部分”-你能从更大的文档开始并解析它吗?如果你真的想使用你发布的字符串,那么你将进入一个不太有趣的世界。。。
 {#fuites}</w:t></w:r><w:r w:rsidR="00E4576A"><w:rPr><w:bCs/></w:rPr><w:t>{</w:t></w:r><w:r w:rsidR="0066055D"><w:rPr><w:bCs/>
</w:rPr><w:t>type</w:t></w:r><w:r w:rsidR="00E4576A">
<w:rPr><w:bCs/></w:rPr><w:t>}</w:t></w:r>
<w:r w:rsidR="00900433"><w:rPr><w:bCs/>
</w:rPr><w:t xml:space="preserve">
</w:t></w:r><w:r w:rsidR="00900433">
<w:rPr><w:noProof/><w:lang w:eastAsia="fr-FR"/>
</w:rPr><w:drawing><wp:inline distT="0" distB="0" distL="0" distR="0" wp14:anchorId="1745F132" wp14:editId="7142C18F">
<wp:extent cx="225632" cy="179073"/><wp:effectExtent l="0" t="0" r="3175" b="0"/>
<wp:docPr id="7" name="Image 7"/><wp:cNvGraphicFramePr><a:graphicFrameLocks xmlns:a="http://schemas.openxmlformats.org/drawingml/2006/main" noChangeAspect="1"/></wp:cNvGraphicFramePr><a:graphic xmlns:a="http://schemas.openxmlformats.org/drawingml/2006/main"><a:graphicData uri="http://schemas.openxmlformats.org/drawingml/2006/picture"><pic:pic xmlns:pic="http://schemas.openxmlformats.org/drawingml/2006/picture"><pic:nvPicPr><pic:cNvPr id="0" name=""/><pic:cNvPicPr/></pic:nvPicPr><pic:blipFill><a:blip r:embed="rId11"/><a:stretch><a:fillRect/></a:stretch></pic:blipFill><pic:spPr><a:xfrm><a:off x="0" y="0"/><a:ext cx="228029" cy="180975"/></a:xfrm><a:prstGeom prst="rect"><a:avLst/></a:prstGeom></pic:spPr></pic:pic></a:graphicData></a:graphic></wp:inline></w:drawing></w:r><w:r><w:rPr><w:b/><w:bCs/></w:rPr><w:t xml:space="preserve"> {Type}</w:t></w:r><w:r><w:rPr><w:b/><w:bCs/></w:rPr><w:tab/><w:t>{</w:t></w:r><w:r><w:rPr><w:bCs/></w:rPr><w:t>Description}</w:t></w:r></w:p><w:p w:rsidR="00FF7A5E" w:rsidRPr="00FF7A5E" w:rsidRDefault="00FF7A5E" w:rsidP="00CA7135"><w:pPr><w:rPr><w:bCs/></w:rPr></w:pPr><w:r><w:rPr><w:bCs/></w:rPr><w:t>{/fuites}