Xml 需要XSLT转换来删除重复的元素-按属性排序
我需要通过BizTalk处理一段糟糕的XML,我已经成功地将其规范化到下面的示例中。我不是XSLT忍者,但在web和VS2010调试器之间,我可以找到XSL的解决方法 我现在需要一点巧妙的XSLT来“剔除”重复的元素,只保留最新的元素,这取决于ValidFromDate属性中的日期。 ValidFromDate属性属于XSD:Date类型Xml 需要XSLT转换来删除重复的元素-按属性排序,xml,xslt,xpath,biztalk,Xml,Xslt,Xpath,Biztalk,我需要通过BizTalk处理一段糟糕的XML,我已经成功地将其规范化到下面的示例中。我不是XSLT忍者,但在web和VS2010调试器之间,我可以找到XSL的解决方法 我现在需要一点巧妙的XSLT来“剔除”重复的元素,只保留最新的元素,这取决于ValidFromDate属性中的日期。 ValidFromDate属性属于XSD:Date类型 <SomeData> <A ValidFromDate="2011-12-01">A_1</A> <A Va
<SomeData>
<A ValidFromDate="2011-12-01">A_1</A>
<A ValidFromDate="2012-01-19">A_2</A>
<B CalidFromDate="2011-12-03">B_1</B>
<B ValidFromDate="2012-01-17">B_2</B>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
A_1
A_2
B_1
B_2
B_3
C_1
C_2
转换后,我只想保留以下几行:
<SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
</SomeData>
A_2
B_3
C_1
关于如何将XSL组合在一起,有什么线索吗?我清空了互联网,试图寻找一个解决方案,我也尝试了很多聪明的XSL排序脚本,但我觉得没有一个能让我走上正确的方向。Xslt 1.0解决这个问题的最佳方法是使用Muenchian分组。(假设元素已经按ValidFromDate属性排序)下面的样式表应该可以做到这一点:
<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" indent="yes"/>
<xsl:key name="element-key" match="/SomeData/*" use="name()" />
<xsl:template match="/SomeData">
<xsl:copy>
<xsl:for-each select="*[generate-id() = generate-id(key('element-key', name()))]">
<xsl:copy-of select="(. | following-sibling::*[name() = name(current())])[last()]" />
</xsl:for-each>
</xsl:copy>
</xsl:template>
</xsl:stylesheet>
下面是我在对示例Xml运行时得到的结果:
<?xml version="1.0" encoding="utf-8"?>
<SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
A_2
B_3
C_2
基于,我做了以下修改,产生了相同的结果:
<xsl:template match="/SomeData">
<xsl:copy>
<xsl:copy-of select="*[generate-id() = generate-id(key('element-key', name())[last()])]"/>
</xsl:copy>
</xsl:template>
如果它们每次都产生相同的结果,我喜欢这样,因为它更干净。以下样式表产生正确的结果,而不依赖于输入顺序:
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:key name="byName" match="/SomeData/*" use="name()"/>
<xsl:template match="@*|node()">
<xsl:copy>
<xsl:apply-templates select="@*|node()"/>
</xsl:copy>
</xsl:template>
<xsl:template match="SomeData">
<xsl:copy>
<xsl:apply-templates select="@*"/>
<xsl:for-each select="*[generate-id()=
generate-id(key('byName', name())[1])]">
<xsl:apply-templates select="key('byName', name())" mode="out">
<xsl:sort select="translate(@ValidFromDate, '-', '')"
data-type="number" order="descending"/>
</xsl:apply-templates>
</xsl:for-each>
</xsl:copy>
</xsl:template>
<xsl:template match="SomeData/*" mode="out">
<xsl:if test="position()=1">
<xsl:apply-templates select="."/>
</xsl:if>
</xsl:template>
</xsl:stylesheet>
输出:
<SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
</SomeData>
A_2
B_3
C_1
请注意,结果与您列出的所需输出略有不同,因为C_1
实际上是最新的C
元素(即输入尚未排序)。通过依赖初始排序顺序(并盲目遵循列出的预期输出),现有答案实际上是不正确的
说明:
- 一个
通过xsl:key
name()将所有
分组/SomeData/*
- 每个的外部
选择每组中的第一项
- 然后将模板应用于该组的所有成员,这些成员按
@ValidFromDate
- 一个额外的模板处理从每个排序的组中拾取第一个元素
- 标识转换模板负责其余部分
@ValidFromDate
订单:
XSLT:
适用于:
<SomeData>
<A ValidFromDate="2011-12-01">A_1</A>
<A ValidFromDate="2012-01-19">A_2</A>
<B CalidFromDate="2011-12-03">B_1</B>
<B ValidFromDate="2012-01-17">B_2</B>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
A_1
A_2
B_1
B_2
B_3
C_1
C_2
产生:
<SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
</SomeData>
A_2
B_3
C_1
XLST 2.0解决方案,无需依赖输入顺序
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:fn="http://www.w3.org/2005/xpath-functions">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<xsl:template match="/">
<SomeData>
<xsl:for-each-group select="/SomeData/*" group-by="name()">
<xsl:for-each select="current-group()">
<xsl:sort select="number(substring(attribute(),1,4))" order="descending" data-type="number"/> <!-- year-->
<xsl:sort select="number(substring(attribute(),6,2))" order="descending" data-type="number"/> <!-- month-->
<xsl:sort select="number(substring(attribute(),9,2))" order="descending" data-type="number"/> <!-- date-->
<xsl:if test="position()=1">
<xsl:sequence select="."/>
</xsl:if>
</xsl:for-each>
</xsl:for-each-group>
</SomeData>
</xsl:template>
</xsl:stylesheet>
一个比@lwburk更简单、更短的XSLT 1.0解决方案:
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:key name="kName" match="*/*" use="name()"/>
<xsl:template match="/">
<xsl:apply-templates select=
"*/*[generate-id()
=
generate-id(key('kName', name())[1])
]
"/>
</xsl:template>
<xsl:template match="*/*">
<xsl:for-each select="key('kName', name())">
<xsl:sort select="@ValidFromDate" order="descending"/>
<xsl:if test="position() = 1">
<xsl:copy-of select="."/>
</xsl:if>
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
<SomeData>
<A ValidFromDate="2011-12-01">A_1</A>
<A ValidFromDate="2012-01-19">A_2</A>
<B CalidFromDate="2011-12-03">B_1</B>
<B ValidFromDate="2012-01-17">B_2</B>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
当此转换应用于提供的XML文档时:
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:key name="kName" match="*/*" use="name()"/>
<xsl:template match="/">
<xsl:apply-templates select=
"*/*[generate-id()
=
generate-id(key('kName', name())[1])
]
"/>
</xsl:template>
<xsl:template match="*/*">
<xsl:for-each select="key('kName', name())">
<xsl:sort select="@ValidFromDate" order="descending"/>
<xsl:if test="position() = 1">
<xsl:copy-of select="."/>
</xsl:if>
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
<SomeData>
<A ValidFromDate="2011-12-01">A_1</A>
<A ValidFromDate="2012-01-19">A_2</A>
<B CalidFromDate="2011-12-03">B_1</B>
<B ValidFromDate="2012-01-17">B_2</B>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
A_1
A_2
B_1
B_2
B_3
C_1
C_2
生成所需的正确结果:
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:key name="kName" match="*/*" use="name()"/>
<xsl:template match="/">
<xsl:apply-templates select=
"*/*[generate-id()
=
generate-id(key('kName', name())[1])
]
"/>
</xsl:template>
<xsl:template match="*/*">
<xsl:for-each select="key('kName', name())">
<xsl:sort select="@ValidFromDate" order="descending"/>
<xsl:if test="position() = 1">
<xsl:copy-of select="."/>
</xsl:if>
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
<SomeData>
<A ValidFromDate="2011-12-01">A_1</A>
<A ValidFromDate="2012-01-19">A_2</A>
<B CalidFromDate="2011-12-03">B_1</B>
<B ValidFromDate="2012-01-17">B_2</B>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
<C ValidFromDate="2011-01-20">C_2</C>
</SomeData>
<A ValidFromDate="2012-01-19">A_2</A>
<B ValidFromDate="2012-01-19">B_3</B>
<C ValidFromDate="2012-01-20">C_1</C>
A_2
B_3
C_1
还有。。。由于这将从BizTalk映射调用,因此通过.NET我仅限于XSLT 1.0…可能是C_1
而不是C_2
?是的,当然。。。谢谢在我的任务中编辑了这个。首先。。。很多非常好的解决方案。我在XSLT mojo中读到了所有这些内容。我没有时间全部试用,而且除了我选择的解决方案之外,还有其他解决方案可以做到。嗨,我对你的答案做了修改。给定OP的源XML,两者都产生相同的输出,但我不知道是否有更细微的差异,不应该有任何差异。你的版本更干净!谢谢@是的,谢谢你指出这一点。我将深入地看一看你的答案。@Pawel:事实上,元素没有排序——因此这个解决方案是不正确的。嗨,lwburk。。。谢谢你指出C_1的东西。我很难过。不过,这个解决方案效果不错。我使用了Dimitre的解决方案,因为它稍微短了一点,并且更容易概述,因此对于那些需要对其进行维护的人来说,它是可以维护的。是的。。XSLT2.0使实现这一点变得简单了一些,但微软尚未着手实现这一点。。。谢谢你。