C# 在C中使用Linq to XML在文档中搜索不同的XML结构
我编写了一个小C来解析XML文档中的许多元素,并只返回具有不同子结构的第一个元素?例如,如果我有以下XML文档,那么调用rootElement.DistinctStructuresbase(假设)将返回一个IEnumerable,其中只包含ID为1、3和5的基本元素C# 在C中使用Linq to XML在文档中搜索不同的XML结构,c#,linq,linq-to-xml,C#,Linq,Linq To Xml,我编写了一个小C来解析XML文档中的许多元素,并只返回具有不同子结构的第一个元素?例如,如果我有以下XML文档,那么调用rootElement.DistinctStructuresbase(假设)将返回一个IEnumerable,其中只包含ID为1、3和5的基本元素 <root> <base id="1"> <a>text</a> </base> <base id="2">
<root>
<base id="1">
<a>text</a>
</base>
<base id="2">
<a>more text</a>
</base>
<base id="3">
<b>text</b>
</base>
<base id="4">
<a>other text</a>
</base>
<base id="5">
<a>
<c>sub text</c>
</a>
</base>
</root>
基本代码从结构中的元素名称和文本节点生成唯一键,并将它们与保存的唯一元素集合进行比较。我的问题是,是否有一种更整洁的方法来做到这一点
private Dictionary<string, XElement> uniqueElements = new Dictionary<string, XElement>();
public void Go()
{
foreach (var entry in xmlDoc.Elements("e"))
{
string keyString = AsStructureString(entry).ToString();
if (!uniqueElements.Keys.Contains(keyString))
{
uniqueElements.Add(keyString, entry);
}
}
}
public StringBuilder AsStructureString(this XElement input)
{
StringBuilder sb = new StringBuilder(input.Name.LocalName);
var NodesOfNote = input.Nodes().Where(n => n.NodeType == XmlNodeType.Element || n.NodeType == XmlNodeType.Text).ToList();
if (NodesOfNote.Any())
{
sb.Append(">>");
}
foreach (var childNode in NodesOfNote)
{
if (childNode.NodeType == XmlNodeType.Element)
{
sb.Append((childNode as XElement).AsStructureString());
}
if (childNode.NodeType == XmlNodeType.Text)
{
sb.Append("txt");
}
if (!childNode.IsLastIn(NodesOfNote))
{
sb.Append("|");
}
}
return sb;
}
这可能比你想象的要容易。如果决定节点结构的是其元素和文本,而不考虑内容,则可以执行以下操作:
IEnumerable<XElement> DistinctStructures(XContainer root, XName name)
{
return
from d in root.Descendants(name)
group d by GetKey(d) into g
select g.First();
string GetKey(XElement n) =>
String.Join(",",
n.DescendantNodes().Select(d =>
d is XElement e ? $"{e.Name}^{GetDepth(e)}"
: d is XText t ? $"<text>^{GetDepth(t)}"
: default
)
);
int GetDepth(XObject o)
{
var depth = 0;
for (var c = o; c != null; c = c.Parent)
++depth;
return depth;
}
}
发布您尝试的代码。已添加代码。希望这有帮助。谢谢。这绝对是一个更干净,更灵巧。解决方案中需要注意的一点是,GetKey中的默认文本要求您使用C7.1。但是用string.Empty替换是很容易的。