C# xml数据类型的全文搜索
我正在开发一个应用程序,其中我正在使用第三方解析简历。第三方以xml的形式将响应返回给我。我将整个xml存储在一列中。 根据提供的恢复,每次节点数都会有所不同 现在,我的要求是对这个xml数据类型列执行全文或普通搜索。我还需要取得候选人的名字,姓氏,电子邮件和一些其他重要信息。我的问题是如何在我不知道节点名称的列上搜索 xml数据类型列仅存储xml文档和片段,并且仅对文档使用xml筛选器。因此,不需要类型列。在xml列上,全文索引索引xml元素的内容,但忽略xml标记。属性值是全文索引的,除非它们是数值。元素标记用作标记边界。支持格式良好的XML或HTML文档以及包含多种语言的片段。 有关查询xml列的更多信息,请参阅xml列的全文索引。 此外,还可以使用此SQL(UDF)函数获取xml节点名称C# xml数据类型的全文搜索,c#,asp.net,sql-server,xml,sql-server-2008,C#,Asp.net,Sql Server,Xml,Sql Server 2008,我正在开发一个应用程序,其中我正在使用第三方解析简历。第三方以xml的形式将响应返回给我。我将整个xml存储在一列中。 根据提供的恢复,每次节点数都会有所不同 现在,我的要求是对这个xml数据类型列执行全文或普通搜索。我还需要取得候选人的名字,姓氏,电子邮件和一些其他重要信息。我的问题是如何在我不知道节点名称的列上搜索 xml数据类型列仅存储xml文档和片段,并且仅对文档使用xml筛选器。因此,不需要类型列。在xml列上,全文索引索引xml元素的内容,但忽略xml标记。属性值是全文索引的,除非它
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE FUNCTION [dbo].[XMLTable](@x XML)
RETURNS TABLE
AS RETURN
WITH cte AS (
SELECT
1 AS lvl,
x.value('local-name(.)','NVARCHAR(MAX)') AS Name,
CAST(NULL AS NVARCHAR(MAX)) AS ParentName,
CAST(1 AS INT) AS ParentPosition,
CAST(N'Element' AS NVARCHAR(20)) AS NodeType,
x.value('local-name(.)','NVARCHAR(MAX)') AS FullPath,
x.value('local-name(.)','NVARCHAR(MAX)')
+ N'['
+ CAST(ROW_NUMBER() OVER(ORDER BY (SELECT 1)) AS NVARCHAR)
+ N']' AS XPath,
ROW_NUMBER() OVER(ORDER BY (SELECT 1)) AS Position,
x.value('local-name(.)','NVARCHAR(MAX)') AS Tree,
x.value('text()[1]','NVARCHAR(MAX)') AS Value,
x.query('.') AS this,
x.query('*') AS t,
CAST(CAST(1 AS VARBINARY(4)) AS VARBINARY(MAX)) AS Sort,
CAST(1 AS INT) AS ID
FROM @x.nodes('/*') a(x)
UNION ALL
SELECT
p.lvl + 1 AS lvl,
c.value('local-name(.)','NVARCHAR(MAX)') AS Name,
CAST(p.Name AS NVARCHAR(MAX)) AS ParentName,
CAST(p.Position AS INT) AS ParentPosition,
CAST(N'Element' AS NVARCHAR(20)) AS NodeType,
CAST(p.FullPath + N'/' + c.value('local-name(.)','NVARCHAR(MAX)') AS NVARCHAR(MAX)) AS FullPath,
CAST(p.XPath + N'/'+ c.value('local-name(.)','NVARCHAR(MAX)')+ N'['+ CAST(ROW_NUMBER() OVER(PARTITION BY c.value('local-name(.)','NVARCHAR(MAX)')
ORDER BY (SELECT 1)) AS NVARCHAR)+ N']' AS NVARCHAR(MAX)) AS XPath,
ROW_NUMBER() OVER(PARTITION BY c.value('local-name(.)','NVARCHAR(MAX)')
ORDER BY (SELECT 1)) AS Position,
CAST( SPACE(2 * p.lvl - 1) + N'|' + REPLICATE(N'-', 1) + c.value('local-name(.)','NVARCHAR(MAX)') AS NVARCHAR(MAX)) AS Tree,
CAST( c.value('text()[1]','NVARCHAR(MAX)') AS NVARCHAR(MAX) ) AS Value, c.query('.') AS this,
c.query('*') AS t,
CAST(p.Sort + CAST( (lvl + 1) * 1024 + (ROW_NUMBER() OVER(ORDER BY (SELECT 1)) * 2) AS VARBINARY(4)) AS VARBINARY(MAX) ) AS Sort,
CAST((lvl + 1) * 1024 + (ROW_NUMBER() OVER(ORDER BY (SELECT 1)) * 2) AS INT)
FROM cte p
CROSS APPLY p.t.nodes('*') b(c)), cte2 AS (
SELECT
lvl AS Depth,
Name AS NodeName,
ParentName,
ParentPosition,
NodeType,
FullPath,
XPath,
Position,
Tree AS TreeView,
Value,
this AS XMLData,
Sort, ID
FROM cte
UNION ALL
SELECT
p.lvl,
x.value('local-name(.)','NVARCHAR(MAX)'),
p.Name,
p.Position,
CAST(N'Attribute' AS NVARCHAR(20)),
p.FullPath + N'/@' + x.value('local-name(.)','NVARCHAR(MAX)'),
p.XPath + N'/@' + x.value('local-name(.)','NVARCHAR(MAX)'),
1,
SPACE(2 * p.lvl - 1) + N'|' + REPLICATE('-', 1)
+ N'@' + x.value('local-name(.)','NVARCHAR(MAX)'),
x.value('.','NVARCHAR(MAX)'),
NULL,
p.Sort,
p.ID + 1
FROM cte p
CROSS APPLY this.nodes('/*/@*') a(x)
)
SELECT
ROW_NUMBER() OVER(ORDER BY Sort, ID) AS ID,
ParentName, ParentPosition,Depth, NodeName, Position,
NodeType, FullPath, XPath, TreeView, Value, XMLData
FROM cte2
请发布您的示例xml数据页1 xml,word文档中有16页。注意:还有更多页,但由于评论限制,我无法在此处添加全部内容。希望你能从上面得到这个主意。我想对此进行全文或普通搜索。我觉得奇怪的是,如果你是从一个工作是解析简历的服务机构那里得到的,那么这种格式就不是标准的。一次恢复和下一次恢复之间的区别仅仅是节点数吗?如果是这样,XML索引可能是一个很好的解决方案。