Sql 如何仅在字母构成单词时删除字母(e&;Co.),而不是在字母构成单词的一部分时删除字母(Co-struction)
我必须通过删除Inc,Ltd,&Co,Co,Corp,,,,,,,,,,,,来清理一个包含公司名称的专栏,等等,该列表可以稍后更新 在Sql server 2016中,我使用了Replace,但它将在所有地方替换这些字母,而不仅仅是在它们构成特定单词时,例如:name CoSql 如何仅在字母构成单词时删除字母(e&;Co.),而不是在字母构成单词的一部分时删除字母(Co-struction),sql,sql-server,sql-server-2016,Sql,Sql Server,Sql Server 2016,我必须通过删除Inc,Ltd,&Co,Co,Corp,,,,,,,,,,,,来清理一个包含公司名称的专栏,等等,该列表可以稍后更新 在Sql server 2016中,我使用了Replace,但它将在所有地方替换这些字母,而不仅仅是在它们构成特定单词时,例如:name Co alter table [CompanyList] add CleanLegalName as cast (Rtrim( Replace (Replace (Replace (Replace (Replace (R
alter table [CompanyList] add CleanLegalName as
cast (Rtrim( Replace (Replace (Replace (Replace (Replace (Replace (Replace (Replace (REPLACE
([Legal Name], ' INC', ''), '.', ''), ' LTD', ''), ' Inc', ''), ' Ltd', ''), ' LIMITED', ''), ' INCOPORATED' ,'') , ',' , '') , ' CO', '')
) as varchar(200))
问题是,Replace会将这些字母到处替换,比如:“Jane Construction”替换为“Jane nstuction”,“Inca Food”替换为“a Food”。只有当这些字母单独组成一个单词,而不是作为另一个单词的一部分时,我如何才能删除它们?
谢谢假设我们有以下场景
CREATE TABLE #Temp([Legal Name] NVARCHAR(MAX))
INSERT INTO #Temp ([Legal Name]) VALUES ('Beer Acme Co.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Company of Brothers Co')
INSERT INTO #Temp ([Legal Name]) VALUES ('My Star Inc.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Incredible Monsters INC')
INSERT INTO #Temp ([Legal Name]) VALUES ('Limit Is The Sky Ltd')
INSERT INTO #Temp ([Legal Name]) VALUES ('Limit Is The Universe Ltd.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Unlimited Minds Limited.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Unlimited Borders Limited')
我可以提出两种方法来帮助你
选择1
通过标量值函数
CREATE FUNCTION [dbo].[GetClearedName](@VALUE NVARCHAR(MAX))
RETURNS NVARCHAR(MAX)
AS
BEGIN
DECLARE @PATTERN NVARCHAR(MAX)
DECLARE @TEMP TABLE ([PATTERN] NVARCHAR(MAX))
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Co.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Co%')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Inc.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Inc')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Ltd')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Ltd.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Limited.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Limited')
DECLARE @RESULT NVARCHAR(MAX)
SET @RESULT = @VALUE
DECLARE PATTERN_CURSOR CURSOR FOR SELECT [PATTERN] FROM @TEMP
OPEN PATTERN_CURSOR
FETCH NEXT FROM PATTERN_CURSOR INTO @PATTERN
WHILE (@@FETCH_STATUS = 0)
BEGIN
IF (PATINDEX(@PATTERN, @RESULT) > 0)
BEGIN
SET @RESULT = SUBSTRING(@RESULT, 0, PATINDEX(@PATTERN, @RESULT))
END
FETCH NEXT FROM PATTERN_CURSOR INTO @PATTERN
END
CLOSE PATTERN_CURSOR
DEALLOCATE PATTERN_CURSOR
IF (LEN(@RESULT) <> 0)
RETURN @RESULT
Return @VALUE
END
选择2
使用,也可以将其转换为函数
SELECT [Legal Name],
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k([Legal Name], N'(CO+\.|\sCO$)', N' ', -1, 1, 'IgnoreCase'),
N'(INC+\.|\sINC$)', N' ', -1, 1, 'IgnoreCase'),
N'(LTD+\.|\sLTD$)', N' ', -1, 1, 'IgnoreCase'),
N'(Limited+\.|\sLimited$)', N' ', -1, 1, 'IgnoreCase')
As [Cleared Name]
FROM
#Temp
DROP TABLE #Temp
预期结果
假设我们有以下场景
CREATE TABLE #Temp([Legal Name] NVARCHAR(MAX))
INSERT INTO #Temp ([Legal Name]) VALUES ('Beer Acme Co.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Company of Brothers Co')
INSERT INTO #Temp ([Legal Name]) VALUES ('My Star Inc.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Incredible Monsters INC')
INSERT INTO #Temp ([Legal Name]) VALUES ('Limit Is The Sky Ltd')
INSERT INTO #Temp ([Legal Name]) VALUES ('Limit Is The Universe Ltd.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Unlimited Minds Limited.')
INSERT INTO #Temp ([Legal Name]) VALUES ('Unlimited Borders Limited')
我可以提出两种方法来帮助你
选择1
通过标量值函数
CREATE FUNCTION [dbo].[GetClearedName](@VALUE NVARCHAR(MAX))
RETURNS NVARCHAR(MAX)
AS
BEGIN
DECLARE @PATTERN NVARCHAR(MAX)
DECLARE @TEMP TABLE ([PATTERN] NVARCHAR(MAX))
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Co.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Co%')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Inc.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Inc')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Ltd')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Ltd.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('%Limited.')
INSERT INTO @TEMP ([PATTERN]) VALUES ('% Limited')
DECLARE @RESULT NVARCHAR(MAX)
SET @RESULT = @VALUE
DECLARE PATTERN_CURSOR CURSOR FOR SELECT [PATTERN] FROM @TEMP
OPEN PATTERN_CURSOR
FETCH NEXT FROM PATTERN_CURSOR INTO @PATTERN
WHILE (@@FETCH_STATUS = 0)
BEGIN
IF (PATINDEX(@PATTERN, @RESULT) > 0)
BEGIN
SET @RESULT = SUBSTRING(@RESULT, 0, PATINDEX(@PATTERN, @RESULT))
END
FETCH NEXT FROM PATTERN_CURSOR INTO @PATTERN
END
CLOSE PATTERN_CURSOR
DEALLOCATE PATTERN_CURSOR
IF (LEN(@RESULT) <> 0)
RETURN @RESULT
Return @VALUE
END
选择2
使用,也可以将其转换为函数
SELECT [Legal Name],
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k(
SQL#.RegEx_Replace4k([Legal Name], N'(CO+\.|\sCO$)', N' ', -1, 1, 'IgnoreCase'),
N'(INC+\.|\sINC$)', N' ', -1, 1, 'IgnoreCase'),
N'(LTD+\.|\sLTD$)', N' ', -1, 1, 'IgnoreCase'),
N'(Limited+\.|\sLimited$)', N' ', -1, 1, 'IgnoreCase')
As [Cleared Name]
FROM
#Temp
DROP TABLE #Temp
预期结果
您需要找到一种方法,使这些部分词具有唯一性。例如,它们总是以句号结尾吗?查看正则表达式(regex):很难找到模式。可以是Co,也可以是Co,也可以是Co。数据不干净。您需要找到一种方法,使这些部分词是唯一的。例如,它们总是以句号结尾吗?查看正则表达式(regex):很难找到模式。可以是Co,也可以是Co,也可以是Co。数据不干净谢谢你@flaviofricasco。正是我需要的。非常感谢!谢谢你,弗朗西斯科。正是我需要的。非常感谢!