在excel中的单元格中检测分隔值内的重复
我有一些表格数据如下在excel中的单元格中检测分隔值内的重复,excel,vba,excel-formula,Excel,Vba,Excel Formula,我有一些表格数据如下 | | A | B | C | D | |---|----------|--------------|------------------|---------------------------------------------------| | | | p1 | p
| | A | B | C | D |
|---|----------|--------------|------------------|---------------------------------------------------|
| | | p1 | p2 | pn |
| 1 | Lanterns | Bruce Wayne | Jean-Paul Valley | Dick Grayson; Terry McGinnis; Jean-Paul Valley |
| 2 | Bats | Alan Scott | Hal Jordan | Guy Gardner; John Stewart; Kyle Rayner; Simon Baz |
| 3 | Fates | Kent Nelson | Khalid Nassour | Hector Hall; Khalid Nassour; Khalid Ben-Hassin |
| 4 | Supes | Clark Kent | John Henry Irons | Conner Kent; Hank Henshaw; Kong Kenan |
| 5 | Spideys | Peter Parker | Peter Parker | Ben Reilly; Miles Morales |
| 6 | Irons | Tony Stark | Happy Hogan | James Rhodes; Eddie March; James Rhodes |
| X | A | B | C | D | E |
|---|----------|--------------|------------------|---------------------------------------------------|-------|
| | | p1 | p2 | pn | |
| 1 | Lanterns | Bruce Wayne | Jean-Paul Valley | Dick Grayson; Terry McGinnis; Jean-Paul Valley | TRUE |
| 2 | Bats | Alan Scott | Hal Jordan | Guy Gardner; John Stewart; Kyle Rayner; Simon Baz | FALSE |
| 3 | Fates | Kent Nelson | Khalid Nassour | Hector Hall; Khalid Nassour; Khalid Ben-Hassin | TRUE |
| 4 | Supes | Clark Kent | John Henry Irons | Conner Kent; Hank Henshaw; Kong Kenan | FALSE |
| 5 | Spideys | Peter Parker | Peter Parker | Ben Reilly; Miles Morales | TRUE |
| 6 | Irons | Tony Stark | Happy Hogan | James Rhodes; Eddie March; James Rhodes | TRUE |
对于每一行,我想找出B列、C列以及D列的分号分隔值之间是否存在重复
如何在excel中执行此操作
所需输出如下
| | A | B | C | D |
|---|----------|--------------|------------------|---------------------------------------------------|
| | | p1 | p2 | pn |
| 1 | Lanterns | Bruce Wayne | Jean-Paul Valley | Dick Grayson; Terry McGinnis; Jean-Paul Valley |
| 2 | Bats | Alan Scott | Hal Jordan | Guy Gardner; John Stewart; Kyle Rayner; Simon Baz |
| 3 | Fates | Kent Nelson | Khalid Nassour | Hector Hall; Khalid Nassour; Khalid Ben-Hassin |
| 4 | Supes | Clark Kent | John Henry Irons | Conner Kent; Hank Henshaw; Kong Kenan |
| 5 | Spideys | Peter Parker | Peter Parker | Ben Reilly; Miles Morales |
| 6 | Irons | Tony Stark | Happy Hogan | James Rhodes; Eddie March; James Rhodes |
| X | A | B | C | D | E |
|---|----------|--------------|------------------|---------------------------------------------------|-------|
| | | p1 | p2 | pn | |
| 1 | Lanterns | Bruce Wayne | Jean-Paul Valley | Dick Grayson; Terry McGinnis; Jean-Paul Valley | TRUE |
| 2 | Bats | Alan Scott | Hal Jordan | Guy Gardner; John Stewart; Kyle Rayner; Simon Baz | FALSE |
| 3 | Fates | Kent Nelson | Khalid Nassour | Hector Hall; Khalid Nassour; Khalid Ben-Hassin | TRUE |
| 4 | Supes | Clark Kent | John Henry Irons | Conner Kent; Hank Henshaw; Kong Kenan | FALSE |
| 5 | Spideys | Peter Parker | Peter Parker | Ben Reilly; Miles Morales | TRUE |
| 6 | Irons | Tony Stark | Happy Hogan | James Rhodes; Eddie March; James Rhodes | TRUE |
编辑
问题中的列名有错误,导致不清楚。现在修好了
更新
下面是我对VBA的尝试,正如@Foxfire和Burns以及Burns
所建议的那样。
它改编自
以下是@Foxfire和Burns以及Burns
建议的所有可能的用例
+---+-----+----+-----------+--------------------+-------+
| | A | B | C | D | E |
+---+-----+----+-----------+--------------------+-------+
| 1 | A | B | | A; B; | False |
| 2 | A | | | A; ; | True |
| 3 | | | | ; ; | True |
| 4 | G | K | G | G; K; G | True |
| 5 | N | M | O | N; M; O | False |
| 6 | N | N | O | N; N; O | True |
| 7 | V | U | X; Y; X | V; U; X; Y; X | True |
| 8 | P J | VK | P; J; V K | P J; VK; P; J; V K | False |
| 9 | VK | O | R; VK | VK; O; R; VK | True |
+---+-----+----+-----------+--------------------+-------+
D列的公式是=串联(B2,“;”,C2,“;”,D2)
,E列的公式是=具有重复项(E2,“;”)
但在这里,它不是在处理空单元格。第2行和第3行也应为
False
在单元格E1中尝试此公式并将其复制下来:
=IF(ISNUMBER(SEARCH(C1;D1));TRUE;FALSE)
您可能需要更改分号
到常规逗号,
,具体取决于您的Excel版本
编辑:更简单、更优雅的版本是
=ISNUMBER(SEARCH(C1;D1))
你能试试这个配方吗
=IFERROR(IF(SEARCH(C1,D1,1)>0,"TRUE"), "FALSE")
如果你的值有额外的空间,也许可以添加一个修剪函数来清理它 我明白了: E列得到了这个公式:
=IFERROR(SEARCH(TRIM(C1);D1);0)>0
在屏幕截图中,输出将是一个布尔值TRUE/FALSE
,它是西班牙语,但VERDADERO表示TRUE
,FALSO表示FALSE
在第5行和第6行中,输出为
FALSE
,因为在D列中找不到值Peter Parker
和Happy Hogan
。您在希望的输出中发布了这两行应返回TRUE
,但您没有解释原因。可以通过公式找到,但有一些注意事项:
- 因为名字可以是
和Tony Stark
或Anthony Stark
和Paul Valley
你不能使用Jean-Paul Valley
SEARCH
- 您必须连接这三列并将其转换为一个数组
- 检查数组中是否有重复项(遗憾的是没有
),使用COUNTIF
- 对照数组中的项目总数检查结果
=SUMPRODUCT(--(FILTERXML("<t><s>"&SUBSTITUTE(SUBSTITUTE(B2&"; "&C2&"; "&D2,"",""),"; ","</s><s>")&"</s></t>","//s")=TRANSPOSE(FILTERXML("<t><s>"&SUBSTITUTE(SUBSTITUTE(B2&"; "&C2&"; "&D2,"",""),"; ","</s><s>")&"</s></t>","//s"))))<>LEN(B2&"; "&C2&"; "&D2)-LEN(SUBSTITUTE(B2&"; "&C2&"; "&D2,";",""))+1
=SUMPRODUCT(--(FILTERXML(“&SUBSTITUTE(替换(B2&“;”&C2&“;”&D2)”,”),“;”,“;”,”)&“/s”)=转置(FILTERXML(“&SUBSTITUTE(替换(B2&“;”&C2&“;”&D2)”,“;”,”,“,”)&“///s”))LEN
FILTERXML
将我们的值很好地放入一个数组中,然后我们就可以使用它了
注意:这是一个数组公式,需要通过CtrlShift Center确认
如果您的O365或Excel 2016具有
TEXTJOIN
功能:
=NOT(ISERROR(FILTERXML("<t><s>" &TEXTJOIN("</s><s>",TRUE,TRIM(B2),TRIM(C2),SUBSTITUTE(TRIM(D2),"; ","</s><s>"))& "</s></t>","//s[.=./following-sibling::*]")))
我们构造一个包含单独节点中所有名称的XML,然后查找重复的名称
如果没有NOT(iError(…
部分),公式将返回重复项的名称(如果有多组重复项,则返回名称数组)
注意:公式取决于D列中的分隔符是;
(分号空格
)。如果空格不总是存在,则需要修改公式以删除它(如果存在)(嵌套替换,或修剪即可)
例如
=NOT(ISERROR(FILTERXML("<t><s>"&TRIM(B11)&"</s><s>"&TRIM(C11)&"</s><s>"&SUBSTITUTE(SUBSTITUTE(TRIM(D11),"; ",";"),";","</s><s>")&"</s></t>","//s[.=./following-sibling::*]")))
这不起作用。第5行显示为FALSE。你能提供一个你看到的屏幕截图吗,包括数据和你输入的公式?我在你的样本数据上尝试了这个公式,效果很好。@它在第5行显示为FALSE,因为根据你发布的输入,c中不存在value
Peter Parker
D列。与第6行相同。Happy Hogan
不在D列。我认为这个答案是正确的。我只想添加“TRUE”,“FALSE”
将以文本形式返回这些值,而不是布尔值。但实际上它可以工作。=IFERROR(IF(SEARCH(B2,C2,1)>0,TRUE),FALSE),如果希望为布尔值,请删除双引号。在第5行中,B列和C列中都有Peter Parker
。对于第5行,James Rhodes
在D列中重复。因此,您需要检查C列中B列的值是否重复,还需要检查D列中用分号分隔的值是否在同一C列中重复ell?B或C与D之间没有关系?是的,并且如果B和C中的值也存在于D中。要检查D列中用分号分隔的值是否在同一单元格中重复,恐怕您需要VBA。另外,请使用新信息编辑您的问题以使其清楚,并且您应该发布所有可能的情况和结果每种情况下都应如此。@FoxfireAndBurnsAndBurns我已尝试使用vba更新了查询。@裁剪我的最终公式,该公式根据分隔符进行调整,但不总是;
(因为在您的一些实例中,终端;
,将处理您的最后一组数据。Ron,您相信吗,我刚才使用了您的post作为参考点,以利用XML
函数。++@JvdV:-)请注意,xPath语言可以包含一个重复测试,这简化了这种情况下的测试。如果可能的话,我会加上你10次。非常好!如果不需要TRIM
的话,可以提供一些小建议:=NOT(iError(FILTERXML(“&SUBSTITUTE(SUBSTITUTE(B2&“;”&C2&“;&D2)”,“),“;”,“;”,“,”,“,”,“,”,“,”,“,”,“,”,“,”,“,”,“//s[。=/以下兄弟姐妹::*”)
。不管怎样,都是很棒的东西。@JvdV在我从问题中复制/粘贴的过程中,TRIM
是必需的。有真实数据,谁知道呢?但这没有什么坏处。Epic one!。从没听说过FILTERXML,因为我没有这个功能。我的Excel太旧了!@FoxfireAndBurnsAndBurns,请查看RonRosenfeld的帖子。它是一个非FILTERXML的替代程序将字符串分隔为项目数组。
Option Explicit
Function hasDups(rg As Range, Optional sDelim As String = ";") As Boolean
Dim myDict As Object
Dim x, y, s As String, i As Long, c As Range
Set myDict = CreateObject("scripting.dictionary")
For Each c In rg
x = Split(c.Value2, sDelim)
For Each y In x
If Len(Trim(y)) > 0 Then
If Not myDict.exists(Trim(y)) Then
myDict.Add Trim(y), y
Else
hasDups = True
Exit Function
End If
End If
Next y
Next c
End Function