在Excel中比较两个意思相同的不同句子

在Excel中比较两个意思相同的不同句子,excel,data-analysis,Excel,Data Analysis,我有两个牢房 Cell 1 contains this value --> Portfolio Rule Failure (Justification Required): Style Sector Structure: 0.93% for MUNI - SENIOR LIVING breaks the 0.00% maximum failure limit. Style Min Security Rating: NR breaks the BBB- minimum failu

我有两个牢房

Cell 1 contains this value --> Portfolio Rule Failure (Justification Required):  Style Sector Structure:     0.93% for MUNI - SENIOR LIVING breaks the 0.00% maximum failure limit.  Style Min Security Rating: NR breaks the BBB- minimum failure limit. 

Cell 2 contains this value --> Hard Rule Failure   (Requires Portfolio Rule Justification to override):  Sector Max Weight % - Style failed: MUNI - SENIOR LIVING: 0.93%   Min None   Max 0%  Min Security Rating - Style failed: Worse Than BBB-: 0.93%   Min None   Max 0%  
如果你阅读,两者的意思是一样的。如果我试着在excel中比较这两个,它会说这两个都是不同的。但实际上它们的意思是一样的,尽管所用的词是不同的。在excel或一些数据分析工具中,有没有一种方法可以说两者是相同的

一种方法是用另一列替换其中一列中的相似模式词,但我有1000条这样的记录,因此手动更新这些记录几乎是不可能的


请给我一些建议

您可以尝试以下方法:如果您可以将所有可能的消息或消息模式的完整清单放入专用工作表中,并在其中识别重复项,然后提供一个标准定义,然后使用vlookup获取该标准

基本上,您可以构建一个字典,用于解释消息一次,然后根据需要引用它

您可能需要将原始消息解析为逻辑片段,如 消息类型,如硬故障、警告等

触发信息的属性,例如市政-老年生活


原因,例如超过失败限制

您可以将句子拆分为单词,删除空格、标点符号和大写字母;然后你可以通过单词内容来比较它们的相似程度。但这还不足以处理自然语言。比较:“这汤好”、“这汤很好”和“这汤不好”。根据编辑距离或构词法,您无法区分哪些是相同的。对于大量的文本,您可以尝试各种方法,但用VBA编写代码将是一场噩梦。@arvi1000-非常感谢您的精彩解释