String 用于句子比较的数据结构

String 用于句子比较的数据结构,string,data-structures,String,Data Structures,我会尽量简洁,因为这需要一些解释。我遇到的情况是,我必须匹配字符串,并根据我们定义的模板字符串从这些字符串中提取值 例如,模板sting将是: 我想转到$websiteurl主页 另一根弦可能是 我想去谷歌的主页 通过测量Levenshtein距离和使用“创造性”正则表达式,我们已经初步成功地检查了这些字符串是否匹配,但我们正在努力使其更具容错性和准确性,并且复杂代码的数量比我们希望的要多 有些情况下,我们需要检查复合词,或者我们需要忽略额外的形容词/描述性词语等 形容词/描述性词语示例: 我想

我会尽量简洁,因为这需要一些解释。我遇到的情况是,我必须匹配字符串,并根据我们定义的模板字符串从这些字符串中提取值

例如,模板sting将是:

我想转到$websiteurl主页

另一根弦可能是

我想去谷歌的主页

通过测量Levenshtein距离和使用“创造性”正则表达式,我们已经初步成功地检查了这些字符串是否匹配,但我们正在努力使其更具容错性和准确性,并且复杂代码的数量比我们希望的要多

有些情况下,我们需要检查复合词,或者我们需要忽略额外的形容词/描述性词语等

形容词/描述性词语示例:

我想马上去google.com主页

复合词示例(主页分为两个词):

我想去google.com主页

你可以想象更复杂的现实世界中的句子应该与这个句子匹配,但是如果没有一些额外的案例或额外的句子检查,这些句子就不会匹配或起作用

显然,我们当前的设置并不理想,因为我们需要对每个需要检查的情况对该字符串进行多次传递,这不仅会减慢速度,而且会使维护和调试变得更加复杂

是否有一个数据结构,将是理想的持有和比较的句子在这个庄园?对额外的或甚至遗漏的单词具有相当的容错能力(显然是合理的)?我想象某种类型的树,但我不知道通常哪种类型的树或数据结构最适合这种情况


提前感谢所有人

简短的回答:如果有这样的事情,语音识别将是小菜一碟;-)?