Algorithm 撇号转换为正确的文本?

Algorithm 撇号转换为正确的文本?,algorithm,text,nlp,text-parsing,Algorithm,Text,Nlp,Text Parsing,目标:我需要能够将撇号转换为格式正确的单词至少对于最常见的带撇号的单词。理想情况下,我需要一个单词列表及其隐含的上下文部分(即“不要”和“不要”) 问题:我正在创建一个基于自然语言处理的搜索算法,但当用户使用撇号创建内容(或搜索)时,它会给我们带来问题。主要是因为如果我们简单地删除撇号,我们将有(不->不)(不->不),这正式不是一个英语单词,并且不能被NLP系统翻译 理想的解决方案只是将这些项转换成什么的一对一映射,但我不知道有这样的列表 如果你知道的话,请告诉我,我在哪里可以找到它 thx这

目标:我需要能够将撇号转换为格式正确的单词至少对于最常见的带撇号的单词。理想情况下,我需要一个单词列表及其隐含的上下文部分(即“不要”和“不要”)

问题:我正在创建一个基于自然语言处理的搜索算法,但当用户使用撇号创建内容(或搜索)时,它会给我们带来问题。主要是因为如果我们简单地删除撇号,我们将有(不->不)(不->不),这正式不是一个英语单词,并且不能被NLP系统翻译

理想的解决方案只是将这些项转换成什么的一对一映射,但我不知道有这样的列表

如果你知道的话,请告诉我,我在哪里可以找到它


thx

这些词被称为“收缩”,你可以在网上找到一个列表,例如,

这看起来是一个很好的列表:

这取决于你想让你的系统有多好。它会明白“去”是“去”和“必须”是。。。嗯,这是一个艰难的决定。它可能意味着“必须”、“必须”或“有一个”


哦,当我们试图教我们的计算机进行通信时,我们学到了一些东西。

最后一个括号没有出现在您的链接中。出于好奇,为什么不把缩写添加到NLP系统的字典中呢?